He escaneado un libro de texto en PDF. El archivo tiene 725 páginas y pesa 1,73 GB. Es principalmente texto pero hay unas pocas imágenes por página. Ahora que el libro está escaneado, OCR (SearchScan exacto), y Marcado (todo hecho a través de Adobe Acrobat Pro XI), puedo leer el archivo digitalmente. Soy un gran fan de anotar (específicamente resaltar) mis lecturas en Preview.
Así que abro el archivo en Preview.app para comenzar mis estudios. Se desplaza un poco lento y se retrasa un poco, pero en general puedo trabajar con el archivo dado (para ser justos, el tamaño es grande). Sin embargo, guardar el archivo después de resaltar alguna cosa es una pesadilla.
Cuando resalto una palabra, y luego presiono CMD+S, Preview "guarda" el archivo en menos de un segundo. Sin embargo, si presiono CMD+S inmediatamente por segunda vez (que es la única forma de guardar realmente el archivo, creo, porque solo después del segundo Guardar desaparece el marcador de "Editado" en la parte superior del archivo), instantáneamente obtengo una rueda giratoria de la muerte. La rueda gira durante varios minutos (más de 15). Después de que se completa el Guardar y desaparece la etiqueta "Editado", "X" salgo del archivo con la X roja, y el proceso de la rueda de espera ocurre por segunda vez. Es casi como si Preview estuviera volviendo a guardar todo el documento, en lugar de solo la página que anoté.
He pasado muchas horas tratando de resolver esto. He codificado y re-codificado el PDF de muchas maneras diferentes. "Optimicé" el PDF en Adobe Acrobat Pro XI usando JBIP y luego con ZIP. "Exporté" el archivo fuera de Preview mismo, con el filtro de cuarzo. Reduje la calidad del PDF para que tuviera solo 750 MB de tamaño. Reparé permisos de disco. Ninguno de estos diversos métodos disminuyó significativamente el tiempo de espera de la rueda de la salvación del proceso de guardar de Preview.
Estoy seguro de que podría dividir el libro de texto en archivos más pequeños, pero esto es una molestia. También podría usar una aplicación diferente para anotar el PDF, pero siempre me ha gustado Preview hasta ahora y lo uso consistentemente para todas mis necesidades de toma de notas. De hecho, tengo un PDF de libro de texto de 300 páginas que tiene 150 MB y Preview maneja bien el archivo; solo tarda tal vez 10 segundos en guardar y el archivo no se retrasa.
Realmente no puedo disminuir la calidad (es decir, el tamaño) del PDF porque el texto sería difícil de leer.
Me doy cuenta de que es un PDF grande, pero no creo que le esté pidiendo demasiado a Preview para 2015. Agradecería mucho ayuda con este asunto ya que este problema de guardado me está retrasando.
Mi computadora: MacBook Pro (Retina, 15 pulgadas, principios de 2013), 16 GB DDR3 1600 MHz, 2,4 GHz Intel Core i7, NVIDIA GeForce GT 650M 1024 MB, Yosemite 10.10.3
Editado 30/05/15: Creo que algo está mal con Preview.app, no con mi archivo PDF. Tengo un PDF de libro de texto escaneado (530 páginas, 330 MB) que he consultado periódicamente durante el último año y solía ser mucho más rápido. Hoy en día, el libro tarda unos 30 segundos en guardar. No es mucho tiempo, pero más de lo que recuerdo...
0 votos
Podría valer la pena probar Acrobat Reader y ver qué tan rápido guarda; las herramientas de comentarios son comparables. El documento es bastante complejo, especialmente cuando tiene las imágenes escaneadas y el texto OCRd, y una guardar completo puede llevar su tiempo. También valdría la pena intentar hacer OCR de nuevo, pero esta vez utilizando la opción ClearScan, y/o la opción con muestreo a 300 dpi.
0 votos
@Max -- Probé tres métodos diferentes de OCR: SearchScan (Exact), SearchScan (Reducción de DPI a 600) y ClearScan (Reducción de DPI a 600). Los PDF con menor resolución hicieron que el texto se viera demasiado borroso para leer cómodamente.
1 votos
Por cierto, el archivo PDF de ClearScan (600 DPI) era de 1,8 GB.