21 votos

¿Qué hace que el tamaño del archivo PDF aumente al guardarlo en la vista previa?

Parece que hacer ediciones, anotaciones, o incluso simplemente abrir y guardar un archivo PDF en la vista previa causará un aumento significativo en el tamaño del archivo. He notado que en algunos libros que he escaneado esto también sucede para mejorar el tiempo de renderización de la página.

¿Puede alguien arrojar algo de luz sobre lo que está pasando para causar estos cambios? Estoy interesado en sincronizar las anotaciones de los libros electrónicos en PDF entre la vista previa y el iPad (tal vez GoodReader), pero esto puede ser demasiado poco práctico con archivos PDF grandes.

13voto

Lucia Puntos 922

En su poco conocida novela, PDF Karenina Leo Tolstoi escribió,

Los archivos PDF codificados óptimamente son todos iguales; cada archivo PDF codificado de forma no óptima está codificado de forma no óptima a su manera.

Es difícil para cualquiera responder por qué tu Los archivos PDF son más grandes después de que Vista Previa los modifique. Un archivo PDF consiste en muchos tipos diferentes de datos: imágenes, flujos de contenido, fuentes, sobrecargas de documentos, espacios de color, estados de gráficos extendidos y una tabla de referencia cruzada. Al igual que una frase puede ser concisa y otra verbosa, pero ambas son válidas en inglés y dicen lo mismo, también un archivo PDF puede tener una forma más verbosa de representar el mismo contenido que un archivo PDF más conciso. Tendríamos que mirar sus archivos PDF exactos. Es probable que hayan sido creados por una variedad de diferentes piezas de software, algunas consistían, otras no tanto.

También importa la versión de Mac OS X y la Vista previa que estés usando, porque eso determina el software que escribe el nuevo archivo PDF cuando haces un Guardar como en la Vista previa.

Sin embargo, puedo decirte lo que se hace más grande en algunos mi Archivos PDF. Esta historia se aplica a mi ordenador, que ejecuta Mac OS X 10.5.8 y Apple Preview 4.2 (469.5).

Una fila, Giulio.pdf es un documento de 22 páginas con texto como texto, no imágenes escaneadas. Tiene un tamaño de 461.092 bytes. Lo abrí en la vista previa, hice Archivo... Guardar como... y lo guardé con un nuevo nombre de archivo. El nuevo archivo es de 724.421 bytes, o un 57% más grande.

Abrí cada archivo con Adobe Acrobat Professional, versión 8.3.1 para Mac OS. Lo hice. Avanzado... Optimizador de PDF... Auditoría del uso del espacio... . Un pequeño cuadro de diálogo ofrecía un desglose de cuántos bytes se debían a cada categoría de uso, además del porcentaje del tamaño total del archivo para la categoría.

El original Giulio.pdf tiene 390.754 bytes (84,75%) dedicados a flujos de contenido, y cero bytes dedicados a imágenes. Está en el formato PDF 1.4. El archivo guardado por Preview tiene 675.846 bytes (93,29%) dedicados a flujos de contenido, también cero bytes de imágenes, y está en el formato PDF 1.3. Preview hizo que los flujos de contenido fueran 285.092 bytes más grandes, y eso representa el 73% de la diferencia de tamaño del archivo entre los dos.

Me preguntaba si el formato de archivo PDF 1.3 era intrínsecamente menos eficiente para almacenar este tipo de archivos. Abrí el original Giulio.pdf en Adobe Acrobat Professional 8, e hizo Avanzado... Optimizador de PDF... Hacer compatible con: Acrobat 3.0 y posteriores y presionó OK. Guardé el archivo resultante con un nuevo nombre. El archivo resultante está en el formato PDF 1.3, y era de 452.356 bytes, o más pequeño que el original. Sus flujos de contenido son 375.171 bytes (82,94%), una proporción similar, pero menor que los flujos de contenido del archivo original.

Por lo tanto, parece que podemos concluir que la aplicación Preview en Mac OS X 10.5.8 no es tan eficiente como algunos otros creadores de PDF en la creación de flujos de contenido concisos en archivos PDF, y la diferencia es suficiente para explicar tres cuartas partes de la diferencia de tamaño en un archivo PDF sin imágenes.

Hice un experimento similar en form k.pdf ...un documento de una página escaneado en papel. El archivo original es de 303.730 bytes, de los cuales 298.197 bytes (98,18%) son imágenes. Una copia de este archivo creado por Vista Previa usando Guardar como... es de 300.601 bytes, o un 1% más pequeño. Esta diferencia en el tamaño del archivo se debe a una menor categoría de bytes de "sobrecarga del documento" en el archivo creado por la Vista Previa.

Por lo tanto, parece que también podemos concluir que la vista previa no siempre hace que un archivo PDF aumente de tamaño. Depende de la naturaleza del archivo PDF original, y de lo conciso que fuera al principio.

4voto

Scott Puntos 11

Sé que es bastante tarde, pero he encontrado algo que parece funcionar, al menos si se usa inicialmente: He intentado usar el filtro de cuarzo para "reducir el tamaño del archivo". Parece funcionar pero no está activado por defecto. Puedo elegirlo específicamente a través del menú Guardar como (mantener la opción), pero me preocupa que por defecto sea el método habitual en los autoguardos.

Esto es lo que está pasando para mí y cómo llegué a esta página en primer lugar: El PDF comienza como un libro de 91MB 900 páginas. Añado una sola anotación y la guardo y el archivo salta a 2,29 GB. Por si fuera poco, tarda una eternidad en guardarse, sobre todo porque lo estoy guardando en una unidad externa. ¡Gracias a Dios que la unidad es USB 3!

¿Hay alguna manera de extraer estas anotaciones? Puedo anotar y destacar en Goodreader y PDF Expert en mi iPad. Si Vista Previa no me permite hacer esto en mi ordenador, ¿hay alguna otra aplicación que lo haga? ¿Por qué no puede simplemente guardar las anotaciones/resaltados pero no tratar de recomprimir todas las imágenes como si estuviera guardando un JPEG cada vez. Gracias por la ayuda!

1voto

Peter Uetz Puntos 1

El problema sigue siendo grave. En la vista previa 7.0 (Mac Os 10.9.5.) generé un pdf usando Acrobat 9.5.5. que resultó en un archivo de 5 MB. En Preview añadí exactamente 12 caracteres (usando las herramientas de edición). Después de guardar este archivo, se quedó en 14 MB.

Puedes arreglarlo abriendo y guardando de nuevo en Acrobat (puede que tengas que usar la opción "reducir el tamaño del archivo").

0voto

Pimenta Puntos 1

No puedo añadir pistas a la solución. Puedo añadir un escenario similar (OS X 10.11.3): un pdf escaneado con un peso de ~800kb se abre en vista previa, un par de páginas escaneadas vacías se eliminan, el pdf resultante, dos páginas más corto, es de ~2,2Mb. "Opción-Guardar como" y seleccionando el filtro de cuarzo "reducir el tamaño del archivo" comprime el archivo hasta... 1,9Mb.

El archivo original ha sido generado por una copiadora Xerox WC 7830, que en mi experiencia (comparada con las anteriores impresoras/copiadoras multifunción que teníamos) produce pdf's escaneados bastante bien optimizados.

No puedo ver ninguna diferencia en el archivo, visualmente; yo adivina las imágenes de la página se recomprimen en 24bpp, mientras que el archivo original es claro usando mucho menos profundidad de color, probablemente de 6 bits (es un documento impreso y firmado, sólo texto, el escáner hace un buen trabajo manteniendo el fondo blanco puro). Lamentablemente, Preview no es lo suficientemente inteligente para detectar y mantener esto, y parece que necesita recomprimir todo el archivo aunque no se hacen cambios en las páginas restantes (de nuevo, sólo se han eliminado un par de páginas.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X