2 votos

Evitar dos caracteres diéresis en archivos PDF

Explicación introductoria

Una diéresis es un alemán vocal, representado en la escritura como una carta con dos puntos (con diéresis) sobre el básico de la vocal. Ejemplos de diéresis son ä, ö y ü.

Estas tres letras pueden ser representados en el texto como un único personaje – por ejemplo, ü como Unicode U+00 FC – o como dos caracteres: el básico de las vocales (por ejemplo, u, u+0075) y la combina con diéresis (U+0308).

Tanto el carácter único de diéresis y los dos caracteres diéresis el mismo aspecto en un documento PDF, pero su código subyacente es diferente. Esta animación muestra el texto copiado de la misma (!) Archivo PDF abierto en Firefox (arriba) y vista previa (parte inferior) en un editor de texto plano (BBEdit) y, a continuación, eliminar cada una de las letras:

enter image description here

Cuando la diéresis es representado como un personaje, y la búsqueda de una palabra alemana con una diéresis, por ejemplo, Tür "puerta", en un texto, usted encontrará que la palabra si es que hay. Por otro lado, si la diéresis es representado como dos personajes y la búsqueda de Tür, usted no va a encontrar:

Die Tür ist offen.  <= you will find "Tür" in this text
Die Tu¨r ist offen. <= you will not find "Tür" in this text

Pregunta

En Apple vista previa y Safari, pero también en la versión más reciente de Adobe Acrobat Reader DC (18.011.20058), diéresis en los documentos PDF son representados como dos caracteres (vocal más diéresis), mientras que en el mismo documento PDF, cuando abro Firefox, Chrome o una versión anterior de Adobe Acrobat X Pro (10.1.16), que son representados como un único carácter.

¿Por qué es así y cómo se puede evitar de dos caracteres diéresis cuando puedo crear documentos PDF?

3voto

PATRY Puntos 3068

Si usted termina con 1 o 2 caracteres depende de cómo de Normalización de Unicode es aplicado por las aplicaciones y procesos que se están utilizando.

No sé si hay alguna forma de garantizar que uno o el otro, excepto tal vez a través de una utilidad como UnicodeChecker.

Ya que las dos formas son equivalentes, una competentes sistema de búsqueda debe encontrar cualquiera de ellos.

-1voto

Phill Puntos 126

No pude reproducir el problema con un documento PDF, pero fue capaz de reproducir con una de las Páginas del documento, para mi sorpresa:

  1. Abrir las Páginas y crear un documento en blanco
  2. Tipo "Tür" de la siguiente manera:
    1. Tipo "T"
    2. Seleccione Edición>Emoji Y Símbolos de la búsqueda para "00 FC" y haga doble clic en "ü": enter image description here
    3. Tipo "r"
  3. Ahora escriba "Tür" de la siguiente manera:
    1. Tipo "Tu"
    2. Seleccione Edición>Emoji Y Símbolos de la búsqueda para "0308" y haga doble clic en "": enter image description here
    3. Tipo "r"
  4. Ahora la búsqueda para "ü" (escrito como en el paso 2.2.). Páginas sólo coincide con la primera palabra: enter image description here
  5. Eliminar el texto de búsqueda y escriba "ü" como en el paso 3.2., Las páginas de los partidos sólo la segunda palabra: enter image description here

En cuanto a la manera de aliviar este problema (no creo que se puede ser "resuelto"), creo que no hay mucho que usted puede hacer:

  1. El uso de Firefox o Chrome en lugar de la vista previa tanto como usted puede.
  2. Re-crear el documento PDF con vista previa mediante Impresión>Guardar como PDF (después de varias pruebas me he dado cuenta de que los documentos creados manera que siempre use una sola de caracteres Unicode (U+00 FC), al menos en macOS 10.13.6).
  3. Agregar las dos versiones de "ä", "ö" y "ü" para la Edición>Emoji Y Símbolos favoritos y buscar tanto.

Otros han sufrido problemas similares, por ejemplo:

Espeluznante Representación de alemán Diéresis como Ä,Ü,Ö

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X