Cómo funciona el PDF: páginas, fuentes y seguridad
La estructura interna del PDF, cómo se incrustan fuentes, por qué los PDF se ven igual en todas partes y cómo la contraseña protege documentos.
Todos hemos pasado por eso: recibes un PDF, ves una errata minúscula y piensas: "lo arreglo rapido". Pero en cuanto intentas hacer clic sobre el texto, todo se rompe. Las fuentes cambian, el layout salta o descubres que ni siquiera puedes hacer clic en nada. ?Por que un formato tan universal es tambien tan obstinadamente dificil?
La principal razon por la que los PDF son dificiles de editar es que no fueron diseñados para ser "documentos" del modo en que lo son Word o Google Docs. Un documento de Word es como un cubo de texto liquido que fluye y se rellena a medida que escribes. Un PDF se parece mas a una fotografia digital de una hoja ya impresa.
Cuando guardas un archivo como PDF, basicamente lo estas "congelando". El objetivo de un PDF (Portable Document Format) es verse exactamente igual en cualquier pantalla, impresora y dispositivo del mundo. Para lograr esa consistencia perfecta, renuncia a la flexibilidad de una edicion facil.
En un documento normal, tu ordenador sabe que un grupo de letras forma una palabra, y que las palabras forman un parrafo. Si borras una palabra, el resto del parrafo "refluye" para llenar el hueco.
Los PDF no tienen parrafos. En realidad, ni siquiera tienen palabras. En su lugar, un PDF es una lista de instrucciones que le dice al ordenador exactamente donde colocar cada caracter individual usando coordenadas X e Y.
Si borras la "H" en un editor PDF, la "e" no se mueve para ocupar su lugar. Se queda exactamente en la coordenada asignada. Por eso editar un PDF suele sentirse como intentar mover muebles en una habitacion donde todo esta atornillado al suelo.
?Has abierto alguna vez un PDF y has visto simbolos raros o cuadros donde deberian ir letras? Eso suele pasar por las fuentes.
Para asegurarse de que un documento se vea igual en tu telefono que en una valla publicitaria, los PDF "incrustan" las fuentes que usan. Llevan una pequeña copia de la fuente dentro del archivo. Sin embargo, cuando intentas editar ese texto, tu editor PDF necesita tener instalada en tu ordenador exactamente esa misma fuente para dejarte escribir letras nuevas.
Si no tienes la fuente, el editor intentara sustituirla por una "parecida", lo que a menudo estropea el layout o hace que el texto se vea ligeramente raro.
"Editar un PDF es como intentar pintar una habitacion nueva sobre una casa terminada usando solo la pintura sobrante de la obra original."
No todos los PDF se crean igual. Hay dos tipos principales:
Para editar un PDF escaneado, primero debes pasarlo por software OCR (Optical Character Recognition), que "adivina" cuales son las letras. Si el escaneo esta borroso, el ordenador puede equivocarse, y por eso copiar texto desde un escaneo a veces produce galimatias.
Cuando usas un editor PDF para cambiar una palabra, normalmente no esta modificando de verdad el archivo original. En su lugar, usa la tecnica de "overlay".
Imagina coger una hoja de papel fisica, poner una tira de corrector blanco sobre una palabra y despues escribir otra encima. Eso es exactamente lo que hacen la mayoria de editores PDF. El texto original a menudo sigue ahi, oculto debajo de una caja blanca.
Si alguna vez has intentado editar un articulo academico o un libro de matematicas, ya sabes que es casi imposible. Los simbolos matematicos (como √, ∑ o π) no son letras estandar. A menudo usan fuentes especiales como Computer Modern o STIX.
Estas fuentes codifican los simbolos de una manera que los editores estandar no entienden. Cuando intentas guardar una edicion, los simbolos matematicos a menudo se convierten en cuadrados vacios (□), un fenomeno que los desarrolladores llaman "tofu". Como el editor no sabe "dibujar" ese simbolo en la nueva version del archivo, simplemente se rinde.
Los PDF son una obra maestra de la consistencia, pero una pesadilla para la flexibilidad. Fueron construidos para ser el destino final de un documento, no una parada intermedia. Si necesitas hacer cambios importantes, casi siempre lo mejor es encontrar el archivo original de Word o Google Docs en lugar de pelearte con las instrucciones congeladas de un PDF.
La estructura interna del PDF, cómo se incrustan fuentes, por qué los PDF se ven igual en todas partes y cómo la contraseña protege documentos.
Cómo PDF incrusta imágenes con filtros DCT y Flate, su sistema de coordenadas por puntos y por qué sigue siendo el estándar de oro para documentos.
Por qué las pantallas mezclan luz roja, verde y azul, qué codifica realmente la notación HEX y cuándo HSL te facilita la vida.