Monografias.com > Computación
Descargar Imprimir Comentar Ver trabajos relacionados

HTML. Lenguajes de marcas




Enviado por jesus



Partes: 1, 2

  1. Introducción
  2. Orígenes de internet
  3. Evolución paralela de los lenguajes de
    marcas
  4. Nacimiento de GML. Su evolución hacia
    SGML
  5. Origen
    del Html
  6. Partes
    en las que se divide una aplicación
    SGML
  7. SGML y
    el sistema distribuido de la
    información
  8. Bibliografía

"Los ordenadores son buenos siguiendo
instrucciones, no leyendo tu mente"– Donald
Knuth

Monografias.com

Introducción

Monografias.com

Orígenes
de internet

La necesidad humana de comunicación
y obtención de información ha estado patente
durante toda la existencia del ser humano. Pero, la verdad, nunca
antes se ha logrado un nivel de comunicación tan
impresionante como está sucediendo hoy día con
internet.

Los orígenes de internet se remontan
a 1969, cuando se estableció la primera red de
computadores. Esta red de computadores arcaica fue conocida como
Arpanet, (Advanced Research Projects Agency Network). Fue el
resultado de un encargo del ministerio de defensa de los EEUU,
para comunicar los diferentes organismos del
país.

Posteriormente del uso privado de
Arpanet por parte del ejército, al uso privado
entre organismos públicos y universidades, para,
finalmente, expandirse de forma revolucionaria hasta llegar a la
super red que es hoy día internet.

La red ya funcionaba, se había
expandido, y mediante ella las personas se intercambiaban
archivos principalmente. Pero aún faltaba algo por
descubrirse que cambiaría la humanidad para siempre: La
World Wide Web:

Por World Wide Web entendemos aquel sistema
de distribución de la información basado en
hipertexto. Este hipertexto permitía al usuario pinchar y
acceder a contenidos relacionados con la página que estaba
visitando.

La World Wide Web fue creada por Tim
Berners Lee con la ayuda de Robert Cailliau. Y se publicó
en 1992.

Pero, en fin, debemos destacar que la World
Wide Web no es el único servicio en internet, sino que
existen otros muy importantes que debemos
reseñar:

SMTP (Correo Electrónico), FTP y P2P
(Transmisión de archivos); Chat (Irc), mensajería
instantánea, telefonía (Voip),, televisión
(Iptv),boletines electrónicos (NNTP), el acceso remoto a
otros dispositivos. (SSH y Telnet), o los juegos en línea.
Pero, repito, el detonante de internet fue la WWW.

Evolución
paralela de los lenguajes de marcas

Los manuscritos de la antigüedad se
marcaban en los márgenes, con el objetivo de dejar
constancia de cómo debía presentarse el texto de
los mismos, en futuros copiados por parte de los escribanos. El
ser humano, aún sin saberlo de forma consciente, ya estaba
utilizando una especie de lenguaje de marcado.

Más adelante en el tiempo,
más concretamente en los años 60, comenzaron a
usarse lo que hoy en día entendemos como lenguaje de
etiquetas. Como ya se venía haciendo en documentos de
papel, la idea de incluir también anotaciones dentro de
documentos electrónicos comenzó a tomar forma. El
objetivo de incluir estas anotaciones en los textos,
surgió de la necesidad de separar la presentación
del documento de su contenido.

Pero antes de proseguir es conveniente
añadir que esta idea también se vio impulsada una
importante carencia de los sistemas informáticos de la
época:

  • 1. El número de formatos
    existentes a la hora de archivar los documentos y las
    consiguientes dificultades que planteaba el intercambio de
    archivos (pérdida de formato…), condujeron a la
    necesidad de editar los textos en código ASCII
    (American Standar Code For Information Interchange). Este
    código de 7 bits, podía representar 128
    caracteres, muchos de ellos no imprimibles. Sin embargo, pese
    a su potencia, no satisfacía la necesidad de definir
    el formato de un texto. Entonces, para que nos entendamos, el
    código ASCII no podía poner una frase en
    negrita (por ejemplo), no definir los márgenes, ni
    siquiera el tipo o tamaño de letra.

Teniendo en cuenta la dicha carencia del
código ASCII (hoy día obsoleto y sustituido por el
Unicode) a la hora de representar la presentación de los
documentos, se acordó que las marcas de los nuevos
lenguajes que se quería diseñar, deberían
disponer de caracteres ASCII, pero reservados de forma especial
para ello. Adicionalmente se optó por establecer unas
normas sintácticas especiales. Así nació un
lenguajes artificial, especial y normalizado internacionalmente,
con el objetivo de servir como instrumento para la
formulación de este tipo de reglas.

Nacimiento de
GML. Su
evolución hacia SGML

Fue entonces cuando IBM llevó a la
práctica su idea de lenguaje de marcado: El lenguaje GML.
Sus siglas significaban Generalized Markup Language, y su
objetivo prioritario era permitir la compatibilidad entre los
documentos.

Más tarde, en 1978, el instituto
nacional americano (ANSI) comenzó a trabajar en las
especificaciones para los procesadores de textos. Todo ese
trabajo conjunto llevó a la evolución de Gml hacia
otro nuevo lenguaje: SGML.

SGML se encuentra bajo la norma Iso 8879.
Las siglas de SGML añaden una nueva letra a GML, La s de
estándar en inglés. Y este significado es muy
importante, porque, en efecto, gracias a la aparición del
lenguaje SGML, se estandarizó la sintaxis base de todo
lenguaje de etiquetas.

La conclusión a la que se
llegó es marcar con balizas el documento, de manera que
las estas balizas o etiquetas (llamadas también marcas o
anotaciones ) en realidad no son vistas por el usuario final
actuando por lo tanto de forma transparente.

En el código fuente (el que ve el
creador del documento web por ejemplo), las etiquetas o tags se
diferencian del propio texto porque aparecen entre corchetes
angulares, uno de inicio < y otro de fin de la etiqueta >
. Lógicamente usando caracteres ASCII, que pasan a ser
reservados para la sintaxis en SGML.

Continuemos entendiendo el funcionamiento
de estas etiquetas. En estos ejemplos se verán algunas
etiquetas que hoy día están obsoletas, pero no
olvidemos que no estamos hablando de lenguajes actuales sino de
SGMl, el lenguaje de marcas del que todos los demás
descienden. Vamos a ello:

Monografias.com

Un aspecto muy importante es que se debe
tener en cuenta que un documento se divide en dos tipos de
estructuras:

Esta estructura está formada por las
partes o secciones que componen ese documento, y por las
relaciones entre dichas partes.

Indica la apariencia (la estética
del documento, sobre papel o en la pantalla). Se incluye en esta
estructura los componentes físicos, el posicionamiento de
los elementos y la tipografía empleada.

Conociendo los dos tipos de estructuras
posibles, resulta que con la sintaxis del lenguaje SGML se trata
de identificar la estructura lógica del documento a
través de las marcas. Lo que estoy tratando de decir, es
que el SGML es un sistema para definir lenguajes, es decir,
primero que se trata de un metalenguaje, y segundo, que ayuda a
definir lenguajes de marcas. Estos lenguajes de marcas creados a
partir de SGML, serán los que finalmente serán
usados para dar formato a los documentos. Pero esto lo veremos
más adelante.

Como consecuencia, el SGML sirve para
describir los documentos de tal forma que en función del
tipo de documento, se establecerán las etiquetas que son
válidas, la organización de las mismas y la
sintaxis a ser obedecida.

Aprovechando la potencia de SGML, los
autores utilizan un código de formato en sus documentos.
Con este código, junto con el contenido, representan
información estructural, presentacional y
semántica. En palabras más claras, los autores
gracias a SGML manejan la estructura del documento (pudiendo
manipular cada elemento del mismo), su presentación (como
es visto por el usuario final) y la semántica o
significado de cada una de las partes que componen dicho
documento. Lo último es importantísimo para manejo
de bases de datos, o documentos o sitios web etc… con los
cuales sea muy necesario que el sistema realmente sepa el tipo de
datos que va y donde va.(es decir que se especifique de forma muy
concreta que es ese elemento).

Un ejemplo bien conocido de lenguaje de
marcado o formato de documentos, proveniente de SGML es el
HTML.

Origen del
Html

Una pincelada por encima para luego volver
sobre él:

Para declarar un documento HTML, es
obligatorio poner al inicio del mismo la declaración del
tipo de documento o DTD. Es muy importante esta
declaración porque la necesitaremos para validar sobre
ella, pero de esto hablaremos más adelante. Pues bien,
esta declaración del tipo de documento nos especifica que
lenguaje y versión estamos usando para que los navegadores
web puedan interpretar correctamente las páginas
web.

Hablando de forma clara, la DTD indica de
forma inequívoca la sintaxis exacta que debe contener el
documento para ser validado. Cuando hablamos de validado, nos
referimos a que sigue exactamente las recomendaciones del W3
consortium. (Organismo encargado de estandarizar todo lo relativo
a la World Wide Web).

Monografias.com

La primera línea es la
declaración DTD. Se indica que es un documento HTML
público, de acuerdo con el W3c, y que se trata de la DTD
relativa a la versión 4.01 de HTML, la cual está en
inglés. Luego se indica la ruta de acceso a la DTD. De
este ejemplo se extrae además, que un documento HTML
comienza con una etiqueta de inicio y que al finalizar el
documento debe cerrarse la etiqueta. La etiqueta < html >
es un elemento raíz y sólo puede haber un elemento
raíz por documento. No olvidemos que el elemento
raíz es tanto su etiqueta de inicio < html > como su
correspondiente etiqueta de cierre < /html > . Es
importante recordar que casi todos los elementos HTML se
conforman de una etiqueta de inicio y otra de fin. La etiqueta de
fin se distingue de la de inicio por la existencia de una barra
inclinada a la derecha denominada slash que está
situada siempre antes que el nombre de la etiqueta.

Partes en las que
se divide una aplicación SGML

Recordando lo anteriormente dicho, el SGML
permite definir nuevos metalenguajes. A cada lenguaje de formato
de documentos definido con SGML se lo denomina aplicación
SGML. Las partes en las que se divide una aplicación SGML
son:

  • 1. Una declaración
    SGML:

En la misma se concreta que caracteres y
delimitadores pueden aparecer en la aplicación. Es decir,
lo que se declara es la versión de caracteres que van a
poder ser utilizados. (UTF-8 por ejemplo).

  • 2. Una Declaración del tipo
    de documento (DTD):

Ésta define la sintaxis de las
estructuras de formato, así como referencias a entidades
de caracteres. En palabras más sencillas, define el tipo
de etiquetas que van a poder ser usadas, los caracteres
permitidos en el lenguaje, como se va a estructurar ese lenguaje
etcétera… De esta manera se podrá luego
validar frente a ese tipo de DTD seleccionada, para comprobar sin
la sintaxis a la hora de coloras las balizas ha sido la correcta
o tiene errores, sin embargo. Validar una web frente a la DTD
empleada mediante el servicio del Validador de la W3C es
algo imprescindible. De otra manera el comportamiento de nuestra
web frente a los navegadores podría ser imprevisible,
además de que afectaría al posicionamiento web, del
cual hablaremos más adelante.

  • 3. Una especificación que
    describe la semántica:

Se trata de una especificación que
describe el significado que se debe aportar al código de
formato. Adicionalmente, esta especificación
también impone restricciones de sintaxis que no pueden
expresarse dentro del DTD.

  • 4. Documentos con su contenido y
    su marcado entrelazado:

Cada documento, como es lógico, debe
contener una referencia al DTD que debe usarlo para
interpretarlo. (Validación).

Ahora vamos a ahondar aún más
en todos estos conceptos:

  • Sobre la DTD:

En la definición del tipo de
documento se identifica la estructura del documento, es decir,
aquellos elementos necesarios en la elaboración de un
documento o grupo de documentos con características
estructurales similares.

La DTD contiene las reglas de dichos
elementos
: El nombre, su significado (semántico),
donde pueden ser utilizados y qué pueden
contener.

Normalmente la DTD se almacena es un
archivo separado con la extensión .dtd. Al ser
independiente dicho archivo, puede ser referenciado sin necesidad
de que esté dentro del documento SGML. De esta manera, que
a la hora de utilizar la DTD, se sustituye la DTD completa por
solamente una línea (lo cual es un gran alivio la
verdad).

La línea de la DTD que se incluye en
el documento indica que la DTD se edita como un texto
público o se encuentra ya disponible en el sistema
receptor. (DTD creada por uno mismo o usar una DTD ya creada y
publicada en W3c).

Si no hay DTD, el documento SGML no
será validado apropiadamente por el
parser.

¿Y qué es el
parser?

Un parser es un procesador de cualquier
lenguaje. Por ejemplo. Los navegadores llevan internamente
procesadores de varios lenguajes, como son por ejemplo. html,
xhtml,. Xml, css, javascript, etc…

Por lo tanto, el parser asegura la adecuada
conformación de SGML dentro de las múltiples
especificaciones que un documento puede tener.

La conclusión es que un documento no
será validado por el parser, si este documento no
cumple
con las especificaciones de la DTD, por ejemplo, si
carece de título, ya que éste es un elemento
obligatorio.

Conviene saber que la DTD se
escribía inicialmente sobre la sintaxis de XML
. UN
ejemplo de código de una DTD es:

Monografias.com

En general cuando creamos un documento para
la web hemos aprendido cuál debe ser su estructura, los
elementos que se pueden emplear y su semántica,etc…
Pero….

¿Qué ocurre si empleamos una
DTD para la que no tenemos documentación?

Para estos casos, saber que significa el
Código DTD, es de gran ayuda. Sería absurdo hablar
del código DTD, bajo la sintaxis SGML, ya que actualmente
ya no se utiliza en la web, sino lo que es usado actualmente es
la sintaxis XML. XML es un subconjunto de SGML. De XML hablaremos
tras este apartado.

  • Sobre la declaración
    SGML:

La declaración SGML dice al usuario
qué puede y qué no puede estar contenido en el
documento SGML. Es decir, especifica que caracteres serán
usados, que características específicas de SGML
serán implementadas, y que sintaxis se utilizarán
en el documento.

Se trata de un diagrama formal y
normalizado que le indica al sistema receptor (navegador) el
conjunto de caracteres, los delimitadores y las
características opcionales de SGML que se están
utilizando. Por lo tanto, la declaración SGML y la DTD
trabajan de forma conjunta.

Si la declaración SGML dice que una
función en particular no podrá ser usada, la DTD
debe respetarlo, sino de otra manera existirían errores en
el documento. A través de la declaración SGML se
identifican de manera inmediata los parámetros para la
marca generalizada contenida en la DTD.

Sin embargo, la declaración SGML
suele omitirse cuando tanto el emisor como el receptor utilizan
la sintaxis por defecto o una sintaxis de referencia
concreta.

  • Sobre la DTD:

En la DTD se identifica la estructura de un
documento, o sea, los elementos necesarios para la
construcción de un documento. Se debe recordar que la
codificación de la declaración de la DTD debe estar
siempre en Mayúsculas ya que lo exige la sintaxis y si no,
no se validará correctamente.

  • La instancia o muestra del
    documento:

Contiene el marcado o etiquetado y el
contenido del texto, es decir, el el documento en sí
mismo, que es el texto más el marcado. Por ejemplo, y
aunque no sea a través de SGML, un documento de Word lleva
un marcado interno, que aunque o se vea directamente por el
usuario, es el responsable de mantener las sangrías que
hayamos seleccionado, los márgenes de la página que
hayamos decidido para nuestro documento, el tipo de letra, su
tamaño etc… De forma transparente ese marcado
formatea nuestro documento y nos lo muestra cómo queremos
en la pantalla.

Volviendo al SGML, entonces el contenido
del documento formateado mediante SGML, contiene dichos objetos
SGML, los cuales siguen la estructura del árbol definido
en la DTD.

Los objetos SGML son principalmente
dos:

  • Elementos: Insertados como etiquetas y
    sus atributos locales.

  • Entidades: Para caracteres especiales,
    texto almacenado y archivos externos.

Los delimitadores o etiquetas de inicio (
< inicio > ) y final ( < /final > ) permiten que el
software reconozca qué caracteres deben leerse en modo
etiqueta y cuales en modo contenido. Los caracteres
básicos utilizados en el lenguaje SGML vienen descritos en
la ISO 8879.

Además de los caracteres < >
con el nombre de un elemento en su interior, si encontramos el
signo & (ampersand) seguido por un nombre y ; (punto y coma),
sabremos que se están representando entidades tales como
imágenes gráficas o caracteres
especiales.

El lenguaje SGML ha logrado simplificar
estos 3 pasos descritos anteriormente para construir un documento
SGML, sin que sea necesaria la intervención humana, pues,
en este sistema, cada componente establece los valores y
parámetros para el siguiente componente. El único
etiquetado que aparece ha sido declarado en la DTD y la sintaxis
de la DTD se ha indicado mediante la declaración SGML
definida por el estándar. La ventaja, por lo tanto, de
esta secuenciación de indicaciones, es que los ordenadores
la siguen para comprobar que los documentos se adapten a las
reglas establecidas.

El funcionamiento a grandes rasgos es el
siguiente:

  • 1. El programa Parser (procesador
    del lenguaje) lee la primera declaración SGML y
    aprende sus reglas.

  • 2. Luego lee la DTD y aprende las
    reglas de marcado y etiquetado.

  • 3. Finalmente, determina si la
    muestra o instancia del documento cumple dichas reglas.
    (Validación).

Como podemos entonces entender, el
procesamiento de un documento SGML se realiza, pues, de forma
automática
. La máquina es quien valida el
documento puesto que el parser lee el documento SGML y separa los
datos del etiquetado.

Ejemplo:

Si el contenido de un documento contiene
una referencia a una hoja de cálculo o a un
gráfico, dará las instrucciones al sistema para
encontrar dichas entidades y que aparezca la imagen de dicho
gráfico etcétera…

Como conclusión podemos decir que
SGML es un lenguaje muy potente y flexible para construir
aplicaciones e intercambiarlas de forma independiente.

SGML y el sistema
distribuido de la información

Mucho hemos hablado sobre el SXGML y, sin
embargo, nos quedan tantas cosas en el tintero… Ya hemos
visto un poco por encima el origen del SGML pero quizás no
hemos dicho explícitamente la motivación primaria
para la creación del mismo. En realidad el objetivo
primordial de SGML era permitir el intercambio de
información entre distintas plataformas, soportes
físicos, soportes lógicos y diferentes sistemas de
almacenamiento de la información con independencia de su
grado de complejidad. Leyendo esto detenidamente, pronto nos
damos cuenta de su orientación hacia aplicación
multiplataforma. Por lo tanto estamos antes un nuevo concepto de
información, por lo que para concebir un nuevo documento
en SGML debemos tener en cuenta varios aspectos muy
importantes:

  • Un documento se puede distribuir en
    múltiples archivos
    , tantos como sean necesarios.
    Incluso en diferentes ordenadores. (Con esta idea se
    vislumbra perfectamente su orientación
    distribuida).

  • Un archivo puede contener la portada,
    otro la introducción, otro la hoja de cálculo,
    otro la bibliografía etcétera… Bajo esta
    idea ya se percibe la idea de modularidad. (Documento
    realizado en módulos).

  • Como hemos dicho, en SGML, cada uno
    de estos objetos recibe el nombre de entidad
    . Estos
    objetos o entidades se conciben y tratan de forma
    independiente unos de otros.

  • Las entidades pueden haber sido creadas
    por cualquier tipo de software y estar guardadas en cualquier
    ordenador. Por lo tanto también pueden tener
    tamaños diferentes.

  • Las entidades pueden estar
    compartidas por distintos documentos
    . Por lo tanto
    podemos aprovechar un objeto o entidad para ser usado en
    diferentes nuevos objetos o entidades, simplemente haciendo
    referencia al mismo en una cabecera. (Del concepto de
    cabecera hablaremos más adelante).

  • La estructura de las entidades
    que conforman un documento, definen a ese documento.
    Por lo tanto se da especial importancia a la
    estructuración del documento frente al formateo del
    mismo.

  • En el índice de materias de un
    documento no se encontrará ninguna referencia a los
    archivos que contienen las entidades.

  • En la organización de las
    entidades se debe respetar una estructuración
    lógica jerarquizada
    en la cual se van a definir
    conceptos como capítulos, tablas, párrafos. De
    lo que estamos hablando es de la estructura de los elementos
    del documento.

  • Pese a que elementos y entidades
    no son lo mismo pueden coincidir en ocasiones. Por
    ejemplo, un elemento lógico como tabla puede ser
    también una entidad en un archivo hoja de
    cálculo.

  • Ventajas e inconvenientes de
    SGML:

  • Principales Ventajas

  • Reutilización de los
    datos:

  • Tipos de etiquetado:

Existen dos tipos de etiquetado de un
documento. En función de lo que se quiera conseguir
elegiremos una forma u otra de etiquetar. Los dos tipos
principales son los siguientes:

  • Etiquetado procedimental:

Para entender este tipo de etiquetado,
hablaremos un poco de sus orígenes. Vamos a
ello:

La idea de etiquetar un texto no es nueva.
Por ejemplo los maquetadores de las imprentas marcaban los
textos
con instrucciones para que el cajista supiera como
reflejar el diseño, estos es, si los títulos
debían aparecer más grandes, en negrita o centrados
etcétera… Estas instrucciones eran signos muy
complejos e ininteligibles para el profano, y muchas veces
sólo tenía sentido para la máquina con la
que se iba a imprimir. (Por lo tanto no existía la
capacidad de la portabilidad de los documentos). Además
las instrucciones podían contener códigos de
control específicos que trasladados a otra máquina
o entorno podían bloquear la composición
tipográfica. (El proceso de imprenta).

Por si esto fuera poco problema, estas
instrucciones, intercaladas en el texto, imposibilitaban las
reutilización posterior de la información. Cuando
un texto era revisado con la intención de reeditarlo,
solía suceder que era necesario utilizar el mismo sistema
de composición, pero he aquí el problema,
seguramente para entonces ya estaba obsoleto, con lo cual ya no
se podía manejar esa información obligando a volver
a empezar desde cero.

Encima, para cambiar el diseño, era
necesario sumergirse en los códigos de los archivos, los
cuales muchas veces estaban encriptados u ocultos. Por
último, las mismas instrucciones podían aparecer en
una amplia diversidad de lugares, aunque no estuvieran
relacionados de forma lógica.

Así que si cambiabas, por ejemplo,
todos los extranjerismos a negrita, pero sólo los que se
hallasen en cursiva, también se convertiría de
forma accidental, pero también de forma automática,
cualquier parte del texto que estuviera en cursiva. (Un desastre,
en resumen).

Entonces, ¿Qué es el
etiquetado procedimental?

A grandes rasgos, de lo que estamos
hablando antes. Se trata del medio mediante el cual un operario
utiliza instrucciones crípticas (códigos,
enigmáticos, oscuros y difíciles de entender) y
dependientes del funcionamiento del sistema para que ejecute las
acciones en el mismo orden en el que se encuentren las
instrucciones. Por lo tanto el sistema destino realiza
exactamente lo que el código le va pidiendo paso a paso,
es decir, se rige por procedimientos.

Ejemplos comunes son el PostScript y el PDF
(ambos definidos a partir de SGML por supuesto). Vamos a hablar
someramente sobre ellos:

PostScript:

Monografias.com

Charles Geschke

Monografias.com

John Warnok

Se trata de un formato de documentos,
creado por la empresa adobe en 1984 (Por John Warnok y
Charles Geschke), para describir documentos listos para
imprimir, es decir documentos que ya están preparados y
maquetados para imprimir, pero que ya no podemos
editar.

Hoy día se trata de un
estándar para el almacenamiento de documentos listos para
imprimir. Estos archivos tienen extensión PS.

Para poder visualizar un documento
PostScript en nuestro ordenador necesitamos un programa visor,
por ejemplo GhostView, que además nos permite
imprimir un documento aunque nuestra impresora no sea
PostScript.

Un documento o fichero PostScript debe
atenerse a unas reglas de construcción muy precisas.
Dentro del mismo puede haber gran diversidad de datos como
textos, imágenes binarias (fotos), y descripciones
matemáticas de gráficos. (Imágenes
vectoriales). Todos estos datos son importantísimos a
nivel de diseño gráfico adquiriendo una notable
tendencia en especial hacia los gráficos vectoriales, ya
que estos se pueden escalar sin problemas sin pérdidas de
calidad. (La imágenes pixeladas se pueden reducir sin
problemas, pero si se quieren agrandar se pixelizan, apareciendo
entonces con distorsiones, restando su calidad).

Pensando a priori lo que estamos diciendo
sobre PostScript, podemos pensar que es una idea tonta y
facilona, pero no lo es en absoluto. Esto es porque si no fuera
por la aparición del PostScript, no sería posible
la portabilidad de los documentos de una impresora o filmadora a
otra, lo que nos llevaría al desastre de sólo
poder, por ejemplo, imprimir aquellos documentos que fueran
compatibles con nuestra impresora. ¿Os lo
imagináis? Yo no.

El hecho es que PostScript no es el
único lenguaje de descripción de páginas
(LPD) que existe, pero es el que ha tenido más
éxito y el que se ha convertido en un estándar de
las artes gráficas.

  • Funcionamiento de
    PostScript:

Para que se adapte a los diferentes
sistemas, PostScript es un lenguaje de los llamados
"interpretados". Por lo tanto no se comunica directamente con la
máquina, sino que necesitas de de un dispositivo
físico o programa residente en el ordenador denominado
procesador. Este actúa como intérprete traductor
entre el código PostScript universal y la máquina.
(RIP). El PostScript es tan universal que su forma más
sencilla se escribe mediante textos, eso sí, con una
codificación muy rigurosa. Para que lo entendamos,
PostScript da instrucciones del tipo:

"Traza un círculo de 5 cm de radio;
haz un rectángulo de 5cm de largo por 2 de ancho
etc…."

Por lo tanto un RIP profesional lo que hace
básicamente es interpretar el código PostScript y
transformarlo en código binario para que la impresora lo
entienda y pueda imprimir el documento. Este hecho de ser
interpretado lo hace universal, lo cual es una de sus grandes
ventajas, pero por otro lado uno de sus grandes inconvenientes ya
que los ficheros PostScript entonces han de ser grandes de por
sí. (Ya que no puede ser muy condensado).

Debemos tener en cuenta además que
su interpretación puede convertirse en una tarea
titánica para el Rip, pudiéndose incluso bloquearse
éste en alguna ocasión.

Por si esto fuera poco, este lenguaje es
básicamente vectorial, pero eso no quiere decir que no se
puedan incrustar otros objetos, al contrario. Se pueden incrustar
por ejemplo, mapas de bits. (imágenes formadas por series
ordenadas de bits muy grandes). Esto quiere decir que un fichero
con pocos Kbs de instrucciones pueden llevar incrustados ficheros
de megas y megas de tamaño. Todo esto lo tiene que
interpretar el Rip
, por lo que ya podéis imaginar el
duro trabajo que le espera a la máquina para interpretar
todo eso. Lógicamente, a veces, se bloquean.

Existen varios niveles de PostScript, nivel
1, nivel 2 y nivel 3 con diversas especificaciones. Se trata de
mejoras que Adobe ha ido introduciendo al lenguaje. Sin embargo
la mayoría de los Rips se han quedado acordes al nivel 2.
Esta diferenciación de niveles ha ocasionado resultados
imprecisos entre documentos realizados en nivel 3 y
máquina que están a un nivel inferior. Por lo tanto
es importante asegurarse de que el impresor tiene aquellos
dispositivos capaces de ejecutar aquello que pides. Si no, o bien
los resultados serán nulos o indeseados.

PDF:

Hace muchos años, la
información que se servía en Cd-Rom o Diskettes,
tenía el formato de texto plano, y después esto
sucedió también en Microsoft Word. Esto conllevaba
problemas como los que sucedían con dicho procesador de
textos, que cuando evolucionaba en el tiempo, si queríamos
abrir un documento, muchas veces no era posible si no se
disponía de la versión más reciente de dicho
procesador de textos. Es decir, las versiones de los documentos
de Word debían coincidir con la versión del
procesador, lo cual era una auténtica lata.

Poco a poco , este tipo de formatos fueron
cediendo terreno a otros como el HTML (en el cual se centra
principalmente este trabajo y del cual hablaremos más
extensivamente más adelante), y el PDF, del cual
hablaremos en este mismo apartado.

El PDF, al igual que el HTML, posee la
indudable ventaja de que han de poder ser interpretados

más o menos igual, independientemente de la
versión del programa que se utilice
para
interpretarlos.

Y entonces, ¿Qué es el
PDF?

El PDF, es un formato portátil para
documentos desarrollado por Adobe Systems. Como todos sabemos es
muy usado en internet, debido a su versatilidad, facilidad de uso
y tamaño reducido.

El PDF, por lo tanto se ha convertido en un
estándar de facto (impuesto), tanto dentro de las redes de
la empresa , como de cara al internet.

Estas son sus múltiples
ventajas:

  • Un documento PDF tiene la misma
    presentación y formato que un documento
    impreso.

  • Los archivos PDF pueden ser
    visualizados por navegadores o bien descargados al
    computador.

  • El programa lector Acrobat Reader se
    obtiene gratis en la mayoría de los sistemas
    operativos.

  • Se pueden efectuar búsquedas
    internas para buscar una palabra concreta dentro del
    documento.

  • Pueden enviarse por email, estar en Cd
    … Por lo tanto su distribución es muy
    sencilla.

Cómo funciona el
PDF:

Una de las grandes cualidades en el
funcionamiento del PDF, es que es capaz de capturar el formato de
múltiples aplicaciones, y permite que aparezcan en el
monitor de la persona que los recibe tal y como fueron
creados.

Entonces, cuando se convierte un archivo,
por ejemplo, de Word, a PDF, es como hacer una foto o imagen del
archivo origen tal y como fue creado, pero con la ventaja de que
se puede hacer que el archivo PDF pueda ser editado.

Monografias.com

Como se puede observar en el ejemplo
anterior el lenguaje de marcas PDF, no se parece en absoluto
al HTML
, Esto es porque el PDF es un lenguaje procedimental.
De esta manera el software de representación va realizando
los procedimientos en orden, según va la leyendo el
código fuente del PDF. Por ejemplo, para formatear un
título debe haber previamente una serie de directivas
previas antes de indicarle el texto en cuestión. (Por
ejemplo, centrar, tamaño de la fuente etc…). Y
justo después del título, debe haber unas etiquetas
inversas que reviertan los efectos.

Menos mal que para manipular los archivos
PDF existen varios programas, unos de pago y otros
gratuitos:

  • Adobe Acrobat: Este es el
    programa oficial y claro, no es gratuito.

  • PDFTtk: Para usuarios de Linux,
    pero no es para usuarios nóveles, ya que se trabaja
    desde la línea de comandos de Linux. Es software
    libre.

  • Foxit PDF Editor: Proporciona un
    entorno de procesador de textos para la edición del
    PDF como hace el Acrobat. También en Shareware, es
    decir, una versión de prueba y si te gusta el
    programa, luego debes pagar por él para poder ampliar
    su funcionalidad.

  • Mucho software libre en este
    sentido:
    Como CutePDF, PDFRedirect etc..

El PDF es el formato usado más
conocido con este tipo de marcado procedimental pero hay muchos
otros:

  • Nroff: Para formateo de textos
    de Unix. Produce una salida adecuada para el formato de
    impresoras y ventanas de terminales. (Como se ve en el modo
    consola).

  • Troff: A diferencia de otros
    formateadores de texto, troff puede posicionar caracteres
    arbitrariamente en un lugar de la página, incluso uno
    sobre otro, y tiene un lenguaje de entrada completamente
    programable. Para Unix.

  • TeX: Sistema de
    tipografía muy popular entre matemáticos,
    físicos e informáticos. Ha conseguido sustituir
    con creces a Troff. Son archivos muy grandes y muy, muy
    técnicos. Varios sistemas de procesamiento de
    documentos están basados en TeX, por ejemplo LaTeX.
    LaTex está orientado especialmente a la
    creación de libros, documentos científicos y
    técnicos que contengan fórmulas
    matemáticas. LaTex es software libre.

Etiquetado de
presentación

Se trata del tipo de marcado basado en
el formateo del texto
. Este tipo de marcado es útil
para maquetar la presentación de un documento para su
lectura, pero resulta insuficiente para el procesamiento
automático de la información. La verdad es que el
marcado de presentación resulta más fácil de
elaborar y por eso se usa para textos pequeños. Pero la
pega es que resulta difícil de mantener y de
modificar.

En sus inicios, el mismo HTML era un
lenguaje de puramente descriptivo, ya que definía un
conjunto de etiquetas y atributos válidos, ofreciendo un
significado visual para cada elemento. Por lo tanto HTML
únicamente de dedicaba a definir sus etiquetas y como
debían ser utilizadas.

Puede suceder que aún nos estemos
liando con esta separación del contenido y
presentación de un documento, por lo que voy a tratar de
dar otra explicación diferente para que logremos entender
de una vez por todas, esta diferenciación. Entonces, un
documento, como ya hemos dicho, se divide en tres componentes
bien diferenciados:

  • 1. Contenido.

  • 2. Estructura.

  • 3. Presentación.

Para nosotros como usuarios son la misma
cosa, porque nosotros sólo vemos el resultado, pero en
realidad esto no es así. Porque si nosotros vemos un
párrafo, el autor del documento ha debido indicar que
ciertas líneas van todas unidas dentro de un
párrafo. Por lo tanto todo documento para por un proceso
antes de poder ser visualizado, que para el usuario corriente es
algo transparente. La siguiente ilustración puede aclarar
mucho las ideas preconcebidas:

Monografias.com

Por lo tanto un lenguaje de marcado, es un
conjunto predefinido de marcas o etiquetas las cuales sirven para
especificar cómo está estructurado el documento, es
decir, donde va un párrafo, donde una lista ordenada
etcétera…

Y esto es estructurar un documento, pero
esto no implica denotar como será representado el
documento en la pantalla, sino solamente como está
estructurado dicho documento, lo cual quiere decir, en qué
elementos individuales se divide dicho documento.

Sin embargo un lenguaje de
presentación no se centra exactamente en este aspecto
,
sino que se centra en cómo debe mostrarse cada elemento
estructural del documento, en el soporte final, por ejemplo, la
pantalla del ordenador. Las reglas de dicho lenguaje están
hechas para definir ese aspecto exactamente.

Un ejemplo ilustrativo sería
utilizar un lenguaje de presentación para indicar como
deben mostrarse los títulos de cada capítulo, o
bien el texto de cada párrafo, o los márgenes, de
un documento.

Tradicionalmente en el mundo de las artes
gráficas, se han empleado diferentes lenguajes de marcado,
para por un lado denotar la estructura del documento y sobretodo,
como debe quedar el documento a la hora de ser
impreso.

En la web, hacen falta también
lenguajes de marcado y lenguajes de presentación que
sirvan para indicar las cosas señaladas. De otro modo, los
navegadores web no sabrían como mostrar las cosas
señaladas.

Hoy día, el lenguaje web de
presentación más utilizado es el CSS
. De este
lenguaje hablaremos más adelante.

Sin embargo los lenguajes de
presentación son archiconocidos en otros entornos, como
son los procesadores de texto. Un lenguaje de presentación
muy conocido es el RTF.

RTF:

El RTF (Rich Text Format) es un
formato de archivo informático desarrollado por
Microsoft., para el intercambio de documentos multiplataforma. La
mayoría de procesadores de texto son capaces de leer y
escribir documentos en formato RTF. Si se escribe un texto en el
bloc de notas, el resultado es texto plano, sin ningún
tipo de formato. Es decir, son los caracteres ASCII uno a
continuación del otro sin nada más.
(Extensión .txt). Pero luego ese texto se puede enriquecer
(texto enriquecido) adecuando el texto a la presentación
final que queremos del mismo.

Monografias.com

Partes: 1, 2

Página siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter