Monografías Plus      Agregar a favoritos      Ayuda      Português      Ingles     

HTML. Lenguajes de marcas

Enviado por jesus



Partes: 1, 2

  1. Introducción
  2. Orígenes de internet
  3. Evolución paralela de los lenguajes de marcas
  4. Nacimiento de GML. Su evolución hacia SGML
  5. Origen del Html
  6. Partes en las que se divide una aplicación SGML
  7. SGML y el sistema distribuido de la información
  8. Bibliografía

"Los ordenadores son buenos siguiendo instrucciones, no leyendo tu mente"-- Donald Knuth

Monografias.com

Introducción

Monografias.com

Orígenes de internet

La necesidad humana de comunicación y obtención de información ha estado patente durante toda la existencia del ser humano. Pero, la verdad, nunca antes se ha logrado un nivel de comunicación tan impresionante como está sucediendo hoy día con internet.

Los orígenes de internet se remontan a 1969, cuando se estableció la primera red de computadores. Esta red de computadores arcaica fue conocida como Arpanet, (Advanced Research Projects Agency Network). Fue el resultado de un encargo del ministerio de defensa de los EEUU, para comunicar los diferentes organismos del país.

Posteriormente del uso privado de Arpanet por parte del ejército, al uso privado entre organismos públicos y universidades, para, finalmente, expandirse de forma revolucionaria hasta llegar a la super red que es hoy día internet.

La red ya funcionaba, se había expandido, y mediante ella las personas se intercambiaban archivos principalmente. Pero aún faltaba algo por descubrirse que cambiaría la humanidad para siempre: La World Wide Web:

Por World Wide Web entendemos aquel sistema de distribución de la información basado en hipertexto. Este hipertexto permitía al usuario pinchar y acceder a contenidos relacionados con la página que estaba visitando.

La World Wide Web fue creada por Tim Berners Lee con la ayuda de Robert Cailliau. Y se publicó en 1992.

Pero, en fin, debemos destacar que la World Wide Web no es el único servicio en internet, sino que existen otros muy importantes que debemos reseñar:

SMTP (Correo Electrónico), FTP y P2P (Transmisión de archivos); Chat (Irc), mensajería instantánea, telefonía (Voip),, televisión (Iptv),boletines electrónicos (NNTP), el acceso remoto a otros dispositivos. (SSH y Telnet), o los juegos en línea. Pero, repito, el detonante de internet fue la WWW.

Evolución paralela de los lenguajes de marcas

Los manuscritos de la antigüedad se marcaban en los márgenes, con el objetivo de dejar constancia de cómo debía presentarse el texto de los mismos, en futuros copiados por parte de los escribanos. El ser humano, aún sin saberlo de forma consciente, ya estaba utilizando una especie de lenguaje de marcado.

Más adelante en el tiempo, más concretamente en los años 60, comenzaron a usarse lo que hoy en día entendemos como lenguaje de etiquetas. Como ya se venía haciendo en documentos de papel, la idea de incluir también anotaciones dentro de documentos electrónicos comenzó a tomar forma. El objetivo de incluir estas anotaciones en los textos, surgió de la necesidad de separar la presentación del documento de su contenido.

Pero antes de proseguir es conveniente añadir que esta idea también se vio impulsada una importante carencia de los sistemas informáticos de la época:

  • 1. El número de formatos existentes a la hora de archivar los documentos y las consiguientes dificultades que planteaba el intercambio de archivos (pérdida de formato…), condujeron a la necesidad de editar los textos en código ASCII (American Standar Code For Information Interchange). Este código de 7 bits, podía representar 128 caracteres, muchos de ellos no imprimibles. Sin embargo, pese a su potencia, no satisfacía la necesidad de definir el formato de un texto. Entonces, para que nos entendamos, el código ASCII no podía poner una frase en negrita (por ejemplo), no definir los márgenes, ni siquiera el tipo o tamaño de letra.

Teniendo en cuenta la dicha carencia del código ASCII (hoy día obsoleto y sustituido por el Unicode) a la hora de representar la presentación de los documentos, se acordó que las marcas de los nuevos lenguajes que se quería diseñar, deberían disponer de caracteres ASCII, pero reservados de forma especial para ello. Adicionalmente se optó por establecer unas normas sintácticas especiales. Así nació un lenguajes artificial, especial y normalizado internacionalmente, con el objetivo de servir como instrumento para la formulación de este tipo de reglas.

Nacimiento de GML. Su evolución hacia SGML

Fue entonces cuando IBM llevó a la práctica su idea de lenguaje de marcado: El lenguaje GML. Sus siglas significaban Generalized Markup Language, y su objetivo prioritario era permitir la compatibilidad entre los documentos.

Más tarde, en 1978, el instituto nacional americano (ANSI) comenzó a trabajar en las especificaciones para los procesadores de textos. Todo ese trabajo conjunto llevó a la evolución de Gml hacia otro nuevo lenguaje: SGML.

SGML se encuentra bajo la norma Iso 8879. Las siglas de SGML añaden una nueva letra a GML, La s de estándar en inglés. Y este significado es muy importante, porque, en efecto, gracias a la aparición del lenguaje SGML, se estandarizó la sintaxis base de todo lenguaje de etiquetas.

La conclusión a la que se llegó es marcar con balizas el documento, de manera que las estas balizas o etiquetas (llamadas también marcas o anotaciones ) en realidad no son vistas por el usuario final actuando por lo tanto de forma transparente.

En el código fuente (el que ve el creador del documento web por ejemplo), las etiquetas o tags se diferencian del propio texto porque aparecen entre corchetes angulares, uno de inicio < y otro de fin de la etiqueta > . Lógicamente usando caracteres ASCII, que pasan a ser reservados para la sintaxis en SGML.

Continuemos entendiendo el funcionamiento de estas etiquetas. En estos ejemplos se verán algunas etiquetas que hoy día están obsoletas, pero no olvidemos que no estamos hablando de lenguajes actuales sino de SGMl, el lenguaje de marcas del que todos los demás descienden. Vamos a ello:

Monografias.com

Un aspecto muy importante es que se debe tener en cuenta que un documento se divide en dos tipos de estructuras:

Esta estructura está formada por las partes o secciones que componen ese documento, y por las relaciones entre dichas partes.

Indica la apariencia (la estética del documento, sobre papel o en la pantalla). Se incluye en esta estructura los componentes físicos, el posicionamiento de los elementos y la tipografía empleada.

Conociendo los dos tipos de estructuras posibles, resulta que con la sintaxis del lenguaje SGML se trata de identificar la estructura lógica del documento a través de las marcas. Lo que estoy tratando de decir, es que el SGML es un sistema para definir lenguajes, es decir, primero que se trata de un metalenguaje, y segundo, que ayuda a definir lenguajes de marcas. Estos lenguajes de marcas creados a partir de SGML, serán los que finalmente serán usados para dar formato a los documentos. Pero esto lo veremos más adelante.

Como consecuencia, el SGML sirve para describir los documentos de tal forma que en función del tipo de documento, se establecerán las etiquetas que son válidas, la organización de las mismas y la sintaxis a ser obedecida.

Aprovechando la potencia de SGML, los autores utilizan un código de formato en sus documentos. Con este código, junto con el contenido, representan información estructural, presentacional y semántica. En palabras más claras, los autores gracias a SGML manejan la estructura del documento (pudiendo manipular cada elemento del mismo), su presentación (como es visto por el usuario final) y la semántica o significado de cada una de las partes que componen dicho documento. Lo último es importantísimo para manejo de bases de datos, o documentos o sitios web etc… con los cuales sea muy necesario que el sistema realmente sepa el tipo de datos que va y donde va.(es decir que se especifique de forma muy concreta que es ese elemento).

Un ejemplo bien conocido de lenguaje de marcado o formato de documentos, proveniente de SGML es el HTML.

Origen del Html

Una pincelada por encima para luego volver sobre él:

Para declarar un documento HTML, es obligatorio poner al inicio del mismo la declaración del tipo de documento o DTD. Es muy importante esta declaración porque la necesitaremos para validar sobre ella, pero de esto hablaremos más adelante. Pues bien, esta declaración del tipo de documento nos especifica que lenguaje y versión estamos usando para que los navegadores web puedan interpretar correctamente las páginas web.

Hablando de forma clara, la DTD indica de forma inequívoca la sintaxis exacta que debe contener el documento para ser validado. Cuando hablamos de validado, nos referimos a que sigue exactamente las recomendaciones del W3 consortium. (Organismo encargado de estandarizar todo lo relativo a la World Wide Web).

Monografias.com

La primera línea es la declaración DTD. Se indica que es un documento HTML público, de acuerdo con el W3c, y que se trata de la DTD relativa a la versión 4.01 de HTML, la cual está en inglés. Luego se indica la ruta de acceso a la DTD. De este ejemplo se extrae además, que un documento HTML comienza con una etiqueta de inicio y que al finalizar el documento debe cerrarse la etiqueta. La etiqueta < html > es un elemento raíz y sólo puede haber un elemento raíz por documento. No olvidemos que el elemento raíz es tanto su etiqueta de inicio < html > como su correspondiente etiqueta de cierre < /html > . Es importante recordar que casi todos los elementos HTML se conforman de una etiqueta de inicio y otra de fin. La etiqueta de fin se distingue de la de inicio por la existencia de una barra inclinada a la derecha denominada slash que está situada siempre antes que el nombre de la etiqueta.

Partes en las que se divide una aplicación SGML

Recordando lo anteriormente dicho, el SGML permite definir nuevos metalenguajes. A cada lenguaje de formato de documentos definido con SGML se lo denomina aplicación SGML. Las partes en las que se divide una aplicación SGML son:

  • 1. Una declaración SGML:

En la misma se concreta que caracteres y delimitadores pueden aparecer en la aplicación. Es decir, lo que se declara es la versión de caracteres que van a poder ser utilizados. (UTF-8 por ejemplo).

  • 2. Una Declaración del tipo de documento (DTD):

Ésta define la sintaxis de las estructuras de formato, así como referencias a entidades de caracteres. En palabras más sencillas, define el tipo de etiquetas que van a poder ser usadas, los caracteres permitidos en el lenguaje, como se va a estructurar ese lenguaje etcétera… De esta manera se podrá luego validar frente a ese tipo de DTD seleccionada, para comprobar sin la sintaxis a la hora de coloras las balizas ha sido la correcta o tiene errores, sin embargo. Validar una web frente a la DTD empleada mediante el servicio del Validador de la W3C es algo imprescindible. De otra manera el comportamiento de nuestra web frente a los navegadores podría ser imprevisible, además de que afectaría al posicionamiento web, del cual hablaremos más adelante.

  • 3. Una especificación que describe la semántica:

Se trata de una especificación que describe el significado que se debe aportar al código de formato. Adicionalmente, esta especificación también impone restricciones de sintaxis que no pueden expresarse dentro del DTD.

  • 4. Documentos con su contenido y su marcado entrelazado:

Cada documento, como es lógico, debe contener una referencia al DTD que debe usarlo para interpretarlo. (Validación).

Ahora vamos a ahondar aún más en todos estos conceptos:

  • Sobre la DTD:

En la definición del tipo de documento se identifica la estructura del documento, es decir, aquellos elementos necesarios en la elaboración de un documento o grupo de documentos con características estructurales similares.

La DTD contiene las reglas de dichos elementos: El nombre, su significado (semántico), donde pueden ser utilizados y qué pueden contener.

Normalmente la DTD se almacena es un archivo separado con la extensión .dtd. Al ser independiente dicho archivo, puede ser referenciado sin necesidad de que esté dentro del documento SGML. De esta manera, que a la hora de utilizar la DTD, se sustituye la DTD completa por solamente una línea (lo cual es un gran alivio la verdad).

La línea de la DTD que se incluye en el documento indica que la DTD se edita como un texto público o se encuentra ya disponible en el sistema receptor. (DTD creada por uno mismo o usar una DTD ya creada y publicada en W3c).

Si no hay DTD, el documento SGML no será validado apropiadamente por el parser.

¿Y qué es el parser?

Un parser es un procesador de cualquier lenguaje. Por ejemplo. Los navegadores llevan internamente procesadores de varios lenguajes, como son por ejemplo. html, xhtml,. Xml, css, javascript, etc…

Por lo tanto, el parser asegura la adecuada conformación de SGML dentro de las múltiples especificaciones que un documento puede tener.

La conclusión es que un documento no será validado por el parser, si este documento no cumple con las especificaciones de la DTD, por ejemplo, si carece de título, ya que éste es un elemento obligatorio.

Conviene saber que la DTD se escribía inicialmente sobre la sintaxis de XML. UN ejemplo de código de una DTD es:

Monografias.com

En general cuando creamos un documento para la web hemos aprendido cuál debe ser su estructura, los elementos que se pueden emplear y su semántica,etc… Pero….

¿Qué ocurre si empleamos una DTD para la que no tenemos documentación?

Para estos casos, saber que significa el Código DTD, es de gran ayuda. Sería absurdo hablar del código DTD, bajo la sintaxis SGML, ya que actualmente ya no se utiliza en la web, sino lo que es usado actualmente es la sintaxis XML. XML es un subconjunto de SGML. De XML hablaremos tras este apartado.

  • Sobre la declaración SGML:

La declaración SGML dice al usuario qué puede y qué no puede estar contenido en el documento SGML. Es decir, especifica que caracteres serán usados, que características específicas de SGML serán implementadas, y que sintaxis se utilizarán en el documento.

Se trata de un diagrama formal y normalizado que le indica al sistema receptor (navegador) el conjunto de caracteres, los delimitadores y las características opcionales de SGML que se están utilizando. Por lo tanto, la declaración SGML y la DTD trabajan de forma conjunta.

Si la declaración SGML dice que una función en particular no podrá ser usada, la DTD debe respetarlo, sino de otra manera existirían errores en el documento. A través de la declaración SGML se identifican de manera inmediata los parámetros para la marca generalizada contenida en la DTD.

Sin embargo, la declaración SGML suele omitirse cuando tanto el emisor como el receptor utilizan la sintaxis por defecto o una sintaxis de referencia concreta.

  • Sobre la DTD:

En la DTD se identifica la estructura de un documento, o sea, los elementos necesarios para la construcción de un documento. Se debe recordar que la codificación de la declaración de la DTD debe estar siempre en Mayúsculas ya que lo exige la sintaxis y si no, no se validará correctamente.

  • La instancia o muestra del documento:

Contiene el marcado o etiquetado y el contenido del texto, es decir, el el documento en sí mismo, que es el texto más el marcado. Por ejemplo, y aunque no sea a través de SGML, un documento de Word lleva un marcado interno, que aunque o se vea directamente por el usuario, es el responsable de mantener las sangrías que hayamos seleccionado, los márgenes de la página que hayamos decidido para nuestro documento, el tipo de letra, su tamaño etc… De forma transparente ese marcado formatea nuestro documento y nos lo muestra cómo queremos en la pantalla.

Volviendo al SGML, entonces el contenido del documento formateado mediante SGML, contiene dichos objetos SGML, los cuales siguen la estructura del árbol definido en la DTD.

Los objetos SGML son principalmente dos:

  • Elementos: Insertados como etiquetas y sus atributos locales.

  • Entidades: Para caracteres especiales, texto almacenado y archivos externos.

Los delimitadores o etiquetas de inicio ( < inicio > ) y final ( < /final > ) permiten que el software reconozca qué caracteres deben leerse en modo etiqueta y cuales en modo contenido. Los caracteres básicos utilizados en el lenguaje SGML vienen descritos en la ISO 8879.

Además de los caracteres < > con el nombre de un elemento en su interior, si encontramos el signo & (ampersand) seguido por un nombre y ; (punto y coma), sabremos que se están representando entidades tales como imágenes gráficas o caracteres especiales.

El lenguaje SGML ha logrado simplificar estos 3 pasos descritos anteriormente para construir un documento SGML, sin que sea necesaria la intervención humana, pues, en este sistema, cada componente establece los valores y parámetros para el siguiente componente. El único etiquetado que aparece ha sido declarado en la DTD y la sintaxis de la DTD se ha indicado mediante la declaración SGML definida por el estándar. La ventaja, por lo tanto, de esta secuenciación de indicaciones, es que los ordenadores la siguen para comprobar que los documentos se adapten a las reglas establecidas.

El funcionamiento a grandes rasgos es el siguiente:

  • 1. El programa Parser (procesador del lenguaje) lee la primera declaración SGML y aprende sus reglas.

  • 2. Luego lee la DTD y aprende las reglas de marcado y etiquetado.

  • 3. Finalmente, determina si la muestra o instancia del documento cumple dichas reglas. (Validación).

Como podemos entonces entender, el procesamiento de un documento SGML se realiza, pues, de forma automática. La máquina es quien valida el documento puesto que el parser lee el documento SGML y separa los datos del etiquetado.

Ejemplo:

Si el contenido de un documento contiene una referencia a una hoja de cálculo o a un gráfico, dará las instrucciones al sistema para encontrar dichas entidades y que aparezca la imagen de dicho gráfico etcétera…

Como conclusión podemos decir que SGML es un lenguaje muy potente y flexible para construir aplicaciones e intercambiarlas de forma independiente.

SGML y el sistema distribuido de la información

Mucho hemos hablado sobre el SXGML y, sin embargo, nos quedan tantas cosas en el tintero… Ya hemos visto un poco por encima el origen del SGML pero quizás no hemos dicho explícitamente la motivación primaria para la creación del mismo. En realidad el objetivo primordial de SGML era permitir el intercambio de información entre distintas plataformas, soportes físicos, soportes lógicos y diferentes sistemas de almacenamiento de la información con independencia de su grado de complejidad. Leyendo esto detenidamente, pronto nos damos cuenta de su orientación hacia aplicación multiplataforma. Por lo tanto estamos antes un nuevo concepto de información, por lo que para concebir un nuevo documento en SGML debemos tener en cuenta varios aspectos muy importantes:

  • Un documento se puede distribuir en múltiples archivos, tantos como sean necesarios. Incluso en diferentes ordenadores. (Con esta idea se vislumbra perfectamente su orientación distribuida).

  • Un archivo puede contener la portada, otro la introducción, otro la hoja de cálculo, otro la bibliografía etcétera… Bajo esta idea ya se percibe la idea de modularidad. (Documento realizado en módulos).

  • Como hemos dicho, en SGML, cada uno de estos objetos recibe el nombre de entidad. Estos objetos o entidades se conciben y tratan de forma independiente unos de otros.

  • Las entidades pueden haber sido creadas por cualquier tipo de software y estar guardadas en cualquier ordenador. Por lo tanto también pueden tener tamaños diferentes.

  • Las entidades pueden estar compartidas por distintos documentos. Por lo tanto podemos aprovechar un objeto o entidad para ser usado en diferentes nuevos objetos o entidades, simplemente haciendo referencia al mismo en una cabecera. (Del concepto de cabecera hablaremos más adelante).

  • La estructura de las entidades que conforman un documento, definen a ese documento. Por lo tanto se da especial importancia a la estructuración del documento frente al formateo del mismo.

  • En el índice de materias de un documento no se encontrará ninguna referencia a los archivos que contienen las entidades.

  • En la organización de las entidades se debe respetar una estructuración lógica jerarquizada en la cual se van a definir conceptos como capítulos, tablas, párrafos. De lo que estamos hablando es de la estructura de los elementos del documento.

  • Pese a que elementos y entidades no son lo mismo pueden coincidir en ocasiones. Por ejemplo, un elemento lógico como tabla puede ser también una entidad en un archivo hoja de cálculo.

  • Ventajas e inconvenientes de SGML:

  • Principales Ventajas

  • Reutilización de los datos:

  • Tipos de etiquetado:

Existen dos tipos de etiquetado de un documento. En función de lo que se quiera conseguir elegiremos una forma u otra de etiquetar. Los dos tipos principales son los siguientes:

  • Etiquetado procedimental:

Para entender este tipo de etiquetado, hablaremos un poco de sus orígenes. Vamos a ello:

La idea de etiquetar un texto no es nueva. Por ejemplo los maquetadores de las imprentas marcaban los textos con instrucciones para que el cajista supiera como reflejar el diseño, estos es, si los títulos debían aparecer más grandes, en negrita o centrados etcétera… Estas instrucciones eran signos muy complejos e ininteligibles para el profano, y muchas veces sólo tenía sentido para la máquina con la que se iba a imprimir. (Por lo tanto no existía la capacidad de la portabilidad de los documentos). Además las instrucciones podían contener códigos de control específicos que trasladados a otra máquina o entorno podían bloquear la composición tipográfica. (El proceso de imprenta).

Por si esto fuera poco problema, estas instrucciones, intercaladas en el texto, imposibilitaban las reutilización posterior de la información. Cuando un texto era revisado con la intención de reeditarlo, solía suceder que era necesario utilizar el mismo sistema de composición, pero he aquí el problema, seguramente para entonces ya estaba obsoleto, con lo cual ya no se podía manejar esa información obligando a volver a empezar desde cero.

Encima, para cambiar el diseño, era necesario sumergirse en los códigos de los archivos, los cuales muchas veces estaban encriptados u ocultos. Por último, las mismas instrucciones podían aparecer en una amplia diversidad de lugares, aunque no estuvieran relacionados de forma lógica.

Así que si cambiabas, por ejemplo, todos los extranjerismos a negrita, pero sólo los que se hallasen en cursiva, también se convertiría de forma accidental, pero también de forma automática, cualquier parte del texto que estuviera en cursiva. (Un desastre, en resumen).

Entonces, ¿Qué es el etiquetado procedimental?

A grandes rasgos, de lo que estamos hablando antes. Se trata del medio mediante el cual un operario utiliza instrucciones crípticas (códigos, enigmáticos, oscuros y difíciles de entender) y dependientes del funcionamiento del sistema para que ejecute las acciones en el mismo orden en el que se encuentren las instrucciones. Por lo tanto el sistema destino realiza exactamente lo que el código le va pidiendo paso a paso, es decir, se rige por procedimientos.

Ejemplos comunes son el PostScript y el PDF (ambos definidos a partir de SGML por supuesto). Vamos a hablar someramente sobre ellos:

PostScript:

Monografias.com

Charles Geschke

Monografias.com

John Warnok

Se trata de un formato de documentos, creado por la empresa adobe en 1984 (Por John Warnok y Charles Geschke), para describir documentos listos para imprimir, es decir documentos que ya están preparados y maquetados para imprimir, pero que ya no podemos editar.

Hoy día se trata de un estándar para el almacenamiento de documentos listos para imprimir. Estos archivos tienen extensión PS.

Para poder visualizar un documento PostScript en nuestro ordenador necesitamos un programa visor, por ejemplo GhostView, que además nos permite imprimir un documento aunque nuestra impresora no sea PostScript.

Un documento o fichero PostScript debe atenerse a unas reglas de construcción muy precisas. Dentro del mismo puede haber gran diversidad de datos como textos, imágenes binarias (fotos), y descripciones matemáticas de gráficos. (Imágenes vectoriales). Todos estos datos son importantísimos a nivel de diseño gráfico adquiriendo una notable tendencia en especial hacia los gráficos vectoriales, ya que estos se pueden escalar sin problemas sin pérdidas de calidad. (La imágenes pixeladas se pueden reducir sin problemas, pero si se quieren agrandar se pixelizan, apareciendo entonces con distorsiones, restando su calidad).

Pensando a priori lo que estamos diciendo sobre PostScript, podemos pensar que es una idea tonta y facilona, pero no lo es en absoluto. Esto es porque si no fuera por la aparición del PostScript, no sería posible la portabilidad de los documentos de una impresora o filmadora a otra, lo que nos llevaría al desastre de sólo poder, por ejemplo, imprimir aquellos documentos que fueran compatibles con nuestra impresora. ¿Os lo imagináis? Yo no.

El hecho es que PostScript no es el único lenguaje de descripción de páginas (LPD) que existe, pero es el que ha tenido más éxito y el que se ha convertido en un estándar de las artes gráficas.

  • Funcionamiento de PostScript:

Para que se adapte a los diferentes sistemas, PostScript es un lenguaje de los llamados "interpretados". Por lo tanto no se comunica directamente con la máquina, sino que necesitas de de un dispositivo físico o programa residente en el ordenador denominado procesador. Este actúa como intérprete traductor entre el código PostScript universal y la máquina. (RIP). El PostScript es tan universal que su forma más sencilla se escribe mediante textos, eso sí, con una codificación muy rigurosa. Para que lo entendamos, PostScript da instrucciones del tipo:

"Traza un círculo de 5 cm de radio; haz un rectángulo de 5cm de largo por 2 de ancho etc…."

Por lo tanto un RIP profesional lo que hace básicamente es interpretar el código PostScript y transformarlo en código binario para que la impresora lo entienda y pueda imprimir el documento. Este hecho de ser interpretado lo hace universal, lo cual es una de sus grandes ventajas, pero por otro lado uno de sus grandes inconvenientes ya que los ficheros PostScript entonces han de ser grandes de por sí. (Ya que no puede ser muy condensado).

Debemos tener en cuenta además que su interpretación puede convertirse en una tarea titánica para el Rip, pudiéndose incluso bloquearse éste en alguna ocasión.

Por si esto fuera poco, este lenguaje es básicamente vectorial, pero eso no quiere decir que no se puedan incrustar otros objetos, al contrario. Se pueden incrustar por ejemplo, mapas de bits. (imágenes formadas por series ordenadas de bits muy grandes). Esto quiere decir que un fichero con pocos Kbs de instrucciones pueden llevar incrustados ficheros de megas y megas de tamaño. Todo esto lo tiene que interpretar el Rip, por lo que ya podéis imaginar el duro trabajo que le espera a la máquina para interpretar todo eso. Lógicamente, a veces, se bloquean.

Existen varios niveles de PostScript, nivel 1, nivel 2 y nivel 3 con diversas especificaciones. Se trata de mejoras que Adobe ha ido introduciendo al lenguaje. Sin embargo la mayoría de los Rips se han quedado acordes al nivel 2. Esta diferenciación de niveles ha ocasionado resultados imprecisos entre documentos realizados en nivel 3 y máquina que están a un nivel inferior. Por lo tanto es importante asegurarse de que el impresor tiene aquellos dispositivos capaces de ejecutar aquello que pides. Si no, o bien los resultados serán nulos o indeseados.

PDF:

Hace muchos años, la información que se servía en Cd-Rom o Diskettes, tenía el formato de texto plano, y después esto sucedió también en Microsoft Word. Esto conllevaba problemas como los que sucedían con dicho procesador de textos, que cuando evolucionaba en el tiempo, si queríamos abrir un documento, muchas veces no era posible si no se disponía de la versión más reciente de dicho procesador de textos. Es decir, las versiones de los documentos de Word debían coincidir con la versión del procesador, lo cual era una auténtica lata.

Poco a poco , este tipo de formatos fueron cediendo terreno a otros como el HTML (en el cual se centra principalmente este trabajo y del cual hablaremos más extensivamente más adelante), y el PDF, del cual hablaremos en este mismo apartado.

El PDF, al igual que el HTML, posee la indudable ventaja de que han de poder ser interpretados más o menos igual, independientemente de la versión del programa que se utilice para interpretarlos.

Y entonces, ¿Qué es el PDF?

El PDF, es un formato portátil para documentos desarrollado por Adobe Systems. Como todos sabemos es muy usado en internet, debido a su versatilidad, facilidad de uso y tamaño reducido.

El PDF, por lo tanto se ha convertido en un estándar de facto (impuesto), tanto dentro de las redes de la empresa , como de cara al internet.

Estas son sus múltiples ventajas:

  • Un documento PDF tiene la misma presentación y formato que un documento impreso.

  • Los archivos PDF pueden ser visualizados por navegadores o bien descargados al computador.

  • El programa lector Acrobat Reader se obtiene gratis en la mayoría de los sistemas operativos.

  • Se pueden efectuar búsquedas internas para buscar una palabra concreta dentro del documento.

  • Pueden enviarse por email, estar en Cd … Por lo tanto su distribución es muy sencilla.

Cómo funciona el PDF:

Una de las grandes cualidades en el funcionamiento del PDF, es que es capaz de capturar el formato de múltiples aplicaciones, y permite que aparezcan en el monitor de la persona que los recibe tal y como fueron creados.

Entonces, cuando se convierte un archivo, por ejemplo, de Word, a PDF, es como hacer una foto o imagen del archivo origen tal y como fue creado, pero con la ventaja de que se puede hacer que el archivo PDF pueda ser editado.

Monografias.com

Como se puede observar en el ejemplo anterior el lenguaje de marcas PDF, no se parece en absoluto al HTML, Esto es porque el PDF es un lenguaje procedimental. De esta manera el software de representación va realizando los procedimientos en orden, según va la leyendo el código fuente del PDF. Por ejemplo, para formatear un título debe haber previamente una serie de directivas previas antes de indicarle el texto en cuestión. (Por ejemplo, centrar, tamaño de la fuente etc…). Y justo después del título, debe haber unas etiquetas inversas que reviertan los efectos.

Menos mal que para manipular los archivos PDF existen varios programas, unos de pago y otros gratuitos:

  • Adobe Acrobat: Este es el programa oficial y claro, no es gratuito.

  • PDFTtk: Para usuarios de Linux, pero no es para usuarios nóveles, ya que se trabaja desde la línea de comandos de Linux. Es software libre.

  • Foxit PDF Editor: Proporciona un entorno de procesador de textos para la edición del PDF como hace el Acrobat. También en Shareware, es decir, una versión de prueba y si te gusta el programa, luego debes pagar por él para poder ampliar su funcionalidad.

  • Mucho software libre en este sentido: Como CutePDF, PDFRedirect etc..

El PDF es el formato usado más conocido con este tipo de marcado procedimental pero hay muchos otros:

  • Nroff: Para formateo de textos de Unix. Produce una salida adecuada para el formato de impresoras y ventanas de terminales. (Como se ve en el modo consola).

  • Troff: A diferencia de otros formateadores de texto, troff puede posicionar caracteres arbitrariamente en un lugar de la página, incluso uno sobre otro, y tiene un lenguaje de entrada completamente programable. Para Unix.

  • TeX: Sistema de tipografía muy popular entre matemáticos, físicos e informáticos. Ha conseguido sustituir con creces a Troff. Son archivos muy grandes y muy, muy técnicos. Varios sistemas de procesamiento de documentos están basados en TeX, por ejemplo LaTeX. LaTex está orientado especialmente a la creación de libros, documentos científicos y técnicos que contengan fórmulas matemáticas. LaTex es software libre.

Etiquetado de presentación

Se trata del tipo de marcado basado en el formateo del texto. Este tipo de marcado es útil para maquetar la presentación de un documento para su lectura, pero resulta insuficiente para el procesamiento automático de la información. La verdad es que el marcado de presentación resulta más fácil de elaborar y por eso se usa para textos pequeños. Pero la pega es que resulta difícil de mantener y de modificar.

En sus inicios, el mismo HTML era un lenguaje de puramente descriptivo, ya que definía un conjunto de etiquetas y atributos válidos, ofreciendo un significado visual para cada elemento. Por lo tanto HTML únicamente de dedicaba a definir sus etiquetas y como debían ser utilizadas.

Puede suceder que aún nos estemos liando con esta separación del contenido y presentación de un documento, por lo que voy a tratar de dar otra explicación diferente para que logremos entender de una vez por todas, esta diferenciación. Entonces, un documento, como ya hemos dicho, se divide en tres componentes bien diferenciados:

  • 1. Contenido.

  • 2. Estructura.

  • 3. Presentación.

Para nosotros como usuarios son la misma cosa, porque nosotros sólo vemos el resultado, pero en realidad esto no es así. Porque si nosotros vemos un párrafo, el autor del documento ha debido indicar que ciertas líneas van todas unidas dentro de un párrafo. Por lo tanto todo documento para por un proceso antes de poder ser visualizado, que para el usuario corriente es algo transparente. La siguiente ilustración puede aclarar mucho las ideas preconcebidas:

Monografias.com

Por lo tanto un lenguaje de marcado, es un conjunto predefinido de marcas o etiquetas las cuales sirven para especificar cómo está estructurado el documento, es decir, donde va un párrafo, donde una lista ordenada etcétera…

Y esto es estructurar un documento, pero esto no implica denotar como será representado el documento en la pantalla, sino solamente como está estructurado dicho documento, lo cual quiere decir, en qué elementos individuales se divide dicho documento.

Sin embargo un lenguaje de presentación no se centra exactamente en este aspecto, sino que se centra en cómo debe mostrarse cada elemento estructural del documento, en el soporte final, por ejemplo, la pantalla del ordenador. Las reglas de dicho lenguaje están hechas para definir ese aspecto exactamente.

Un ejemplo ilustrativo sería utilizar un lenguaje de presentación para indicar como deben mostrarse los títulos de cada capítulo, o bien el texto de cada párrafo, o los márgenes, de un documento.

Tradicionalmente en el mundo de las artes gráficas, se han empleado diferentes lenguajes de marcado, para por un lado denotar la estructura del documento y sobretodo, como debe quedar el documento a la hora de ser impreso.

En la web, hacen falta también lenguajes de marcado y lenguajes de presentación que sirvan para indicar las cosas señaladas. De otro modo, los navegadores web no sabrían como mostrar las cosas señaladas.

Hoy día, el lenguaje web de presentación más utilizado es el CSS. De este lenguaje hablaremos más adelante.

Sin embargo los lenguajes de presentación son archiconocidos en otros entornos, como son los procesadores de texto. Un lenguaje de presentación muy conocido es el RTF.

RTF:

El RTF (Rich Text Format) es un formato de archivo informático desarrollado por Microsoft., para el intercambio de documentos multiplataforma. La mayoría de procesadores de texto son capaces de leer y escribir documentos en formato RTF. Si se escribe un texto en el bloc de notas, el resultado es texto plano, sin ningún tipo de formato. Es decir, son los caracteres ASCII uno a continuación del otro sin nada más. (Extensión .txt). Pero luego ese texto se puede enriquecer (texto enriquecido) adecuando el texto a la presentación final que queremos del mismo.

Monografias.com

Partes: 1, 2

Página siguiente 

Comentarios


Trabajos relacionados

Ver mas trabajos de Computacion

 
 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.


Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Iniciar sesión

Ingrese el e-mail y contraseña con el que está registrado en Monografias.com

   
 

Regístrese gratis

¿Olvidó su contraseña?

Ayuda