Monografias.com > Computación
Descargar Imprimir Comentar Ver trabajos relacionados

Procesamiento del lenguaje natural en la Inteligencia Artificial




Enviado por egdia



    1. Linguística
    2. Análisis
      Lingüístico
    3. Lenguaje
    4. Lenguaje
      Formal
    5. Comprensión del
      lenguaje
    6. Generación de
      textos
    7. Gramáticas
      Formales
    8. Definiciones empleadas en las
      gramáticas formales
    9. Conclusiones
    10. Bibliografía

    Introducción

    El tesoro más valioso de la raza humana es
    el
    conocimiento, es decir, la información. Existen en el mundo
    volúmenes inmensos de información en forma de
    lenguaje natural: los libros, los
    periódicos, los informes
    técnicos, etcétera. Pero la posesión
    verdadera de este tesoro implica  la habilidad de hacer
    ciertas operaciones con
    la información:

         Buscar la
    información necesaria,

         Comparar las
    fuentes
    diferentes, y hacer inferencias lógicas y
    conclusiones,

         Manejar los
    textos, por ejemplo, traducirlos a otros
    idiomas.

    En realidad, las computadoras
    son más capaces de procesar la información que las
    personas. Pueden procesar muchísimos más grandes
    volúmenes de información que una persona puede
    leer en su vida. A base de ésta, pueden hacer inferencias
    lógicas tomando en cuenta más hechos y más
    fuentes.

    Todo parece estar preparado para el uso de las
    computadoras para procesar volúmenes grandes de
    información: los métodos
    lógicos ya son muy fuertes, los procesadores muy
    rápidos, muchos textos ya están disponibles en
    forma digital, tanto en las casas editoriales como en Internet. El único
    problema para la computadora
    al procesar los textos es que simplemente ¡no los entiende!
    Hasta ahora, los textos son para la computadora
    solamente cadenas de letras sin cualquier sentido y no una
    información útil para el razonamiento
    lógico.

    Para convertir la computadora en nuestro verdadero
    ayudante en el procesamiento de textos, se necesita pasar un
    largo camino de aprendizaje de la
    estructura de
    textos y de su formalización; más abajo vamos a
    hablar de algunos problemas en
    este camino.  Pero si es tan largo el camino, ¿existe
    una razón práctica para trabajar en esta
    área ahora? Sí, existe, porque con cada paso
    obtenemos las herramientas
    que ya tienen gran valor
    práctico, que ayudan en nuestras tareas
    cotidianas.

    Desarrollo

    Linguística

    La Lingüística es la disciplina que
    se ocupa del estudio científico del lenguaje. Dentro de la
    Lingüística se pueden identificar diferentes
    áreas de interés,
    tales como:

    • Lingüística Aplicada – aplicación
      de la lingüística a áreas específicas
      como la traducción, enseñanza de un segundo idioma, pronósticos, etc.
    • Antropología Lingüística – estudio
      de las relaciones entre lenguaje y cultura.
    • Lingüística Computacional – procesamiento
      del lenguaje natural.
    • Neuro-lingüística: estudio del cerebro y de su
      funcionamiento en la producción, percepción y adquisición del
      lenguaje.
    • Sociolingüística: estudio de las
      relaciones entre el lenguaje
      y estructuras
      sociales, variación
      lingüística y actitudes
      hacia el lenguaje.
    • Psico-lingüística: estudio de la
      adquisición del lenguaje.
    • Lingüística Teórica – análisis
      lingüístico.

    Análisis
    Lingüístico

    Cuando se hace análisis lingüístico,
    se está trabajando dentro del campo de la Teoría
    Lingüística o Lingüística Teórica.
    Desde este punto de vista, la gramática de una lengua es una
    representación explícita del conocimiento
    (consciente e inconsciente) que un hablante nativo tiene de su
    lengua. Una teoría lingüística debe de
    proporcionar las nociones y herramientas analíticas
    necesarias que nos permitan describir de manera explícita
    el conocimiento.

    Cuando un lingüista escribe una gramática,
    este lingüista no sólo describe una lengua, sino que
    también nos está diciendo algo sobre los procesos
    cognoscitivos del ser humano. Por lo tanto, una teoría
    lingüística debe no sólo proveer los medios para
    describir gramáticas de manera explícita, sino que
    debe de permitir hacer generalizaciones racionales que permitan
    describir los procesos gramaticales de un lenguaje.

    El análisis lingüístico consiste
    en:

    1. Analizar los datos existentes
    y descubrir las reglas, leyes y
    regularidades del lenguaje;

    2. Expresar de manera formal una generalización
    que describa esas reglas, leyes y regularidades de forma
    racional;

    La Lingüística tiene por objetivo
    descubrir los métodos para describir no sólo una
    lengua en concreto, sino
    de cualquier lenguaje natural, es conocer con profundidad una
    lengua particular, y llegar a entender la facultad humana del
    lenguaje. Por lo tanto, el análisis de fenómenos
    gramaticales en una lengua determinada ayuda a entender, no
    sólo la lengua en cuestión, sino el proceso
    cognoscitivo del hombre.

    Lenguaje

    Lenguaje es el empleo de la
    palabra para expresar ideas, comunicarse, establecer relaciones
    entre los seres humanos. Un lenguaje es un conjunto de palabras,
    su pronunciación y los métodos para combinarlas en
    frases y oraciones, generalmente infinito y que se forma mediante
    combinaciones de palabras definidas en un diccionario
    terminológico previamente establecido. Las combinaciones
    posibles deben respetar un conjunto de reglas sintácticas
    establecidas, a ello se le conoce con el nombre de Sintaxis.
    Además, las palabras deben tener determinado sentido,
    deben ser comprendidas por un grupo humano
    en un contexto dado, a ello se le denomina Semántica.

    A lo largo de la historia el ser humano a
    utilizado el lenguaje para trasmitir sus conocimientos,
    sentimientos, emociones,
    sensaciones, comunicarse con el resto de los humanos y esta
    función
    del lenguaje la ha desarrollado de manera oral, gráfica,
    escrita o por señas.

    Cuando hablamos de lenguajes se pueden diferenciar dos
    clases muy bien definidas

    Existen muchas definiciones de lenguaje natural, una que
    pudiera acercarnos a entender mejor este concepto
    plantea:

    Se denomina Lenguaje Natural a un lenguaje escrito o
    hablado usado por una comunidad que es
    precisamente lo contrario a un lenguaje para establecer comunicación con una computadora, mediante
    la entrada de datos, o la programación de su funcionamiento.
    (Guzmán 1997)

    Los lenguajes han sufrido un largo y complejo proceso de
    desarrollo
    desde el surgimiento del hombre sobre la faz de la Tierra. Los
    lenguajes se han desarrollado a partir de la experiencia
    práctica de los diferentes grupos humanos.
    La riqueza de sus componentes semánticos otorga a los
    lenguajes naturales gran poder
    expresivo y valor como herramienta para expresar y exteriorizar
    los razonamientos más sutiles y complejos. La sintaxis de
    un LN se puede modelar mediante la utilización de un
    lenguaje formal. Otra propiedad
    importante de los lenguajes naturales es la
    poli-semántica, es decir la posibilidad de que una palabra
    posea significados diferentes.

    Los lenguajes naturales se caracterizan por las
    propiedades siguientes:

    1. Han sufrido un largo y complejo proceso
      histórico de perfeccionamiento previo a la
      aparición de una teoría científica que
      explique las leyes fundamentales de su desarrollo;
    2. Su capacidad para expresar el pensamiento
      humano en toda su complejidad y belleza;
    3. Dificultad para lograr una formalización
      científica completa;
    4. Su capacidad para transmitir la historia, las ideas,
      las costumbres, la cultura y la ciencia
      de las diferentes sociedades
      humanas.

    La comprensión y reconocimiento del lenguaje
    natural es uno de los problemas mas complejos a que se enfrenta
    la Inteligencia
    Artificial debido a la complejidad, irregularidad y
    diversidad del lenguaje humano y a los problemas
    filosóficos y psicológicos asociados al significado
    de frases, oraciones y textos en su conjunto.

    La concepción principal que orienta el desarrollo
    de las tecnologías del habla y del lenguaje natural tiene
    por objetivo estratégico lograr que la interacción con las máquinas
    sea análoga a la que se ha desarrollado
    históricamente en la interacción entre las
    personas. En otras palabras, estratégicamente se plantea
    como objetivo lograr una relación hombre/máquina
    análoga a la relación hombre/hombre. En
    múltiples y diversas aplicaciones el reconocimiento del
    hablar y el lenguaje natural son de gran utilidad. En
    ocasiones se presentan problemas en el reconocimiento y
    comprensión de las expresiones orales y escritas. La
    escritura, los
    símbolos, las imágenes y
    la voz son los medios de
    comunicación fundamentales en la interacción
    hombre/máquina. La experiencia practica acumulada, en el
    campo del Lenguaje Natural, ha señalado la conveniencia de
    orientar el reconocimiento del lenguaje natural más al
    análisis de frases, oraciones y textos en su conjunto, que
    al reconocimiento de palabras aisladas. En otras palabras,
    priorizar el reconocimiento del sistema en su
    conjunto, sobre el reconocimiento de sus partes
    integrantes.

    Lenguaje
    Formal

    Un lenguaje formal es un lenguaje artificial o sea
    creado por el hombre que
    esta formado por símbolos y formulas y que tiene como
    objetivo fundamental formalizar la programación de
    computadoras o representar simbólicamente un
    conocimiento.

    Las palabras y oraciones en un lenguaje formal poseen
    definición rigurosa desde el punto de vista
    científico. Son utilizados para modelar teorías
    científicas con la ventaja de que en estos se reduce la
    ambigüedad.

    En resumen las características de los lenguajes
    formales son las siguientes:

    • Se han desarrollado como un medio para formalizar
      matemáticamente una teoría;
    • Su sintaxis es capaz de definir oraciones
      rigurosamente definidas;
    • Constituyen un poderoso instrumento para la investigación y el procesamiento del
      Lenguaje Natural por computadora.

    Un lenguaje de
    programación es un lenguaje Artificial usado para
    escribir instrucciones que pueden ser traducidas a lenguaje
    maquina y ejecutadas en una computadora.

    Un lenguaje de programación esta formado por un
    conjunto de reglas sintácticas que permiten escribir un
    programa, de
    forma tal que sea entendido por la computadora. Un programa es un
    conjunto de instrucciones con un orden determinado que permite
    realizar una tarea computacional dada.

    Un lenguaje de programación se basa en dos
    conceptos fundamentales:

    • Sintaxis – garantiza la utilización
      correcta de cada una de las expresiones de determinado lenguaje
      de programación.
    • Semántica – garantiza que las
      expresiones de un lenguaje de programación posean un
      significado correcto.

    Procesamiento del Lenguaje natural

    El procesamiento del lenguaje es de manera general, el
    conjunto de instrucciones que una computadora recibe en un
    lenguaje de programación dado (formal), que le
    permitirán comunicarse con un humano en su propio
    lenguaje, (ingles, francés, español,
    etc).

    El procesamiento del lenguaje natural presenta
    múltiples aplicaciones:

    • Corrección de textos
    • Traducción automática
    • Recuperación de la
      información
    • Extracción de Información y
      Resúmenes
    • Búsqueda de documentos
    • Sistemas Inteligentes para la
      Educación y el Entrenamiento

    La corrección de textos permite la
    detección y corrección de errores
    ortográficos y gramaticales, Para detectar este tipo de
    errores, la computadora necesita entender en cierto grado el
    sentido del texto. Los
    correctores de gramática detectan las estructuras
    incorrectas en las oraciones aunque todas las palabras en la
    oración estén bien escritas en el lenguaje en
    cuestión. El problema de detectar los errores de este tipo
    es complejo debido a la existencia de gran variedad de
    estructuras permitidas.

    Para describir las estructuras de las oraciones en el
    idioma, se usan las llamadas gramáticas formales, o sea
    conjuntos de
    reglas de combinación de palabras y su orden relativo en
    las oraciones.

    La traducción automática se refiere a la
    traducción correcta de un lenguaje a otro, tomando en
    cuenta lo que se quiere expresar en cada
    oración.

    En el campo de la recuperación de la
    información han desarrollado sistemas que
    permiten obtener información sobre estadísticas deportivas, información
    turística, geografía etc.. En
    lugar de buscar los documentos para encontrar en ellos la
    respuesta a su pregunta, el usuario podría hacer su
    pregunta a la computadora: ¿Cómo se llama el
    Presidente de Francia?,
    ¿Cuáles son los centros más avanzados en
    Procesamiento del Lenguaje Natural?, y otras.

    Por otra parte Se han desarrollado sistemas con la
    capacidad de crear resúmenes de documentos a partir de los
    datos suministrados. Estos sistemas son capaces de realizar un
    análisis detallado del contenido del texto y elaborar un
    resumen.

    También se han desarrollado sistemas inteligentes
    que permiten modelar el comportamiento
    del estudiante, reconocer y procesar sus errores, desarrollar
    habilidades en la resolución de problemas y otras
    actividades del proceso enseñanza y aprendizaje. En ellos
    el Procesamiento del Lenguaje Natural juega un papel de relevante
    importancia en la creación y desarrollo de interfaces
    amigables.

    Arquitectura de un sistema de Procesamiento del
    Lenguaje Natural

    Uno de los elementos fundamentales en el diseño
    de un sistema PLN es sin lugar a dudas la determinación de
    la arquitectura
    del sistema, es decir, como se introducen los datos a la
    computadora y como ella interpreta y analiza las oraciones que le
    sean proporcionadas. A continuación se muestra un
    esquema del análisis léxico/ sintáctico por
    computadora. El sistema consiste de:

    1. El usuario le expresa (de alguna forma) a la
      computadora que tipo de procesamiento desea hacer;
    2. La computadora analiza las oraciones proporcionadas,
      en el sentido morfológico y
      sintáctico;
    3. Luego, se analizan las oraciones
      semánticamente, es decir se determina el significado de
      cada oración;
    4. Se realiza el análisis pragmático del
      texto. Así, se obtiene una expresión
      final.

    Se ejecuta la expresión final y se entrega al
    usuario para su consideración.

    Comprensión del lenguaje

    El verbo comprender, proviene del latín
    comprenhendere, y significa entender, penetrar, concebir,
    discernir, descifrar. Se entiende entonces por comprensión
    – al conocimiento perfecto de alguna cosa; a la captación
    del significado de alguna cosa o fenómeno; a la acción
    de aceptar un hecho o un suceso como cierto o plausible sin lugar
    a duda; a tener certeza completa del significado, naturaleza o
    explicación de alguna cosa o fenómeno.

    La comprensión adecuada del texto es la tarea
    más importante y compleja del análisis
    lingüístico.

    ¿Qué es comprensión del
    lenguaje?

    ¿Cómo se puede determinar si la
    computadora comprende el texto?

    La comprensión del texto consiste en su
    transformación en determinada representación
    formal. Esta representación formal puede ser una red de conceptos, un
    conjunto de predicados lógicos, etc. Ella puede usarse
    posteriormente para responder preguntas, compilar
    resúmenes, y otras tareas lingüísticas. En la
    actualidad, los resultados prácticos alcanzados en el
    área de la comprensión de texto son aun modestos.
    Por ello, los científicos que trabajan en la
    lingüística computacional realizan ingentes esfuerzos
    en esta área del conocimiento.

    Problemas en el procesamiento del lenguaje
    natural

    Debido a que el Procesamiento del Lenguaje Natural tiene
    por objetivo fundamental la comprensión del lenguaje
    natural el hecho de que se presenten en textos y expresiones
    habladas elementos ambiguos constituye uno de los problemas que
    se fundamentales que deben ser resueltos racionalmente. El
    problema de la ambigüedad surge cuando una expresión
    hablada o escrita posee más de un significado o interpretación.

    Ejemplo 1

    "Pedro vio a Luisa, con la
    computadora"

    "Pedro vio a Luisa con la
    computadora"

    Ejemplo 2

    Otro ejemplo de ambigüedad podría estar
    relacionado con las diversas alternativas de escribir la
    oración:

    "Determine y Analice los errores del texto con
    estructuras complejas",

    posiblemente, sería más correcto
    escribir:

    • Determine y analice los errores del texto que tiene
      estructuras complejas
    • Determine y analice en el texto los errores que
      poseen estructuras complejas
    • Determine y analice a través de estructuras
      complejas los errores en el texto

    Los problemas de ambigüedad también se
    presentan en la traducción automática, la
    detección y corrección de errores
    ortográficos y gramaticales, etc.

    Por ejemplo, para traducir las oraciones como

    John took a cake from the table and ate it.

    John took a cake from the table and cleaned
    it.

    se necesita realmente entender qué hizo John:
    tomó un pastel de la mesa y ¿lo comió o la
    comió? ¿lo limpió o la limpió? Al
    revés, para traducir el texto Juan le dio a María
    un pastel. Lo comió, hay que elegir entre las variantes He
    ate it, She ate it, It ate him, She ate him, etc.

    Generación
    de textos

    El complemento natural a la capacidad de entender el
    lenguaje es el segundo componente de la
    comunicación, que es la capacidad de producir el texto
    o bien el habla. En cierto grado es una tarea más simple
    que la comprensión, ya que por lo menos la computadora
    puede elegir las expresiones que sabe producir.

    Uno podría pensar que para la generación
    de texto sólo es suficiente saber las reglas de
    gramática, es decir, saber palabras de cuales
    números, tiempos y géneros hay que usar en la
    oración y en que orden ponerlas. Sin embargo, hay algunos
    problemas en la generación de texto. Uno reside en la
    necesidad de elegir las palabras y expresiones que «se
    usan» en el contexto dado. Por ejemplo, hay que saber que
    para expresar la idea ‘muy, mucho’, hay que usar
    palabras diferentes: té cargado, voz alta, borracho como
    una uva, trabajar duro.

    El otro problema es que el texto producido con los
    métodos de fuerza bruta
    es aburrido, incoherente y a veces no entendible. Hay que saber
    en qué ocasiones se deben usar los pronombres y en
    qué otras las palabras completas, en qué ocasiones
    hay que explicar, de qué se trata la oración y en
    qué otras es entendible para el lector. Esto se refiere a
    los métodos de la nombrada planificación textual.

    El propósito del lenguaje es transferir
    conocimientos de una persona a otra. El conocimiento es una
    estructura compleja, multidimensional, que usualmente se
    representa como una red, o grafo, de conceptos.
    Pero el modo que usamos para transferir el conocimiento es
    unidimensional: en cada momento sólo podemos decir un
    sonido, una
    letra. Entonces, el trabajo del
    lenguaje es codificar el conocimiento multidimensional en una
    cadena de letras, y después, en el cerebro del escuchante
    o el lector, decodificar esta secuencia en el conocimiento
    original.

    El lenguaje es una estructura muy compleja.
    Afortunadamente, el codificador y decodificador funcionan en
    pasos, construyendo las estructuras más complejas de
    ladrillos más simples:

         Palabras de
    letras,

         Oraciones de
    palabras,

         Textos de
    oraciones.

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    En cierta forma un programa de PLN, simula los
    mecanismos de comunicación que se establecen entre dos
    humanos.

    Gramáticas
    Formales

    Hay una clase de
    sistemas de generación de interés primario para los
    Informáticos – ellos son los sistemas conocidos como
    Gramáticas.

    El concepto de Gramática fue originalmente
    formalizado por los lingüistas en su estudio de los
    lenguajes naturales

    Los lingüistas tenían relación no
    sólo con la definición precisa de lo que es o no es
    una sentencia u oración válida de un lenguaje, sino
    también de dar o suministrar descripciones estructurales
    de las sentencias u oraciones

    Uno de estos objetivos
    estuvo relacionado con el desarrollo de una Gramática
    Formal capaz de describir la lengua inglesa

    Se podría pensar, que si por ejemplo, se tiene
    una gramática formal para describir la lengua inglesa,
    podríamos usar el computador en
    los campos que necesiten una comprensión de la lengua
    inglesa

    Tal uso puede ser la traducción de de lenguajes o
    la solución computacional de problemas de
    enunciados

    Hasta el momento actual, este objetivo sigue siendo en
    gran parte irrealizable

    Aun no se dispone de una gramática bien definida
    de la lengua inglesa.

    Además, existen contradicciones sobre que tipo de
    gramática formal seria capaz de describir al idioma
    Ingles.

    Sin embargo, han sido alcanzados mejores resultados en
    la descripción de los lenguajes de computación

    Por ejemplo, la Forma Backus – Naur usada para
    describir el lenguaje de programación ALGOL es una
    "gramática de libre contexto ", esto es, un tipo de
    gramática con la que tendremos relación en esta
    disciplina.

    Existe costumbre de realizar diagramas o
    análisis (parsing) de una sentencia u oración
    inglesa

    Por ejemplo, la sentencia u oración :"The little
    boy ran quickly "

    se analiza (parsed) por medio de la notación de
    que la oración consiste de:

    nome (noun phrase):

    "The little boy"

    seguido de la frase verbal (verb phrase)

    "ran quickly"

    El nombre puede ser decompuesto en nombre singular "boy"
    modificado por dos adjetivos:

    "The" y

    "little"

    La frase verbal puede ser decompuesta, a su vez, en un
    verbo singular

    "ran"

    modificado por el adverbio

    "quickly"

    Esta estructura de la oración es indicada en el
    siguiente diagrama.

    Figura Árbol Sintáctico de una
    oración

    Se reconoce la estructura de la sentencia u
    oración como gramaticalmente correcta.

    Si se tiene un conjunto completo de negras para analizar
    (parsing) todas las oraciones en idioma Ingles, entonces
    podríamos tener una técnica para determinar si la
    oración es o no gramaticalmente correcta. Sin embargo, tal
    conjunto de negras realmente no existe. En parte, esto se debe a
    que no existen reglas claras y precisas para determinar lo que
    constituye una oración:

    <sentencia u oracion> ® < nombre> <frase
    verbal>

    <frase verbal> ® <adjetivo> <frase
    nominativa>

    <frase nominativa> ® <adjetivo> <nombre
    singular>

    <frase verbal> ® <verbo singular>
    <adverbio>

    <adjetivo> ® The

    <adjetivo> ® little

    <nombre singular> ® boy

    <verbo singular> ® ran

    <adverbio> ® quickly

    La flecha indica que el elemento de la izquierda de la
    flecha puede generar los elementos colocados en el lado derecho
    de la flecha. Note que se ha encerrado entre corchetes los
    nombres de las partes de las oraciones, tales como, nombre,
    verbo, frase verbal, etc., para evitar confusión con las
    palabras en Ingles y las frases "nombre", "frase verbal", etc. Se
    puede notar que no es sólo posible verificar las oraciones
    por su correlación gramatical, sino también es
    posible generar oraciones correctas gramaticalmente. Para ello se
    comienza con la cantidad <oración> y se sustituye
    <oración> por <frase nominativa> seguida de
    <frase verbal> . Luego se selecciona una de las dos reglas
    para <frase nominativa> y se aplica, y así
    sucesivamente , hasta que ninguna otra aplicación
    adicional de las negras sea posible. En esta forma, un
    número infinito de oraciones puede ser derivada –
    esto es, cualquier oración consistente de una cadena de
    ocurrencias de "the" y "little" seguido por "boy ran quickly" tal
    como "little the the boy ran quickly" puede generarse. La
    mayoría de las oraciones no tiene sentido, son
    gramaticalmente correctas en un sentido amplio.

    Definiciones
    empleadas en las gramáticas formales.

    Alfabeto: Un alfabeto es un conjunto arbitrario,
    pero finito, de símbolos.

    Por ejemplo, el código
    de maquina se basa en el alfabeto binario A1={0,1};
    otros ejemplos son A2{0,1,2,3,4,5,6,7,8,9},
    A3{+,-,*,/,} etc.

    Símbolos: Los elementos del vocabulario
    (alfabeto) de un lenguaje formal se denominan símbolos; en
    el caso de los lenguajes naturales los conocemos como
    palabras.

    Componente Léxico: las ocurrencias
    múltiples de símbolos (o palabras) se denominan
    componentes léxicos.

    Frase: Una frase es una secuencia de
    símbolos.

    Gramática (sintaxis): La gramática o la
    sintaxis de un lenguaje define si una secuencia arbitraria de
    símbolos es correcta, es decir, si es una frase
    significativa. Decimos que una frase correcta será
    aceptada por el lenguaje.

    Cadena: Sentencia (finita) de elementos de un cierto
    conjunto (alfabeto).

    Producción: Las reglas para la sustitución
    de cadenas se denominan producciones.

    Símbolos terminales: Son los símbolos que
    realmente aparecen en una frase.

    Símbolos no terminales: Los símbolos no
    terminales deben ser definidos por otras producciones o reglas ;
    es decir, también aparecen en el lado izquierdo de las
    producciones. Los símbolos no terminales son variables
    sintácticas.

    Vocabulario = alfabeto: Al igual que los lenguajes
    naturales, los lenguajes formales se basan en un vocabulario
    específico, a saber, los elementos del
    lenguaje.

    Forma de Backus – Naur

    La forma de Backus – Naur fue creada para definir
    la estructura del lenguaje de programación
    ALGOL60.

    Tabla Forma Backus – Naur

     

     

     

    Símbolo

    Significado

    "se define como"

    fin de definición

    |

    "or", alternativa

    [x]

    Una o ninguna ocurrencia de x

    {x}

    Número arbitrario de ocurrencias
    de

    x (0,1,2,…)

    (x | y)

    Selección (x o y)

     

    La forma Backus – Naur es un
    metalenguaje, o sea, un lenguaje con el que se pueden
    describir otros lenguajes. Hay algunos dialectos de la
    notación BNF. En la tabla se presentan algunos de los
    símbolos más comunes de la BNF. Con esa
    notación y los símbolos terminales.

    T= {+,-, 0,1,2,3,4,5,6,7,8,9}

    Además de los símbolos no
    terminales

    N= {int, unsigned_int, digit}

    Podemos definir los enteros con las siguientes reglas
    (producciones) BNF:

    int à [+ | – ] unsigned_int

    unsigned_int à digit unsigned_int
    digit.

    digit à 0|1|2|3|4|5|6|7|8|9|

    La primera regla define un entero como un entero sin
    signo mas un signo inicial. Este signo puede estar ausente o ser
    "+" o "-". La segunda regla indica que la notación BNF
    permite definiciones recursivas.

    Existe una descripción formal de un lenguaje si
    existe un número finito de reglas BNF que permiten derivar
    cualquier frase del lenguaje. En este aspecto, el conjunto finito
    de reglas anterior es una descripción formal del conjunto
    infinito de los enteros.

    Conclusiones

    El procesamiento del lenguaje natural tiene como
    objetivo fundamental lograr una comunicación
    maquina-humano similar a la comunicación
    humano-humano.

    El empleo del lenguaje le permite al hombre trasmitir
    sus conocimientos, sentimientos, sensaciones, emociones, y
    estados de ánimo

    A lo largo de la historia los lenguajes naturales han
    ido evolucionando, de forma paralela al desarrollo y evolución de la especie humana.

    Han sido varios los sistemas informáticos
    inteligentes que se han desarrollado que emplean el procesamiento
    del lenguaje natural.

    Bibliografía

    1.      Adolfo
    Guzmán-Arenas. Hallando los temas principales en un
    artículo en español. Soluciones
    Avanzadas. Vol. 5, No. 45, p. 58, No. 49, p. 66, 1997.

    2.      Adolfo
    Guzmán-Arenas. Finding the main themes in a Spanish
    document. Journal Expert Systems with Applications, Vol. 14,
    No. 1/2. Jan/Feb 1998, pp. 139-148.

    3.      I. A. Bolshakov, A.
    Gelbukh. Lexical functions in Spanish. CIC-98 – Simposium
    Internacional de computación, November 11 – 13, 1998,
    México
    D.F., pp. 383 – 395.

    4.      Alexander Gelbukh.
    Using a semantic network for lexical and syntactic
    disambiguation. Proc. of Simposium Internacional de
    Computación: Nuevas Aplicaciones e Innovaciones
    Tecnológicas en Computación, November 1997,
    México.

    5.      A.Gelbukh, I.
    Bolshakov, S. Galicia-Haro. Statistics of parsing errors can help
    syntactic disambiguation. CIC-98 – Simposium Internacional de
    Computación, November 11 – 13, 1998, México D.F.,
    pp. 405 – 515.

    6.      I.A. Bolshakov, A.F.
    Gelbukh, S.N. Galicia-Haro. Syntactical managing patterns for the
    most common Spanish verbs. CIC’97, Nuevas Aplicaciones e
    Innovaciones Tecnológicas en Computación, Simposium
    Internacional de Computación, 12-14 de noviembre, pp. 367
    – 371, 1997, CIC, IPN, México D.F.

    7.      I. A. Bolshakov, A.
    Gelbukh, S. Galicia Haro, M. Orozco Guzmán. Government
    patterns of 670 Spanish verbs. Technical report. CIC, IPN,
    1998.

    8.      Manuel Montes y
    Gómez, Aurelio López López, Alexander
    Gelbukh. Text Mining as a Social Thermometer. Text Mining
    Workshop (forthcoming) at IJCAI'99, Stockholm, August,
    1999.

    9.      A. Gelbukh, S.
    Galicia-Haro, I.Bolshakov. Three dictionary-based techniques of
    disambiguation. TAINA-98, International Workshop on Artificial
    Intelligence, CIC-IPN, México D.F., pp. 78 –
    89.

    10.  Adolfo Guzmán Arenas.
    Colaboración Dirigida entre Agentes con Propósito.
    Memorias del
    Congreso Internacional de Computación CIC-99, CIC, IPN,
    1999, México.

    Lic Ernesto González Díaz
    MsC.

    Licenciado en Matemática

    Master en Ciencias
    Cibernéticas

    Profesor de Inteligencia Artificial

    Universidad de las Ciencias Informáticas La
    Habana Cuba

    Categoría: Informática y Computación

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter