Monografias.com > Computación > Programación
Descargar Imprimir Comentar Ver trabajos relacionados

Procesamiento del lenguaje natural para recuperar información



Partes: 1, 2

  1. Resumen
  2. Introducción
  3. Problemas para el procesamiento del lenguaje
    natural
  4. Aplicaciones del procesamiento del lenguaje
    natural
  5. El
    procesamiento del lenguaje natural para la
    recuperación de información
    textual
  6. Campos
    de investigación relacionados
  7. Conclusiones
  8. Referencias

Resumen.

El presente trabajo tiene por objeto hacer una
revisión de las principales características de las
técnicas de procesamiento del lenguaje natural,
centrándose en su aplicación a la
recuperación de información y áreas afines.
Se establece una comparación entre el procesamiento
lingüístico y el procesamiento estadístico del
lenguaje natural.

Palabras claves: Procesamiento del lenguaje
natural, lenguajes, recuperación de la
información.

1.
Introducción

El Procesamiento del Lenguaje Natural es una disciplina
con una larga trayectoria. Nace en la década de 1960, como
subárea de la Inteligencia Artificial y la
Lingüística, con el objeto de estudiar los problemas
derivados de la generación y comprensión
automática del lenguaje natural.

En sus orígenes, sus métodos tuvieron gran
aceptación y éxito, no obstante, cuando sus
aplicaciones fueron llevadas a la práctica, en entornos no
controlados y con vocabularios genéricos, empezaron a
surgir multitud de dificultades.

En los últimos años, las aportaciones que
se han hecho desde este dominio han mejorado sustancialmente,
permitiendo el procesamiento de enormes cantidades de
información en formato texto con un grado de eficacia
aceptable. Muestra de ello es la aplicación de estas
técnicas como una componente esencial en los motores de
búsqueda Web, en las herramientas de traducción
automática, o en la generación automática de
resúmenes. [Strzalkowski, 1999]

2. Problemas para
el procesamiento del lenguaje natural.

El Lenguaje natural es el medio que utilizamos de manera
cotidiana para establecer nuestra comunicación con las
demás personas. La riqueza de sus componentes
semánticas da a los lenguajes naturales su gran poder
expresivo y su valor como una herramienta para razonamiento
sutil.

El lenguaje natural, posee propiedades que merman la
efectividad de los sistemas de recuperación de
información textual:

  • Son desarrollados por enriquecimiento progresivo
    antes de cualquier intento de formación de una
    teoría.

  • La variación lingüística.
    Es la posibilidad de utilizar diferentes palabras o
    expresiones para comunicar una misma idea.

  • La ambigüedad lingüística.
    Se produce cuando una palabra o frase permite más de
    una interpretación.

Las dos últimas propiedades inciden en el proceso
de recuperación de información de forma distinta.
La variación lingüística provoca el silencio
documental, es decir la omisión de documentos relevantes
para cubrir la necesidad de información, ya que no se han
utilizado los mismos términos que aparecen en el
documento. En cambio, la ambigüedad implica el ruido
documental, es decir la inclusión de documentos que no son
significativos, ya que se recuperan también documentos que
utilizan el término pero con significado diferente al
requerido. Estas dos características dificultan
considerablemente el tratamiento automatizado del lenguaje.
[Pedraza-Jiménez, 2007]

Ejemplos:

Deja la comida que sobre, sobre la mesa de la cocina,
dijo llevando el sobre en la mano.

La misma palabra es utilizada con diferentes
significados.

3. Aplicaciones
del procesamiento del lenguaje natural

Las aplicaciones del Procesamiento de Lenguajes
Naturales son muy variadas, ya que su alcance es muy grande,
algunas de estas son:

– Traducción automática: se refiere
más que nada a la traducción correcta de un
lenguaje a otro, tomando en cuenta lo que se quiere expresar en
cada oración, y no solo palabra por palabra. Una
aproximación a este tipo de traductores es el
Babylon.

– Extracción de Información y
Resúmenes: Los nuevos programas, deben tener la capacidad
de crear un resumen de un documento basándose en los datos
proporcionados, realizando un análisis detallado del
contenido y no sólo truncando las primeras líneas
de los párrafos.

– Resolución cooperativa de problemas: La
computadora debe tener la capacidad de cooperar con los humanos
para la solución de problemas complejos, proporcionando
datos e información, incluyendo también, la demanda
de información por parte del ordenador al usuario,
debiendo existir una excelente interactividad entre el usuario y
el ordenador.

– Tutores inteligentes: Esta aplicación, viene
siendo más académica, ya que se refiere a la
enseñanza asistida por computadora, el ordenador debe
tener la capacidad de evaluar al educando y de adaptarse a cada
tipo de alumno.

– Reconocimiento de Voz: Esta aplicación ha
obtenido éxito en la actualidad, ya que las computadoras
de hoy ya tienen esta característica, el reconocimiento de
voz puede tener dos posibles usos: para identificar al usuario o
para procesar lo que el usuario dicte, existiendo ya programas
comerciales, que son accesibles por la mayoría de los
usuarios, ejemplo: ViaVoice.

Partes: 1, 2

Página siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter