Monografias.com > Computación > General
Descargar Imprimir Comentar Ver trabajos relacionados

Recuperación de Datos




Enviado por julio vargas



Partes: 1, 2

  1. Introducción
  2. Como se lleva a
    cabo el proceso de búsqueda de
    información
  3. Fundamentos de
    recuperación de información
  4. Fundamentos de
    recuperación de información
  5. Sistemas o
    técnicas para buscar
    información
  6. Recomendaciones
  7. Conclusión
  8. Bibliografía

Introducción

Los sistemas de búsqueda han adquirido una gran
importancia en el uso cotidiano de los ordenadores hasta el punto
de que realizar una consulta en un buscador es la acción
más frecuente, tras el envío de un correo
electrónico. Sin embargo, la búsqueda y
recuperación de información textual tienen
asociadas una serie de problemas todavía no resueltos
satisfactoriamente. Algunos de estos problemas provienen de la
ambigüedad y la falta de estructura propias del lenguaje
natural. En parte cuando la información ya no la tenemos a
nuestro alcance por diferentes motivos acudimos a muchas
técnicas para recuperar nuestra valiosa
información.

OBJETIVO GENERAL

Reconocer las distintas formas aplicadas a la
recuperación de información.

Como se lleva a cabo
el
proceso de búsqueda de información

El proceso de recuperación se lleva a cabo
mediante consultas a la base de datos donde se almacena la
información estructurada, mediante un lenguaje de
interrogación adecuado. Es necesario tener en cuenta los
elementos clave que permiten hacer la búsqueda,
determinando un mayor grado de pertinencia y precisión,
como son: los índices, palabras clave, tesauros y los
fenómenos que se pueden dar en el proceso como son el
ruido y silencio documental. Uno de los problemas que surgen en
la búsqueda de información es si lo que recuperamos
es "mucho o poco" es decir, dependiendo del tipo de
búsqueda se pueden recuperar multitud de documentos o
simplemente un número muy reducido. A este fenómeno
se denomina Silencio o Ruido documental.

Fundamentos de
recuperación de información

Según el modelo más aceptado actualmente,
la recuperación de información consiste en un
proceso en el que intervienen tres elementos:

  • una colección de ítemes de
    información, tales como documentos, que están
    registrados en un depósito de información (por
    ejemplo en una base de datos),

  • una serie de preguntas que traducen las necesidades
    de información de los usuarios y,
    finalmente,

  • una función de comparación
    documentos/preguntas que genera como salida documentos
    relevantes (véase la fig. 1). Recuperar
    información, entonces consiste en buscar los
    documentos que exhiben un mayor parecido con la
    pregunta.

  • Monografias.com

    La hipótesis subyacente en el modelo anterior
    es que una forma de juzgar la relevancia de un documento es
    medir su grado de similitud con la pregunta, y que la forma
    de representar ambas entidades (preguntas y documentos) es
    mediante el uso de información textual, aunque las
    entidades en sí mismas no sean textuales.

    En general, para comparar el grado de parecido entre
    dos entidades es necesario identificar algún grupo de
    propiedades medibles y después establecer un
    procedimiento que permita calcular cuántas de
    éstas propiedades comparten ambas
    entidades.

    Sistemas o
    técnicas para buscar
    información

    1. Sistemas de recuperación de
    lógica difusa

    En el modelo de lógica difusa los autores no
    asignan los grados de pertenencia de los documentos a los
    términos. Además, la aplicación de
    modelos borrosos es idónea para solucionar los
    problemas de incompletitud e imprecisión a la hora de
    indexar un documento.

    En la equiparación probabilística, el
    cálculo último devuelto sobre la probabilidad
    de que los términos de los documentos sean
    potencialmente relevantes a una pregunta, está
    contenida en los documentos relevantes y en los no
    relevantes. En la equiparación difusa, el
    cálculo se define basándose en el grado de
    pertenencia de los términos. La cuestión llega
    a ser tal, que el grado de confianza de que un documento
    contenga un término dado es relevante. Si ésto
    se usa para definir el grado de pertenencia, entonces este
    grado con respecto al conjunto de documentos relevantes,
    puede ser computado para cualquiera de los
    documentos.

    2. Técnica de ponderación de
    términos

    En la búsqueda unos criterios tienen
    más valor que otros, dependiendo de los intereses del
    usuario. Los documentos recuperados se encuentran en
    función del valor obtenido en la ponderación.
    El documento más pertinente de búsqueda
    sería aquel que tenga representado todos los
    términos de búsqueda y, además, el que
    más valor tenga repetidos más veces.

    3. Técnicas de clustering

    Partes: 1, 2

Página siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter