- 1.
Abstract - 2.
Introducción
3. Minería de los datos (data
mining)
5. Reglas de asociación
6. Solución al problema
7. Conclusiones y trabajos futuros
8. Referencias
1. Abstract
Los weblogs son
sitios web en los que
uno o varios autores publican sus opiniones sobre temas de
actualidad. Estos sitios web suelen actualizarse varias veces al
día, y los buscadores no
suelen contener actualizados sus índices con los
últimos cambios. En este artículo proponemos las
reglas de asociación como medio para recomendar a los
lectores de un weblog otros weblogs con temas relacionados
partiendo del resultado de una encuesta.
Palabras
clave: · comunidades
virtuales · entornos
virtuales · gestión del
conocimiento · hipertexto/hipermedia · sociedad del
conocimiento
2. Introducción
La información y los servicios que
Internet y la
World Wide Web
(WWW) ofrece, han crecido vertiginosamente en los últimos
años. La WWW se ha convertido en un medio de comunicación indispensable para cerca de
mil millones (a)
de usuarios en todo el mundo.
Entre los servicios de comunicación que La
Red ofrece, uno
de los que está teniendo un mayor crecimiento
(b) son los
weblogs (abreviado blogs y traducido como
bitácoras (c)).
Los weblogs son sitios web en los que uno o varios
autores publican sus opiniones sobre temas de actualidad,
comentan otros sitios u opiniones de otros usuarios. Estos sitios
además, ofrecen un alto grado de interactividad con el
lector, ya que estos pueden publicar sus comentarios a las
opiniones de los autores.
Las bitácoras en español
más populares, como Blogalia, contienen miles de historias
y cada historia
decenas de comentarios. Navegar entre tanta información no
es tarea fácil, más cuando las bitácoras
suelen actualizarse varias veces al día, y los buscadores
genéricos (Google, Yahoo!,
Excite, Altavista, etc.) no suelen contener actualizados sus
índices con los últimos cambios. Otro inconveniente
de los sistemas de
búsqueda actuales son las búsquedas basadas en
palabras clave (keywords). Estos sistemas no
contienen información semántica por lo que la búsqueda de,
por ejemplo, la palabra "granada" dará como resultado una
lista de páginas sobre información turística
de la ciudad de Granada, otras con información sobre
explosivos y posiblemente otra lista que nos hable sobre
frutas.
Estos y otros inconvenientes motiva el estudio de nuevas
técnicas que generen mejores resultados en
la extracción de conocimiento
del web (web mining) y más concretamente en los
weblogs.
Este trabajo
está basado en la aplicación de las reglas de
asociación pertenecientes al grupo de
técnicas utilizadas en la minería de
datos (data
mining) para resolver el problema de extracción de
conocimiento de las bases de datos de
las bitácoras.
Pretendemos con la aplicación de las reglas de
asociación ofrecer al usuario de las bitácoras
información que puede serle de gran utilidad como los
autores que tratan los mismos temas que su autor preferido, los
temas que están más relacionados con sus temas
preferidos, o los enlaces que tienen relación con un
tema.
El trabajo está organizado en las siguientes
secciones: la introducción introduce al lector en el
problema, la sección weblogs pone en antecedentes
históricos a lector sobre este servicio de
Internet objeto de esta investigación, a continuación se
realiza un recorrido por las técnicas más
utilizadas del data mining. La sección web mining realiza
una revisión de las técnicas más utilizadas
en la minería del Web, posteriormente se tratan las reglas
de asociación y el algoritmo
Apriori, utilizado en este trabajo. Posteriormente
realizamos una descripción formal del problema y se
detallan las fases de la minería de datos llevadas a cabo
para llegar a la solución. Mas adelante se presentan los
resultados y por último detallamos las conclusiones y los
trabajos futuros.
Weblogs
Segun Dave Winer, creador de uno de los primeros weblogs
y uno de los que más tiempo lleva
funcionando en Internet Scripting News (d), los weblogs son "sitios web
actualizados frecuentemente que apuntan a artículos en
cualquier lugar de la Web, usualmente con comentarios. Un weblog
es un tipo de tour guiado por Internet con un guía
especializado. Hay muchos guías para elegir, cada uno
tiene su propia audiencia y suele existir camaradería
entre la gente que publica los weblogs, suelen crear links entre
sus weblogs formando todo tipo de estructuras,
grafos,
bucles, etc." (9)
Marcé Molist de El País, define los
weblogs como "sitios web donde uno o más autores publican
regularmente sus reflexiones, descubrimientos o cualquier otro
tipo de información que consideren interesante para sus
lectores". (11)
Con esto concluye nuestra pequeña
introducción a Internet, la WWW y los weblogs. Esperamos
que el lector tenga ahora un mayor conocimiento del lugar en el
que se centra nuestra investigación. En las siguientes
secciones introduciremos al lector en las técnicas de data
mining utilizadas.
Página siguiente |