Monografias.com > Computación > Programación
Descargar Imprimir Comentar Ver trabajos relacionados

Fundamentos de minería de datos. Clustering




Enviado por Pablo Turmero



Partes: 1, 2

    Monografias.com

    1
    Clustering
    “Sinónimos” según el contexto…

    Clustering (IA)

    Aprendizaje no supervisado (IA)

    Clasificación (Estadística)

    Ordenación (Psicología)

    Segmentación (Marketing)

    Introducción
    Similitud
    Métodos
    K-Means
    Jerárquicos
    Densidad
    Otros
    Subspace clustering
    Validación
    Bibliografía

    Monografias.com

    2
    Clustering

    Objetivo Agrupar objetos similares entre sí que sean distintos a los objetos de otros agrupamientos [clusters].

    Aprendizaje no supervisadoNo existen clases predefinidas

    Los resultados obtenidos dependerán de:
    El algoritmo de agrupamiento seleccionado.
    El conjunto de datos disponible
    La medida de similitud utilizada para comparar objetos.

    Introducción
    Similitud
    Métodos
    K-Means
    Jerárquicos
    Densidad
    Otros
    Subspace clustering
    Validación
    Bibliografía

    Monografias.com

    3
    Clustering

    Encontrar agrupamientos de tal forma que los objetos de un grupo sean similares entre sí y diferentes de los objetos de otros grupos:
    (Gp:) Maximizar distanciainter-cluster

    (Gp:) Minimizar distanciaintra-cluster

    Monografias.com

    4
    Clustering
    Aplicaciones
    Reconocimiento de formas.
    Mapas temáticos (GIS)
    Marketing: Segmentación de clientes
    Clasificación de documentos
    Análisis de web logs (patrones de acceso similares)

    Aplicaciones típicas en Data Mining:
    Exploración de datos (segmentación & outliers)
    Preprocesamiento (p.ej. reducción de datos)

    Monografias.com

    5
    Clustering
    ¿Cuál es la forma natural de agrupar los personajes?

    Hombres
    vs.
    Mujeres

    Monografias.com

    6
    Clustering
    ¿Cuál es la forma natural de agrupar los personajes?

    Simpsons
    vs.
    Empleados
    de la escuela
    de Springfield

    Monografias.com

    7
    Clustering
    ¿Cuál es la forma natural de agrupar los personajes?

    ¡¡¡ El clustering es subjetivo !!!

    Monografias.com

    8
    Medidas de similitud
    0.23
    3
    342.7
    Peter
    Pedro

    Monografias.com

    9

    Usualmente, se expresan en términos de distancias:

    d(i,j) > d(i,k)
    nos indica que el objeto i es más parecido a k que a j

    La definición de la métrica de similitud/distanciaserá distinta en función del tipo de dato yde la interpretación semántica que nosotros hagamos.

    En otras palabras, la similitud entre objetos es subjetiva.
    Medidas de similitud

    Monografias.com

    10
    Medidas de similitud
    (Gp:) ¿Cuántos agrupamientos?

    (Gp:) ¿Cuatro?

    (Gp:) ¿Dos?

    (Gp:) ¿Seis?

    Monografias.com

    11
    Medidas de similitud
    Atributos continuos
    Usualmente, se “estandarizan” a priori:

    Desviación absoluta media:

    z-score (medida estandarizada):

    Monografias.com

    12
    Métricas de distancia
    Distancia de Minkowski

    Distancia de Manhattan (r=1) / city block / taxicab

    Distancia euclídea (r=2):

    Distancia de Chebyshev (r??) / dominio / chessboard

    Medidas de similitud

    Partes: 1, 2

    Página siguiente 

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter