Minado de datos relacionales

2977 palabras 12 páginas
ISC

INGENIERÍA EN SISTEMAS COMPUTACIONALES

UNIDAD 4. MINADO DE DATOS RELACIONALES

ÍNDICE

Unidad 4 Minado de datos relacionales

4.1 Pre-procesamiento 3 4.2 reglas de asociación relacional 9 4.3 Árboles de decisión relacionales 13

Unidad 4 Minado de datos relacionales 4.1 Pre-procesamiento

PRE-PROCESAMIENTO DE DATOS Consiste en la preparación previa de los datos para ser usados por la construcción, entrenamiento y prueba de un modelo de red neuronal. Alguno de los problemas más comunes en la preparación de los datos es la mezcla de variables continuas y discretas. a) Debe hacerse
…ver más…
* La salida es producida en un rango estrictamente limitado. * Las funciones de activación son sensibles a estar en rangos limitados
(ejm.: sigmode)
El rango limitado de respuesta de la red y la información en forma numérica implica que la solución neuronal requiera de un preprocesamiento y un postprocesamiento. (Bishop, 1995).

Métodos más comunes de hacer pre-procesamiento:

Tal como se mostró a través de ejemplos en las páginas anteriores, los métodos más comunes de preparación de datos son:

* Escalamiento: transformación del contenido de las variables a un rango 0,1. * Análisis de variables nominales: transformación de un valor categórico a un valor numérico.

MÉTODOS DE PREPROCESAMIENTO DE DATOS

Como métodos alternativos y con mayor consistencia de análisis, surgen técnicas emergentes que de algún modo proveen medios para la preparación y escogencia de los datos.
Sin embargo, el piso estadístico como fuente de afirmación teórica para la selección y preparación de los datos, sigue siendo el recurso más idóneo de pre-procesamiento.

1. Data mining
- Exploración de datos para la búsqueda de: patrones consistentes relación sistemática entre variables
- No identifica las relaciones específicas entre las variables
- El proceso consiste de:
Exploración
Construcción del modelo
Definición de patrones

2. Data warehousing
Organización de datos multivariantes para facilitar futuras recuperaciones

Documentos relacionados

  • Estadistica descriptiva tema i
    6658 palabras | 27 páginas