Comparación de Modelos Basados en Técnicas de Aprendizaje

Partes: 1, 2, 3

Introducción
Confiabilidad
Algoritmos de aprendizaje automatizado y generación de
reglas
Experimentos
Conclusiones
Referencias
Anexos

Título original: Comparación
de Modelos
Basados en Técnicas
de Aprendizaje de
Máquinas para la Determinación de
Expresiones Aproximadas de Confiabilidad

RESUMEN

El presente trabajo de
investigación está orientado a la
obtención de expresiones aproximadas de confiabilidad
(EAC) a través de dos métodos de
generación de reglas, basados en técnicas de
aprendizaje de máquinas, a partir de un conjunto de
datos tomados
de manera aleatoria de una muestra, los
cuales están separados en dos grupos, los datos
de entrenamiento y
los de prueba. El primer grupo se
utiliza para entrenar el modelo y
obtener un conjunto de reglas, a partir de las cuales se genera
la EAC del modelo y el segundo es empleado para evaluarlo.

El primer método de
clasificación, es el de Árboles de Decisión
representado por una estructura de
"nodos" y "hojas", que simbolizan un conjunto de decisiones,
donde los datos de entrenamiento se dividen de manera recursiva
mediante la utilización de métodos
heurísticos. Cada "nodo" comienza con dos ramas
correspondiente a dos estados diferentes, mientras que las
"hojas" de los nodos definen la "clase" que
determina el estado de
la red.

El segundo método utilizado es el denominado "Hamming
Clustering", que consiste en seleccionar de manera
aleatoria, una muestra de un conjunto de datos de
entrenamiento en cada iteración para generar un grupo de
"clusters" de
la misma clase, operativo o fallado, y agruparlos bajo el
criterio de la Distancia de "Hamming".

De acuerdo con los criterios de evaluación
definidos, podemos concluir, que ambos métodos producen
buenas aproximaciones de las expresiones de confiabilidad. Sin
embargo se debe resaltar que aunque el método de "Hamming
Clustering" supera la aproximación obtenida con respecto a
los "Árboles de Decisión", las reglas producidas
por este implican la conversión a la forma excluyente. Con
el método de "Árboles de Decisión", las
reglas obtenidas permiten la construcción directa de la EAC.

INTRODUCCIÓN

El propósito de este trabajo es evaluar la
confiabilidad de un sistema [1] a
partir de la probabilidad
de operación o falla de los elementos que lo conforman.
Uno de los métodos utilizados para este fin, es la
obtención de la Expresión de Confiabilidad (EC)
[4]. Para ello se emplea el Álgebra Booleana [12], la
topología del sistema a estudiar y un
criterio de operación. Esta combinación permite
definir la Función de
Estructura (FES) del sistema, a través de una
expresión binaria que sintetiza la operación o
falla del mismo, en función de los estados de los
elementos que lo constituyen. La expresión binaria
posteriormente se transforma a una formulación
equivalente, denominada suma de productos
mutuamente excluyentes que permite, finalmente, la
determinación de la EC [2].

La gran mayoría de los algoritmos
desarrollados para obtener la EC, suponen que el criterio de
operación a ser satisfecho es el de continuidad [6]. Sin
embargo, en diversos sistemas reales
tales como redes de comunicación o sistemas de distribución (agua, gas, petróleo, entre otros), no basta con el
criterio de continuidad y se requieren condiciones adicionales
tales como flujo manejado entre el origen y el destino. En estos
casos, la determinación de la FES es mucho más
complicada.

Los métodos referenciados en la literatura son desde el
punto de vista computacional complejos, lo que da origen a que
los investigadores desarrollen algoritmos aproximados.

En este trabajo de investigación se desarrolla una
aproximación de la Expresión de Confiabilidad (EC)
de un sistema, a través del uso de métodos de
"Generación de Reglas" basados en técnicas de
"Aprendizaje de Máquinas" (AM) [19] [21].

La idea básica es que a partir de un conjunto de datos
iniciales denominados conjunto de datos de entrenamiento, se
"entrena" a un procedimiento
computacional con el objetivo de
extraer relaciones, que permitan definir si el sistema
está operativo o no. Usualmente estas relaciones se
presentan como reglas de la forma if-then, por ejemplo [4]:
"Si A está operativo y B está operativo, entonces
el sistema está operativo".

Las reglas generadas constituyen una aproximación a la
FES que posteriormente pueden ser convertidas a una
Expresión Aproximada de Confiabilidad (EAC).

Organización de la tesis

Este trabajo está conformado por cuatro
capítulos

1. El primer
capítulo contiene conceptos sobre el marco de la
investigación, tales como la teoría
de confiabilidad, la descripción del proceso de los
métodos para la generación de reglas y el aprendizaje
automatizado [21].

2. El segundo
capítulo describe en detalle los dos métodos a ser
comparados. El primer método, es un método
clásico dentro del AM y es el denominado "Árbol de
Decisión" (AD). El segundo método es el denominado
"Hamming Clustering" (HC), un método reciente de
generación de reglas, utilizando como criterio de
agrupamiento la Distancia de "Hamming", [25]

Partes: 1, 2, 3

Página siguiente