- Resumen
- Necesidad de la
estandarización de direcciones
postales - Resultados del estudio realizado
a las direcciones postales - Definición
de los HMM internos - Conclusiones
- Bibliografía
Resumen
En este trabajo se
explican los resultados de la caracterización de las
direcciones postales
almacenadas en una base de datos
de una organización empresarial. Se propone una
estructura
para las direcciones postales que contiene los elementos
necesarios para posibilitar una segmentación más ajustada a los
intereses de la
organización estudiada.
Se propone un Modelo Oculto
de Markov externo para las direcciones postales de esa
organización, así como los Modelos
Ocultos de Markov internos para cada uno de los elementos que
componen la estructura de una dirección postal. La totalidad del estudio
realizado representa un avance en la configuración de un
procedimiento
para segmentar correctamente las direcciones, como paso previo
para conformar con estas un Almacén de
Datos
confiable, eficiente y eficaz.
Palabras clave: Limpieza de datos, Modelos
Ocultos de Markov, HMM.
La estandarización de direcciones postales es una
necesidad para cualquier organización, sobre todo para
aquellas que tienen un alto número de clientes,
usuarios, estudiantes, etc. En el caso particular de la
organización que es motivo de este estudio, las
direcciones postales de sus clientes se emplean para:
- La distribución de las facturas (cuentas a
cobrar) a domicilio y a otras organizaciones. - El estudio de la densidad de
clientes por área geográfica, para elaborar
planes para nuevas inversiones
y la instalación de nuevos servicios. - La instalación de nuevos servicios y la
atención a las reclamaciones e
interrupciones del servicio. - La realización de estudios de mercado,
planes de inversiones y presupuestos. - La realización de gestión de venta.
- Las visitas a clientes morosos o deudores de sus
facturas.
De todo lo anterior se desprende que para esta
organización es de vital importancia tener una lista de
direcciones postales limpia y normalizada, además
segmentada en sus elementos, para poder
utilizarlas con mayor eficiencia.
El estudio realizado por la autora de este trabajo a una
muestra
importante de las direcciones postales almacenadas en la base de
datos de la organización en cuestión, llevó
a dos resultados significativos:
- La propuesta de una estructura única para
todas las direcciones almacenadas. - El resumen de las características de cada uno
de los elementos que componen la estructura
propuesta.
La propuesta de estructura para las direcciones postales
está conformada por los siguientes elementos:
Dirección::= [<Calle>] [<Km>]
[<Casa>] [<Entre Calle
1><y/e><Entre Calle 2>] [<Esquina>]
[<Edificio>] [<Piso>] [<Escalera>]
[<Apartamento>] [<Reparto>] [<Municipio>]
[<Zona Postal>] [<Código Postal>]
[<Provincia>]
<Calle>::= [<Prefijo de calle>]
<Secuencia de identificadores> [<Punto
Cardinal>]
<Prefijo de calle>::=
Calle | Avenida |
Carretera | Camino |
Callejón
Página siguiente |