Monografias.com > Turismo
Descargar Imprimir Comentar Ver trabajos relacionados

Análisis clúster aplicado al sector hotelero



Partes: 1, 2

  1. Concepto de análisis
    cluster
  2. Concepto de análisis cluster
    jerárquico
  3. Concepto de análisis cluster
    K-medias
  4. Algunas puntualizaciones de interés
    acerca del análisis cluster

Concepto de
análisis cluster

El análisis cluster (llámese
también análisis de conglomerados) es una
técnica multivariante que utiliza la información de
una serie de variables para cada sujeto u objeto y, conforme a
estas variables, se mide la similitud entre ellos. Una vez medida
la similitud, se agrupan en: grupos homogéneos
internamente y diferentes entre sí.

La idea conceptual básica de este tipo de
análisis, parte de suponer que en muchas ocasiones, un
solo individuo u objeto, constituye una unidad de
observación demasiado reducida. Se trata entonces de
agrupar a los sujetos originales (u objetos) en grupos, centrando
el análisis en esos grupos y no en cada uno de los
individuos (u objetos).

Debe aclararse que los resultados logrados para una
muestra, sólo sirven para ese diseño (su valor
atañe sólo a los objetivos del investigador). Se
habla de resultados en cuanto a: la elección de individuos
(u objetos), variables relevantes utilizadas, criterio de
similitud empleado, nivel de agrupación final elegido,
etc. Existen dos tipos de análisis cluster:

  • análisis cluster jerárquico

  • análisis cluster K-medias

Por último, resulta útil destacar que el
análisis cluster y el análisis discriminante aunque
parecen muy similares, realmente no lo son. El análisis
discriminante intenta explicar una estructura, y el
análisis cluster pretende determinarla.

Concepto de
análisis cluster jerárquico

El análisis cluster jerárquico, permite
aglomerar tanto casos como variables, y elegir entre una gran
variedad de métodos de aglomeración y medidas de
distancia. En éste se procede de forma jerárquica.
Es una técnica aglomerativa que comienza partiendo de los
elementos muestrales individualmente considerados, y va creando
grupos hasta llegar a la formación de un único
grupo o conglomerado, constituido por todos los elementos de la
muestra.

Concepto de
análisis cluster K-medias

El análisis cluster K-medias, es un método
de agrupación de casos que se basa en las distancias
existentes entre ellos en un conjunto de variables. Permite
procesar un número ilimitado de casos pero utilizando un
único método de aglomeración. Requiere,
además, que se proponga previamente el número de
conglomerados que se desea obtener.

Para muestras grandes, este método resulta
más aconsejable que el jerárquico.

Es importante señalar, que esta técnica de
aglomeración no permite agrupar variables a diferencia del
jerárquico.

Algunas
puntualizaciones de
interés acerca del análisis
cluster

En la matriz de coeficientes de distancia
euclídea al cuadrado (o cualquier otro tipo de medida de
distancia seleccionada), los coeficientes más elevados
responden a mayores distancias o mayor diferencia entre los casos
analizados. Por el contrario, coeficientes con más bajo
valor, corresponden a menores distancias o mayor parecido entre
dichos casos.

La lectura del gráfico de carámbanos
vertical, se realiza de abajo hacia arriba, de modo que la
última fila, corresponde al primer nivel de
agrupación de los casos, y la primera fila, al
último nivel. Siempre en el último nivel, quedan
agrupados todos los casos de la muestra en un solo
cluster.

Un cluster puede formarse a partir de dos casos en uno
solo, o añadiendo un caso a un multicluster ya existente,
o uniendo dos multicluster ya existentes.

En la tabla de aglomeraciones previstas, el valor del
coeficiente a cada nivel, ayuda a decidir cuántos clusters
pueden constituir la mejor solución para representar los
datos.

La lectura del dendograma se realiza de izquierda a
derecha donde las líneas verticales representan la
unión de dos clusters. La posición de la
línea vertical sobre la escala de valores de 0 a 25,
indica a qué distancia los clusters se han
unido.

Véase un ejemplo de análisis cluster
jerárquico.

Ejemplo 1:

En el polo turístico de Varadero, un grupo de
analistas de la Delegación del MINTUR, está
realizando un estudio que incluye diez instalaciones hoteleras.
Basándose en los datos recopilados de ocho variables que
han sido medidas en cada uno de los diez hoteles, el objetivo de
los miembros del grupo, consiste en agrupar dichas entidades
según su similitud o semejanza. Los datos se muestran a
continuación:

Variables:

  • % de ocupación

  • nivel de ingresos

  • cantidad de trabajadores

  • nivel de utilidades

  • nivel de gastos

  • cantidad de puntos de consumo de A+B

  • cantidad de habitaciones

  • gasto energético

Hoteles

%
ocupación

ingresos

trabajad

utilidad

gastos

punto

a+b

habitaci

gastener

Sirenis Abanico

de Coral

46

101564.00

560

2463.00

99101.00

7

566

24567.00

Meliá Estrella

de Mar

78

57890.00

315

1800.00

56090.00

6

870

10987.00

Iberostar Río

Azul

65

114362.00

643

3101.00

111261.00

7

698

45734.00

Riu Varadero

59

87765.00

389

2746.00

85019.00

9

547

10999.00

Tryp Palma

Real

74

103890.00

472

2834.00

101056.00

8

612

35667.00

Iberostar Playa

Azul

49

92345.00

518

1964.00

90381.00

8

846

24345.00

Paradisus Mariposa

Blanca

52

110321.00

589

946.00

109375.00

7

900

42567.00

Oasis Laguna

Azul

66

74678.00

471

3123.00

71555.00

7

583

21900.00

Sol Cayo

de Oro

91

98876.00

331

2680.00

96196.00

5

617

36889.00

Sandals Arenas

82

104564.00

470

1970.00

102594.00

6

712

41680.00

Solución:

Empleando el SPSS, sería:

En la imagen anterior, se observa la tabla
"Proximity Matrix" donde se muestran los coeficientes de
distancia euclídea al cuadrado, entre los distintos
hoteles de la muestra. Por ejemplo, la distancia o diferencia
mayor con un coeficiente igual a 44.317, es la existente entre
los hoteles Iberostar Río Azul y Meliá Estrella de
Mar. Por el contrario, los más próximos o
parecidos, son los hoteles Sol Cayo de Oro y Sandals Arenas con
un coeficiente igual a 4.745.

En la imagen anterior, se muestra el gráfico de
carámbanos o tabla "Vertical Icicle" donde se
puede ir determinando los diferentes clusters a cada nivel.
Obsérvese que el:

  • primer cluster está formado por los hoteles
    Sandals Arenas y Sol Cayo de Oro

  • segundo cluster: Tryp Palma Real e Iberostar
    Río Azul

  • tercer cluster: Oasis Laguna Azul y Riu
    Varadero

  • cuarto cluster: Iberostar Playa Azul y Sirenis
    Abanico de Coral

  • quinto cluster (primer multicluster): Tryp Palma
    Real, Iberostar Río Azul, Iberostar Playa Azul y
    Sirenis Abanico de Coral

  • sexto cluster (segundo multicluster): Oasis Laguna
    Azul, Riu Varadero, Tryp Palma Real, Iberostar Río
    Azul, Iberostar Playa Azul y Sirenis Abanico de
    Coral

  • séptimo cluster (tercer multicluster):
    Sandals Arenas, Sol Cayo de Oro, Oasis Laguna Azul, Riu
    Varadero, Tryp Palma Real, Iberostar Río Azul,
    Iberostar Playa Azul y Sirenis Abanico de Coral

  • octavo cluster (cuarto multicluster): Paradisus
    Mariposa Blanca, Sandals Arenas, Sol Cayo de Oro, Oasis
    Laguna Azul, Riu Varadero, Tryp Palma Real, Iberostar
    Río Azul, Iberostar Playa Azul y Sirenis Abanico de
    Coral

  • noveno cluster: incluye todos los hoteles

En la imagen anterior, se muestra la tabla
"Agglomeration Schedule" donde se observa que, por
ejemplo, en el primer nivel se unen para formar un cluster, los
hoteles 9 (Sol Cayo de Oro) y 10 (Sandals Arenas). Ambos casos se
unen a otros hoteles por primera vez para formar un multicluster,
en el nivel siete, cuando se les suma los hoteles Oasis Laguna
Azul, Riu Varadero, Tryp Palma Real, Iberostar Río Azul,
Iberostar Playa Azul y Sirenis Abanico de Coral.

En esta misma tabla se observa el valor del coeficiente
para cada nivel, de modo que mientras menor sea el coeficiente,
indicará la existencia de clusters más
homogéneos. Cuanto mayor sea el valor del coeficiente,
pues más heterogéneos serán
éstos.

Supóngase que el grupo de analistas de la
Delegación del MINTUR, desea obtener una cantidad de
clusters específicos de la muestra de hoteles tomada, en
este caso, 3 clusters.

Solución:

Empleando el SPSS, sería:

En la imagen anterior, se muestra la tabla "Cluster
Membership
" donde se observa que el:

  • primer cluster está formado por los hoteles:
    Sirenis Abanico de Coral, Iberostar Río Azul, Riu
    Varadero, Tryp Palma Real, Iberostar Playa Azul, Oasis Laguna
    Azul, Sol Cayo de Oro y Sandals Arenas

  • segundo cluster: Meliá Estrella de
    Mar

  • tercer cluster: Paradisus Mariposa Blanca

Obsérvese en la imagen anterior, que a la base de
datos original, el programa ha añadido una nueva columna
llamada "clu3_1". La misma refleja igual contenido que el de la
tabla "Cluster Membership" analizada previamente, o sea,
a qué cluster pertenece cada hotel dado que han sido
seleccionados 3 clusters.

Ahora véase un ejemplo de análisis cluster
K-medias.

Ejemplo 2:

El grupo de analistas de la Delegación del
MINTUR, ha decidido ahora ampliar la muestra de hoteles a
estudiar a treinta y tres. Continuando el análisis de las
ocho variables en las entidades hoteleras, estas últimas
se mencionan a continuación:

Hoteles

%

ocupación

ingresos

trabajad

utilidad

gastos

punto

a+b

habitaci

gastener

Sirenis Abanico

de Coral

46

10156.00

560

2463.00

99101.00

7

566

24567.00

Meliá Estrella

de Mar

78

57890.00

315

1800.00

56090.00

6

870

10987.00

Iberostar Río

Azul

65

114362.00

643

3101.00

111261.00

7

698

45734.00

Riu Varadero

59

87765.00

389

2746.00

85019.00

9

547

10999.00

Tryp Palma

Real

74

103890.00

472

2834.00

101056.00

8

612

35667.00

Iberostar Playa

Azul

49

92345.00

518

1964.00

90381.00

8

846

24345.00

Paradisus

Mariposa Blanca

52

110321.00

589

946.00

109375.00

7

900

42567.00

Oasis Laguna

Azul

66

74678.00

471

3123.00

71555.00

7

583

21900.00

Sol Cayo

de Oro

91

98876.00

331

2680.00

96196.00

5

617

36889.00

Sandals Arenas

82

104564.00

470

1970.00

102594.00

6

712

41680.00

Iberostar

Princesa Roja

49

68014.00

396

1025.00

79653.00

6

612

10258.00

Meliá Fuertes

Vientos

58

102563.00

525

987.00

102589.00

7

745

26985.00

Riu Piedra

Dorada

46

95562.00

654

2589.00

98563.00

8

896

31489.00

Iberostar Orilla

Azul

61

79586.00

489

3125.00

84125.00

6

625

41288.00

Sirenis Coral

de Fuego

72

100589.00

369

985.00

98745.00

7

596

32589.00

Oasis Caleta

Buena

83

46892.00

489

3152.00

100258.00

8

910

21478.00

Meliá Aguas

Claras

69

95411.00

526

1489.00

78965.00

8

856

10256.00

Sol Lago

Azul

58

78589.00

621

2541.00

82336.00

7

678

25963.00

Tryp Luna

Plateada

61

74258.00

368

3214.00

97268.00

9

748

32589.00

Meliá Duna

Alta

84

96236.00

489

1025.00

100569.00

7

908

45632.00

Paradisus

Tocororo

91

85555.00

526

2365.00

98425.00

6

658

25825.00

Iberostar Las

Morlas

54

84259.00

514

1478.00

84856.00

8

547

14785.00

Tryp Cielo

Azul

51

79463.00

621

2589.00

71937.00

6

963

30156.00

Villa Real

49

68954.00

358

3654.00

100485.00

8

852

21485.00

Riu Mar

Profundo

66

81258.00

369

1485.00

10632.00

8

741

10325.00

Paradisus

Patriarca

74

79589.00

321

965.00

89652.00

6

789

26985.00

Lago Verde

89

102596.00

412

987.00

74589.00

9

654

45698.00

Sol Palacio

91

105478.00

562

2589.00

96541.00

7

523

32156.00

Barceló Sol

Brillante

65

84563.00

458

954.00

100256.00

6

789

12589.00

Oasis Canal

Grande

48

100892.00

363

1236.00

96369.00

8

954

23589.00

Pino Alto

58

98456.00

458

2563.00

89652.00

8

741

10258.00

Sirenis Esponja

de Mar

64

101548.00

589

3111.00

79658.00

7

852

12365.00

Playa Larga

71

78963.00

612

1025.00

89654.00

6

693

14859.00

Basándose en los datos recopilados de ocho
variables que han sido medidas en cada uno de los treinta y tres
hoteles, el objetivo de los miembros del grupo, consiste en
agrupar dichas entidades según su similitud o semejanza,
pero predeterminando la cantidad de clusters a 4.

Solución:

Empleando el SPSS, sería:

En la imagen anterior, se observa que a la base de datos
original, el programa ha añadido ocho nuevas columnas que
hacen referencia a las ocho variables de análisis pero ya
estandarizadas.

En las dos imágenes anteriores, se muestra la
tabla "Cluster Membership" donde aparece cada hotel
asignado a su cluster. Véase que el:

  • primer cluster está formado por los hoteles:
    Riu Varadero, Oasis Laguna Azul, Oasis Caleta Buena, Tryp
    Luna Plateada y Villa Real

  • segundo cluster: Iberostar Playa Azul, Iberostar
    Princesa Roja, Meliá Fuertes Vientos, Sirenis Coral de
    Fuego, Meliá Aguas Claras, Iberostar Las Morlas,
    Paradisus Patriarca, Lago Verde, Barceló Sol
    Brillante, Oasis Canal Grande, Pino Alto y Playa
    Larga

  • Partes: 1, 2

Página siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter