Agregar a favoritos      Ayuda      Português      Ingles     

Pruebas de hipótesis no paramétricas de Kolmogorov-Smirnov

Enviado por celorriosanchez



  1. Dócima de una muestra de Kolmogorov-Smirnov.
  2. Dócima de Kolmogorov-Smirnov para dos muestras independientes.
  3. Bibliografía

 

INTRODUCCIÓN

El uso de la Estadística es de gran importancia en la investigación científica. Casi todas las investigaciones aplicadas requieren algún tipo de análisis estadístico para que sea posible evaluar sus resultados. En algunos casos, para resolver un problema de carácter empírico, es preciso llevar a cabo un análisis bastante complejo; otras veces, basta con efectuar un análisis muy simple y directo. La elección de uno u otro tipo de análisis estadístico depende del problema que se plantee en el estudio así como de la naturaleza de los datos. Desde este punto de vista, la Estadística constituye un instrumento de investigación y no un producto final de esta última.

El trabajo coherente, las acciones integradas, la no extrapolación de elementos de un lugar a otro, el verdadero diagnóstico de la realidad han de ser prácticas permanentes en el accionar del investigador y el estadístico aplicado.

Dentro de la estadística se aplican en la investigación los tests o dócimas paramétricos y no paramétricos, el presente trabajo esta dedicado al estudio de dos pruebas no paramétricas que por su importancia merecen ser tratadas de forma independiente, ellas son las pruebas de Kolmogorov-Smirnov para una y dos muestras.

Entre los tests no paramétricos que comúnmente se utilizan para verificar si una distribución se ajusta o no a una distribución esperada, en particular a la distribución normal se encuentran el test de Kolmogorov-Smirnov. El test de Kolmogorov-Smirnov es bastante potente con muestras grandes. El nivel de medición de la variable y su distribución son elementos que intervienen en la selección del test que se utilizará en el procesamiento posterior. De hecho, si la variable es continua con distribución normal, se podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras arrojaría resultados de dudosa validez.

Desarrollo

DÓCIMA DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV.

Premisas

La única premisa que se necesita es que las mediciones se encuentren al menos en una escala de intervalo. Se necesita que la medición considerada sea básicamente continua. Además dicha prueba es aplicable cualquiera sea el tamaño de la muestra.

Potencia-Eficiencia

La prueba de una muestra de K-S puede en todos los casos en que se aplique ser más poderosa que su prueba alternativa, la prueba de c 2 ( ji-cuadrado.

Características de la dócima

La prueba de K-S de una muestra es una dócima de bondad de ajuste. Esto es, se interesa en el grado de acuerdo entre la distribución de un conjunto de valores de la muestra y alguna distribución teórica específica. Determina si razonablemente puede pensarse que las mediciones muéstrales provengan de una población que tenga esa distribución teórica. En la prueba se compara la distribución de frecuencia acumulativa de la distribución teórica con la distribución de frecuencia acumulativa observada. Se determina el punto en el que estas dos distribuciones muestran la mayor divergencia.

Hipótesis

Ho: La distribución observada se ajusta a la distribución teórica.

F(x) = Ft(x) para todo x.

H1: La distribución observada no se ajusta a la distribución teórica.

También:

F(x) ¹ Ft(x) para algún x

F(x): es función desconocida

Ft(x): es la función teórica. Esta puede ser por ejemplo la función normal con cierta media y varianzas conocidas.

Estadígrafo y distribución muestral

D = máxima

Sn(x): es la función de distribución empírica.

Ejemplo

El entrenador de salto de un grupo de atletas, desea conocer con vistas al procesamiento de los datos por el obtenidos sobre salto de una muestra aleatoria de atletas de esa especialidad en un CVD, si las mediciones realizadas por él están distribuidas normalmente. Los datos son los siguientes:

Salto_Largo

1 1.60

2 1.65 Ho: Los datos están distribuidos normalmente

3 1 .55 H1: Los datos no están distribuidos normalmente.

4 1.62

5 1.64

6 1.70

7 1.71

8 1.68

9 1.66

10 1.67

11 1.65

12 1.68

13 1.69

14 1.70

Salidas de la dócima

Conclusiones:

No se rechaza a Ho, por tanto la distribución de los datos es normal.

Técnicas adicionales a la dócima

Tabla de frecuencias

Histograma.

Estadígrafos que deben acompañar a los estadígrafos de la dócima

1-Tabla de frecuencias.

Técnicas auxiliares para respaldar los resultados obtenidos en la conclusión.

1-Histogramas.

 

Dócima de Kolmogorov-Smirnov para dos muestras independientes.

Estructura de la base de datos

Normalmente la estructura que tiene la base de datos es la de utilizar una variable para entrar los resultados de la medición y la otra donde se particione a estos resultados en los dos grupos.

Premisas

La única premisa que se necesita es que las mediciones se encuentren al menos en una escala ordinal. Adicionalmente se necesita que la medición considerada sea básicamente continua.

Potencia-Eficiencia

Comparada ante la alternativa paramétrica de la t de student para dos muestras independientes (o el modelo de Análisis de Varianza clasificación simple para dos muestras), cuando las premisas paramétricas se cumplen, tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer ligeramente a medida que se aumentan los tamaños de muestra.

Existen autores que plantean1 "que la dócima de Kolmogorov-Smirnov, para muestras muy pequeñas es más potente que la dócima de la U de Mann-Whitney, pero que para muestras de tamaño grande ocurre lo contrario.

Características de la dócima

La dócima de Kolmogorov-Smirnov está construida, teniendo como base detectar las discrepancias existentes entre las frecuencias relativas acumuladas de las dos muestras objeto de estudio. Lo anterior propicia que esta dócima pueda advertir diferencias no tan solo entre los promedios, sino que éstas sean debidas a la dispersión, o la simetría o la oblicuidad. Esta característica la hace distintiva de aquellas en que solamente se ocupan de analizar las diferencias entre los promedios.

La dócima admite que los tamaños de las muestras no sean iguales.

Hipótesis

Las hipótesis de esta dócima, expresadas en palabras son:

Ho: Las distribuciones poblacionales son iguales.

H1: Las distribuciones poblacionales son distintas.

Ahora bien se recomienda en general hacer el enunciado de las hipótesis de forma tal que indique en un mayor grado la característica que va a ser docimada.

Estadígrafo y distribución muestral.

Designemos por T1 y por T2 las tablas de distribución de frecuencias relativas acumuladas, particionadas en k categorías. Donde el primer subíndice corresponde al número de la muestra y el segundo al orden de la clase.

TABLA1

TABLA2

DIFERENCIAS

Clase

Frecuencia relativa acumulada

Frecuencia relativa acumulada

Diferencia de las

Frecuencias

1

p11

p21

p11-p21

2

p12

p22

p12-p21

...

...

...

...

I

p1i

p2i

p1i-p2i

...

...

...

...

k

p1k

p2k

p1k-p2k

Se analiza entonces en la columna de las diferencias de las frecuencias, en qué clases se obtiene el valor máximo. Se tendrá entonces en símbolos:

El estadígrafo de esta dócima se designa por χ2 y para tamaños de muestra suficientemente grandes, está distribuido según chi-cuadrado con dos grados los de libertad. En símbolos:

Goodman , ha demostrado que si los tamaños de muestra son pequeños la dócima se comporta conservadoramente.

Salidas de la dócima

Las salidas usuales de la dócima son tres:

  • Máxima diferencia negativa. Donde se muestra cuál es la mayor diferencia negativa alcanzada.
  • Máxima diferencia positiva. Donde se muestra la mayor diferencia positiva alcanzada.
  • Valor de la probabilidad para dos colas.

Es necesario señalar que las dos primeras opciones suministran información en los casos en que sea conveniente realizar una dócima unilateral, además de reflejar información acerca de lo que está ocurriendo en la dócima.

Técnicas adicionales a la dócima

Existe un grupo de técnicas adicionales a la dócima, las que hemos dividido en los siguientes grupos.

Estadígrafos que deben acompañar a los estadígrafos de la dócima.

Entre ellos se encuentran:

  • Tamaños en cada una de las muestras (casos válidos en el análisis)
  • Media aritmética de cada una de las muestras.
  • Desviación estándar de cada una de las muestras.

Técnicas auxiliares para respaldar los resultados obtenidos en la conclusión

  • Diagrama de caja y bigotes de cada una de las muestras.
  • Histograma de cada una de las muestras.

Ejemplo

Se muestran las pérdidas en peso (medidos en kilogramos), de dos grupos de personas que han sido sometidas a dos tipos diferentes de medicamentos, designado por Grupo1 y Grupo2. Los resultados obtenidos se muestran en la siguiente tabla:

GRUPO1 (n1=10)

GRUPO2 (n2=12

5.49

3.76

3.08

4.22

4.13

4.17

5.03

5.03

7

4.85

6.03

2.09

4.45

4.45

5.13

3.58

4.26

3.86

4.62

4.13

4.4

2.81

Salida de la dócima

La salida básica de la dócima muestra los valores máximos positivos, máximos negativos y el valor de probabilidad, los que se muestran a continuación.

medición

máxima diferencia negativa

máxima diferencia positiva

valor de probabilidad

perdida de peso

0

0.4666667

p > .10

Según podemos observar, no existen diferencias significativas entre los resultados de la medición realizada a los dos grupos.

Estadígrafos que deben acompañar a los estadígrafos de la dócima.

Resulta conveniente incluir también, además de los mencionados en la tabla anterior, el tamaño en cada una de las muestras, así como la media aritmética de cada una de ellas y su desviación estándar. Las que se muestran en la siguiente tabla.

Tamaños de muestra

Media aritmética

Desviación. Estándar

GRUPO 1

10

4.73900

.8235661

GRUPO 2

12

3.945834

.8235661

Técnicas auxiliares para respaldar los resultados obtenidos en la conclusión

Las técnicas que ha continuación se mencionan es conveniente su utilización:

Diagramas de Caja y Bigotes.

El siguiente diagrama muestra los resultados obtenidos tomando como promedio la mediana, el rango intercuartílico para la caja y el máximo-mínimo para los bigotes.

En este diagrama observamos que.aunque en la segunda muestra ha existido una disminución en el valor mediano, las diferencias no son significativas. Obsérvese que en la segunda muestra se ha producido una disminución en la dispersión y los máximos y mínimos han sido reducidos.

Histogramas

A continuación se muestran los histogramas de las dos muestras. Los que pueden proporcionar una mayor idea del proceso ocurrido.

BIBLIOGRAFÍA

  • Alvarez de Zayas, Carlos: (1995). Metodología de la investigación científica. Santiago de Cuba. Centro de Estudio Superior "Manuel F. Grau".
  • Cerda Gutierrez, Hugo: (1993). Los elementos de la investigación. ¿Cómo reconocerlos, cómo diseñarlos y construirlos?. Quito. Edit. El Buho.
  • Colás Bravo, María del Pilar: (1992). Investigación educativa. Sevilla. Librería Canaima.
  • Cué Muñiz, Juan: (1987). Estadística. Ciudad de la Habana: Empresa Nacional de Producción del Ministerio de Educación Superior.
  • Friedrich, Walter: (1968). Métodos de la investigación social. La Habana: Editorial Ciencias Sociales.
  • García, M.: (1993:16-18). Test para la evaluación de habilidades visuales en deportistas. Boletín de Información y Documentación UNISPORT (Andalucía) 21(1).
  • Grau Avalos, Ricardo: (1994). Estadística aplicada utilizando paquetes de software. Centro de Documentación e Investigación, Facultad de Matemática, Física y Computación. Universidad Central de Las Villas. Villa Clara, Cuba.
  • Guerra Bustillo, Caridad W.: (1987). Estadística. Ciudad de La Habana. Editorial Pueblo y Educación.
  • Karpman, U. L.:(1988). Las pruebas en medicina deportiva. Moscú: Editorial Fis.
  • Mesa Anoceto, Magda: (1998). Determinación de la validez predictiva de los tests en el deporte. En Memorias del II Simposio Internacional de Educación Física y Deporte Escolar. Cienfuegos, Cuba.
  • Norat Soto, Teresa:(1991:81-86). Estadística aplicada al deporte: las pruebas de comparación múltiple. En revista cubana de Medicina del Deporte y la Cultura Física. 2(2): abril-,junio..
  • Siegel, Sidney: (1986). Estadística no paramétrica aplicada a las Ciencias de la Conducta. México, D.F., Editorial Trillas.

 

 

 

 

Ms.C: Arsenio Celorrio Sánchez

E- mail:

Profesor de Estadística, Matemática y Econometría del Centro Universitario de Las Tunas Cuba

21 año de trabajo, dentro de ellos 19 años en la Educación Superior ,profesor Asistente.

Necesito si es seleccionado para ser publicado este trabajo me envíen un documento que lo certifique

Próximamente enviaré nuevos trabajos en esta dirección de la Estadística.

Muchas gracias.

 

 

 

 


Comentarios


Trabajos relacionados

Ver mas trabajos de Estadistica

 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.


Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Iniciar sesión

Ingrese el e-mail y contraseña con el que está registrado en Monografias.com

   
 

Regístrese gratis

¿Olvidó su contraseña?

Ayuda