2 2 ??????ó?? ?? = 2 = 2 2 2 2 LA RAZÓN F DE FISHER
CON EXCEL, WINSTATS Y GEOGEBRA A diferencia de otras pruebas de
medias que se basan en la diferencia existente entre dos valores,
el análisis de varianza emplea la razón de las
estimaciones, dividiendo la estimación intermediante entre
la estimación interna ???? ??????¯ ???? (??1 + ??2 +
??3 + ? ???? )/?? Esta razón F fue creada por Ronald
Fisher (1890-1962), matemático británico, cuyas
teorías estadísticas hicieron mucho más
precisos los experimentos científicos. Sus proyectos
estadísticos, primero utilizados en biología,
rápidamente cobraron importancia y fueron aplicados a la
experimentación agrícola, médica e
industrial. Fisher también contribuyó a clarificar
las funciones que desempeñan la mutación y la
selección natural en la genética, particularmente
en la población humana. El valor estadístico de
prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor
estadístico de prueba que ocurría si H0 fuera
verdadera, a un nivel de significación seleccionado. Antes
de proceder a efectuar este cálculo, se debe considerar
las características de la distribución F i)
Características de la distribución F – Existe una
distribución F diferente para cada combinación de
tamaño de muestra y número de muestras. Por tanto,
existe una distribución F que se aplica cuando se toman
cinco muestras de seis observaciones cada una, al igual que una
distribución F diferente para cinco muestras de siete
observaciones cada una. A propósito de esto, el
número distribuciones de muestreo diferentes es tan grande
que sería poco práctico hacer una extensa
tabulación de distribuciones. Por tanto, como se hizo en
el caso de la distribución t, solamente se tabulan los
valores que más comúnmente se utilizan. En el caso
de la distribución F, los valores críticos para los
niveles 0,05 y 0,01 generalmente se proporcionan para
determinadas combinaciones de tamaños de muestra y
número de muestras. – La distribución es continua
respecto al intervalo de 0 a + 8. La razón más
pequeña es 0. La razón no puede ser negativa, ya
que ambos términos de la razón F están
elevados al cuadrado. Por otra parte, grandes diferencias entre
los valores medios de la muestra, acompañadas de
pequeñas variancias muestrales pueden dar como resultado
valores extremadamente grandes de la razón F. – La forma
de cada distribución de muestreo teórico F depende
del número de grados de libertad que estén
asociados a ella. Tanto el numerador como el denominador tienen
grados de libertad relacionados. ii) Determinación de los
grados de libertad Los grados de libertad para el numerador y el
denominador de la razón F se basan en los cálculos
necesarios para derivar cada estimación de la variancia de
la población. La estimación intermediante de
variancia (numerador) comprende la división de la suma de
las diferencias elevadas al cuadrado entre el número de
medias (muestras) menos uno, o bien, k – 1. Así, k – 1 es
el número de grados de libertad para el numerador. En
forma semejante, el calcular cada variancia muestral, la suma de
las diferencias elevadas al cuadrado entre el valor medio de la
muestra y cada valor de la misma se divide entre el número
de observaciones de la muestra menos uno, o bien, n – 1. Por
tanto, el promedio de las variancias muestrales se
determina
1 2 2 = 2 = 2 2 2 2 2 2 2 2 2 2 dividiendo la suma de las
variancias de la muestra entre el número de muestras, o k.
Los grados de libertad para el denominador son entonces, k(n -l).
iii) Uso de la tabla de F del análisis de variancia
(ANOVA) En la tabla 5 se ilustra la estructura de una tabla de F
para un nivel de significación de 0,01 o 1% y 0,05 o 5%.
Se obtiene el valor tabular, localizando los grados de libertad
del numerador ??1 (que se listan en la parte superior de la
tabla), así como los del denominador ??2 (que se listan en
una de las columnas laterales de la tabla) que corresponden a una
situación dada. Utilizando el nivel de
significación de 0,05 para ??1 = 7 ?? ??2 = 3 grados de
libertad, el valor de F es 8,89 TABLA Nº 5
DISTRIBUCIÓN F DE FISHER Ejemplos: ???????? ???? = ?? ;
???? = ???? ???????????? ???? ???????????????? ??(?? > 2,80) =
0,05 = 5% ??(?? > ??, ????) = ??, ???? = ??% 5% (normal) y 1%
(negritas) ???? = grados de libertad del numerador ???? = grados
de libertad del denominador ??1 ??2 2 3 1 161,45 4052,2 18,51
98,50 10,13 34,12 2 199,50 4999,5 19,00 99,00 9,55 30,82 3 215,71
5403,4 19,16 99,17 9,28 29,46 4 224,58 5624,6 19,25 99,25 9,12
28,71 5 230,16 5763,6 19,30 99,30 9,01 28,24 6 233,99 5859,0
19,33 99,33 8,94 27,91 7 236,77 5928,4 19,35 99,36 8,89 27,67 8
238,88 5981,1 19,37 99,37 8,85 27,49 9 240,54 6022,5 19,38 99,39
8,81 27,35 10 241,88 6055,8 19,40 99,40 8,79 27,23 15 245,95
6157,3 19,43 99,43 8,70 26,87 20 248,01 6208,7 19,45 99,45 8,66
26,69 25 249,26 6239,8 19,46 99,46 8,63 26,58 50 251,77 6302,5
19,48 99,48 8,58 26,35 100 253,04 6334,1 19,49 99,49 8,55 26,24
iv) Cálculo de la razón F a partir de datos
muestrales ?????????????? = ????????????????ó??
?????????????????????????? ???? ??????????????????
????????????????ó?? ?????????????? ???? ??????????????????
?????????????? ???? ??????¯ ???? (??1 + ??2 + ??3 + ? ????
)/?? Para calcular F se debe seguir el siguiente procedimiento 1)
Calcular la estimación interna (Denominador) 1.1)
Determinar la variancia de cada muestra, utilizando la
fórmula ?????????????????? = ?? = ?(????- ??¯ )2 ?? –
1 1.2) Obtener la estimación interna de variancia
(variancia promedio de la muestra), mediante la fórmula
???? = ??1 + ??2 + ??3 +. . … … … . ???? ??
2) Calcular la estimación intermediante (Numerador)
2 2 2 ???? 6 6 6 6 6 6 6 6 2.1) Calcular la variancia de la
medias muestrales, utilizando la fórmula ????¯ =
?(??¯ – ??? )2 ?? – 1 2.2) Multiplicar la variancia de la
medias muestrales por n ??????¯ 3) Razón F ????
?????????????? = 2 Las hipótesis Nula y Alternativa son:
H0: Todas las proporciones de la población son iguales.
H1: No todas las proporciones de la población son iguales.
Ejemplo ilustrativo Los pesos en kg por 1,7 m de estatura se
ilustran en la siguiente tabla. La finalidad es determinar si
existen diferencias reales entre las cuatro muestras. Emplear un
nivel de significación de 0,05 Muestra Observación
1 2 3 4 5 6 1 70 75 74 72 68 59 2 3 74 68 77 70 70 65 80 60 72 72
76 73 4 75 70 73 72 71 72 Solución: Las hipótesis
Nula y Alternativa son: H0: Todas las proporciones de la
población son iguales. H1: No todas las proporciones de la
población son iguales. Calculando los grados de libertad
de numerador se tiene: ?? – 1 = 4 – 1 = 3 Calculando los grados
de libertad del denominador se tiene: ??(?? – 1) = 4(6 – 1) = 20
Con 3 grados de libertad en el numerador, 20 grados de libertad
en el denominador y con un nivel de significación ?? =
0,05 con lectura la tabla se obtiene ???????????? = 3,10 Para
calcular ?????????????? se procede de la siguiente manera:
Calculando las medias aritméticas se obtiene: ? ????
??¯ = ?? 70 + 75 + 74 + 72 + 68 + 59 418 ??¯1 = = 74 +
77 + 70 + 80 + 72 + 76 449 ??¯2 = = 68 + 70 + 65 + 60 + 72 +
73 408 ??¯3 = = 75 + 70 + 73 + 72 + 71 + 72 433 ??¯4 =
= = 69,667 = 74,833 = 68 = 72,167 Se llena la siguiente tabla
para calcular las varianzas muestrales: Muestra
2 2 2 2 2 2 2 2 2 2 2 2 Observación 1 2 3 4 (??1 –
??¯1 )2 (??2 – ??¯2 )2 (??3 – ??¯3 )2 (??4 –
??¯4 )2 1 2 3 4 5 6 70 75 74 72 68 59 74 77 70 80 72 76 68
70 65 60 72 73 75 70 73 72 71 72 0,111 28,441 18,775 5,443 2,779
113,785 0,694 4,696 23,358 26,698 8,026 1,362 0 4 9 64 16 25
8,026 4,696 0,694 0,028 1,361 0,028 Total 418 449 408 433 169,334
64,834 118 14,833 Remplazando los datos en la fórmula de
la varianza se obtienen las varianzas de las 4 muestras. ??2 =
??1 = ??2 = ??3 = ??4 = ?(???? – ??¯ )2 ?? – 1 169,334 =
33,867 5 64,834 = 12,967 5 118 = 23,6 5 14,833 = 2,967 5
Calculando la estimación interna de varianza se obtiene:
???? = ??1 + ??2 + ??3 + ? + ???? ?? ???? = 33,867 + 12,967 +
23,6 + 2,967 73,401 = 4 4 = 18,35 Para calcular la
estimación intermediante de varianza primero se calcular
la varianza de las medias aritméticas ????¯ =
?(??¯ – ??? )2 ?? – 1 Para calcular la varianza de las
medias aritméticas se calcula la media aritmética
de las medias aritméticas, la cual es: ??? = ? ??¯??
69,667 + 74,833 + 68 + 72,167 284,667 = = ?? 4 4 = 71,167 Se
llena la siguiente tabla: ??¯ 69,667 74,833 68 72,167 Total
(??¯ – ??? )2 2,25 13,44 10,03 1 26,72 Se remplaza los datos
de la tabla para calcular varianza de las medias
aritméticas ????¯ = ?(??¯ – ??? )2 26,72 = ?? –
1 3 = 8,907
2 2 2 ???? 18,35 Calculando la estimación intermediante de
varianza se obtiene: ???? = ?? · ????¯ = 6 ·
8,907 = 53,44 Finalmente calculando ?????????????? se tiene: ????
53,44 ?????????????? = 2 = = 2,91 Los cálculos en Excel se
muestran en la siguiente figura: La gráfica elaborada en
Winstats y Paint se muestra en la siguiente figura:
La gráfica elaborada en GeoGebra se muestra en la
siguiente figura: Decisión: Como ?????????????? es menor
que ???????????? , ??0 se aprueba, por lo tanto no existen
diferencias reales en los pesos de las 4 muestras, es decir,
todas las proporciones de la población son iguales.