- Marco
Teórico - Antecedentes
Bibliográficos. - Planeamiento o
Formulación. - Objetivos.
- Hipótesis
- Diseño de la
Muestra - Análisis
Interpretación de Resultados - Conclusiones.
- Recomendaciones
- Bibliografía.
El análisis de varianza (ANOVA) es una prueba,
un cálculo
que nos permite medir la variación de las respuestas
numéricas como valores de
evaluación de diferentes variables
nominales.
La prueba a realizar en el Análisis de Varianza
es de sí existe diferencia en los promedios para la los
diferentes valores de las variables nominales; esta prueba se
realiza para variables donde una tiene valores nominales y la
otra tiene valores numéricos.
En el siguiente ejemplo de aplicación, se tiene
la medición de las Señales de
Recepción en el medio Ambiente
de Celulares lo que se intenta es probar si existe o no
diferencias en las diferentes lecturas tomados en diferentes
distritos. (Variable nominal ).
Para analizar si existe diferencia en los promedios se
procede a realizar una prueba F que se explica
posteriormente n el siguiente trabajo de
investigación para observar como las
señales varían según el recorrido constante
y variable en el entorno para medir las señales de
recepción .
ANALISIS DE VARIANZA
LA DISTRIBUCION F
ANOVA, del inglés
Análisis Of VAriance, es un test
estadístico ideado por Fisher, gran genio inglés
que pensó hace más de 60 años como analizar
datos
simultáneamente cuando tenemos varios grupos y
así poder ahorrar
tiempo y
dinero. Este
análisis por lo tanto permite comprobar si existen
diferencias entre promedios de tres o más tratamientos y
para ello se calcula el valor de F, y
es equivalente al test de Student, salvo que éste
último solamente sirve para dos grupos. Desde ya tenemos
que dejar establecido que cuando encontramos el valor de F
sabremos si existen diferencias entre los grupos, pero no nos
dice entre cuales grupos.
La comparación simultanea de varias medias
poblacionales se denomina Análisis de Varianza (
ANOVA de analisys of variante ).
Para los casos, las poblaciones deben ser normales y los
datos, por lo menos deben estar en el nivel de
intervalos.
- Los Grados de Libertad en el numerador y los
Grados de Libertad en
el denominador - La distribución F es continua, significa
que puede tomar una cantidad infinita de valores entre 0 y mas
infinito. - La distribución F no puede ser
negativa. Dado que el menor valor de F es cero. - La distribución F es positivamente
sesgada, dado que la cola larga de la distribución
se encuentra a la derecha , conforme el número de Grado
de Libertad aumenta, tanto el numerador como el denominador, la
distribución se aproxima a una distribución
normal. - La distribución F es asintótica,
conforme lo valores de X aumentan , la curva de la
distribución F se aproxima al eje X , pero nunca lo
toca.
Grados de Libertad (n1/n2)
El uso de la distribución F es la técnica
del análisis de varianza (ANOVA), con lo q se comparan
tres o mas medias poblacionales para determinar si son iguales.
Para usar el ANOVA se considera lo siguiente:
- Las poblaciones están distribuidas
normalmente. - Las poblaciones tienen desviaciones estándar
iguales (s). - Las muestras se seleccionan
independientemente.
Cuando se satisface estas condiciones, F se utiliza como
la distribución del estadístico de
prueba.
Paso1: Plantear la Hipótesis nula y la Hipótesis
alternativa.
Ho : u1=u2=u3=u4 hipótesis Nula
H1 : u1≠u2≠u3≠u4 hipótesis
alternativa
Si no se rechaza la hipotes Nula (Ho), se concluye que
no hay diferencia en los promedios. Si se rechaza Ho, se concluye
que hay diferencia al menos un par de promedios.
Paso 2: Seleccionar el nivel de
significancia, puede elegirse 0.01 , 0.05, etc.
Paso 3: Determinar el estadístico
de prueba, el estadístico de prueba sigue la
distribución F.
Paso 4: Establecer la regla de
decisión. Para establecer esta regla se necesita el valor
crítico. El valor critico del Estadístico en base a
los grados de libertad. Donde el número de grados de
libertad del numerador es igual al número de tratamientos
designado por ( K-1 ). El numero de grados de libertad en
denominador es igual al numero de observaciones n menos el numero
de tratamientos.( n- k )
Paso5: Seleccionar la muestra ,
realizar los cálculos y tomar una decisión. Es
decir es conveniente reunir los cálculos del
estadístico F en una tabla ANOVA. El Formato de la Tabla
ANOVA es el siguiente:
TABLA ANOVA | ||||
FUENTE DE VARIACION | Suma de Cuadrados | Grados de Libertad | Media de Cuadrados | F |
Tratamientos | SST | k-1 | SST/(k-1)=MST | MST/MSE |
Error | SSE | n-k | SSE/(n-k)=MSE | |
Total | SS Total | n-1 |
Hay tres valores llamados Suma de cuadrados ( SS, de
sumo f squares) usados para hallar el F Calculado y compararlo
con el F teórico según el Grado de Libertad
hallados en las tablas de Valores críticos de
Distribución F para valores de significancia al 5% o al
1%
Si {Fcalculado > F teórico } se
rechaza la H1, en caso contrario se acepta.
Tabla de Valores Críticos de la
Distribución F para un Nivel de Significancia
1%
Tabla de Valores Críticos de la
Distribución F para un Nivel de Significancia
5%
3.- Antecedentes
Bibliográficos.
- Análisis estadístico de un
diseño sistemático de Nelder
basado en un modelo de
Ante dependencia por radiación.
Mora Garcés -Julio, 1998- Junio,
1999
Instituto de Investigaciones para el Desarrollo
Forestal (INDEFOR), Facultad de Ciencias
Forestales y Ambientales. Universidad de Los Andes. Mérida,
Venezuela.
Apdo Postal 5101.
- "Asymptotic properties of an estimator in a
nonlinear mixed effects model.", Comptes rendus de
l'Académie des sciences. Série 1,
Mathématiques, (1998) , vol. 326/3, pp.
381-384. - "Calibration for nonlinear mixed effects models.
An application to the withdrawal time prediction",
(con D. Concordet). Biometrics, (2000), Vol. 56/4, pp.
1040-1046 - "A simulated Pseudo-maximum likelihood estimator
for nonlinear mixed models" (con D. Concordet).
Computational Statistics & Data Analysis, (2002), vol
39/2, pp. 187-201.
4.-Planeamiento o
Formulación.
Se realiza un estudio para comparar la respuesta de las
señales del Celular Nokia 2112 en el Centro Comercial
MEGAPLAZA de la Panamericana en un recorrido aleatorio .Se
emplean tres recorridos de la siguiente forma en el lugar y
tiempo:
I.- La Primera ruta se realizo en las cercanía
del centro comercial MegaPlaza en una zona de bajo trafico de
personas se realizaron llamadas de duración a media hora ,
dichas muestras fueron tomadas en la mañana de un
día Lunes.
II.- La Segunda ruta se realizo en las Laderas del
centro comercial MegaPlaza con una zona de moderado trafico de
personas se realizaron llamadas de duración a media hora ,
dichas muestras fueron tomadas en la mañana y medio
día de un día Jueves.
III.- La Tercera ruta se realizo en los interiores del
centro comercial MegaPlaza con una zona de alto trafico se
realizaron llamadas de duración a media hora , dichas
muestras fueron tomadas en la mañana de un día
Domingo por el medio día.
Se comparan estos tres Lecturas en cuanto a sus
respuestas en la recepción de la señal a un numero
de medidas tomadas en los tres instantes en lugares donde la
concurrencia de personas en numeroso. En el estudio participaban
ciento cincuenta muestras. Se les separó aleatoriamente en
tres subgrupos de tamaño 50. A uno de los subgrupos se le
asignó las Muestras DIA Lunes, a otro las muestras DIA
Jueves y al tercero, las muestras en el DIA Domingo el
tratamiento. Después de 1 semanas se anotó para
cada día indicado las muestras de las mediciones del
celular Nokia 2112 en modo Ingeniería.
5.-Objetivos.
Generales
Observar los índices de tráficos de
señales referenciales el las comunicaciones
celulares y el comportamiento
según el uso masivo de llamadas y el efecto que tiene en
las llamadas ya sean en hora punta como hora de bajo
trafico.
Específicos
Observar los índices del trafico de señal
receptiva en el equipo celular Nokia 2112 de la
compañía Telefónica Móvil ( Movistar
) en modo ingeniería en los cuales se hicieron las
lecturas , escaneando las señales en los momentos
indicados en un día lunes , jueves y Domingo .
Generales
Se desea comprobar que las señales de
recepción en el celular NOKIA 2112 mantiene una constante
de ganancia automática en la recepción de llamadas
ya sea en bajo o alto tráfico.
Especificas
Se desea comprobar en tres días efectivos en
tiempos posibles Mañana, medio día, los
índices de recepción en las llamadas a tiempos
promedios de media hora por llamadas.
Marco Poblacional :
291 muestas poblacionales Rx y 291 muestras
poblacionales TX
Para ver la siguiente
tabla seleccionar "Descargar" del menú superior
Marco Muestral
Se toman 30 muestras aleatorias por cada día ,
las muestras corresponden solo alos valores de
recepción
Tamaño : 90 muestras para el análisis de
varianza.
8.-
Análisis Interpretación de Resultados
Sean las muestras tomadas para los cálculos de
Análisis de Varianza.
LUNES | JUEVES | DOMINGO |
recepción (-) | recepción (-) | recepción (-) |
66 | 69 | 52 |
66 | 70 | 51 |
69 | 68 | 52 |
69 | 71 | 60 |
70 | 69 | 59 |
55 | 70 | 60 |
55 | 70 | 62 |
53 | 69 | 61 |
55 | 69 | 58 |
57 | 70 | 57 |
65 | 71 | 65 |
66 | 71 | 69 |
65 | 68 | 63 |
64 | 71 | 59 |
60 | 64 | 49 |
59 | 70 | 47 |
55 | 71 | 61 |
56 | 69 | 62 |
50 | 67 | 62 |
57 | 64 | 71 |
57 | 65 | 57 |
57 | 66 | 55 |
47 | 65 | 55 |
53 | 65 | 56 |
62 | 64 | 62 |
66 | 65 | 53 |
64 | 60 | 55 |
53 | 71 | 56 |
60 | 65 | 55 |
64 | 65 | 60 |
Paso1:
Se Plantea la Hipótesis nula y la
Hipótesis alternativa.
Ho : u1=u2=u3 hipótesis Nula .Donde se afirma
que las tres medias de las lecturas son iguales.
H1 : u1≠u2≠u3 hipótesis alternativa.
Donde se niega que las tres medias de las lecturas sean
iguales.
Paso 2:
Seleccionamos el nivel de significancia, para un valor
de 0.05.
Paso 3:
Determinar el estadístico de prueba, el
estadístico de prueba sigue la distribución F al 5%
.
Paso 4:
Se establece la regla de decisión. Para
establecer esta regla se necesita el valor crítico. El
valor critico del Estadístico en base a los grados de
libertad.
Grado de Libertad del numerador : k-1 = 3-1=
2
Grado de Libertad del denominador : n-k = 90-3=
87
Donde se obtiene de la Tabla de Valores Críticos
de la Distribución F para un Nivel de Significancia
5%
F (3 , 87) = 3.101295757
Seguidamente se hallan los demás cálculos
indicados según las formulas siguientes:
Paso5:
Seleccionamos las muestras , realizamos los
cálculos y nos levara a tomar una decisión.
Según el formato de la tabla ANOVA.
TABLA ANOVA | ||||
FUENTE DE VARIACION | Suma de Cuadrados | Grados de Libertad | Media de Cuadrados | F |
Tratamientos | SST | k-1 | SST/(k-1)=MST | MST/MSE |
Error | SSE | n-k | SSE/(n-k)=MSE | |
Total | SS Total | n-1 |
Siendo los siguientes calculados en Excel:
Análisis de varianza de un |
|
|
|
|
|
| |
|
| ||||||
RESUMEN |
| ||||||
Grupos | Cuenta | Suma | Promedio | Varianza |
| ||
LUNES | 30 | 1795 | 59.833 | 37.109 |
| ||
JUEVES | 30 | 2032 | 67.733 | 8.547 |
| ||
DOMINGO | 30 | 1744 | 58.133 | 29.430 |
| ||
|
| ||||||
|
| ||||||
ANÁLISIS DE VARIANZA |
| ||||||
Fuente de | SC | GL | PC | F | P Valor | F | P |
Entre grupos | 1575 | 2 | 787.3 | 31.4558 | 0.000000000053 | 3.1013 | 0.05 |
Dentro de los grupos | 2178 | 87 | 25.0287 |
| |||
|
| ||||||
Total | 3752 | 89 |
|
|
|
|
|
- Criterios de decisión
Si {Fcalculado > F teórico } se rechaza
la H1, en caso contrario se acepta.
F | P Valor | F | P |
31.4558 | 3.1013 | 0.05 |
Observamos que Fcalculado = 31.4558 es mayor que el
Fteorico=3.1013 y el Pvalor=0.000000000053 es mucho menor que el
Pteorico = 0.05
Dando como resultado el rechazo de la hipótesis
planteada y las Pruebas son
significativas.
A. Se rechaza la hipótesis planteada, se acepta
la hipótesis alterna a un nivel de significación
de 0,05. La prueba fue significativa.
B. Al menos un método
por DIA de lectura de
datos de recepción por DIA tomados en muestra es
diferente a los demás
Los resultados obtenidos indican que estos valores
difieren en las anotaciones tomadas en los días Lunes ,
Jueves y Domingo siendo ellas a nivel de significación del
5% resultantes, y que en las muestras tomadas en los diferentes
días se aprecia la gran diferencia de lecturas
según el trafico de llamadas por los usuarios de
Celulares.
11.- Bibliografía.
- V. Abraira, A. Pérez de Vargas .
Métodos Multivariantes en
Bioestadística.
Ed. Centro de Estudios
Ramón Areces. 1996. - Canavos, G.C. (1999). "Probabilidad y
Estadística. Aplicaciones y métodos". MacGraw-Hill. - Cao Abad, R. y otros. (1998).
"Estadística básica aplicada". Ed
Tórculo. - Cao Abad, R. y otros. (2001).
"Introducción a la estadística y
sus aplicaciones". Pirámide. - De la Horra Navarro, J. (2001).
"Estadística Aplicada". 2ª edición. - García Alvarez-Coque, C. y Ramis
Ramos, G. (2001). " Quimiometría". Editorial
Síntesis. - Gonick, L. y Smith, W. (2001)"A
estadística ¡en caricaturas!".
SGAPEIO. - Johnson, R.A. y Bahttachariya, G.K.
(1992). "Statistical Principes and Methods". J.
Wiley. - Milton, J.S. (2001) "Estadística para
Biología
y Ciencias de la Salud". 3ª
edición. McGraw-Hill - Montgomery, C. (1991).
"Diseño y Análisis de Experimentos".
Grupo
Editorial Iberoamericana. - Novo Sanjurjo, J.V. (1994).
"Métodos Estadísticos". UNED. - Peña Sánchez de Rivera, D.
(1991) "Estadística. Modelos y
Métodos. 1. Fundamentos". Ed. Alianza
Universidad. - Rius Díaz, F. y otros.
(1999). "Bioestadística: Métodos y Aplicaciones".
Universidad de Málaga.
Elaborado por
Fernando Mendoza Apaza
Maestría en Ciencias en
Ingeniería
De Sistemas y
Computación
Universidad Inca Garcilazo de la Vega
Profesor de Maestría
Dr. Jorge Luis Córdova Egocheaga