Examinando la asociación
residual
Los residuos contra las variables
Una técnica por determinar si otras variables
pueden ser importantes en predecir la respuesta es la grafica de
los residuales contra cada predicción
potencial.
Regresión
1.- Escoja el Stat > Regresión >
Regression o presione ctrl+E para regresar al cuadro de
diálogo.
2.- Click Graphics.
3.- Completa el recuadro como se indica a
continuación:
4.- Pulse el botón OK en cada
recuadro.
Interpretando tus resultados
Cuando el plotted en contra de la descarga, los
residuales no parecen completamente aleatorios. Los residuales
aparecen más grandes para los valores de
descarga más grandes. Esto indica que la descarga puede
ser útil respondiendo a la variabilidad adicional en el
golpe.
La entrada y la chispa también parecen ser
relacionadas con el golpear y pueden responder a la variabilidad
adicional.
Es posible para dos o más variables explicar la
misma variabilidad en la respuesta. En este caso, el modelo final
puede que no incluya todas las variables.
Encajando a un modelo de la regresión
múltiple
Usa la regresión para analizar el modelo de la
regresión múltiple con todos las cuatro
predicciones.
Regresión
1.- Escoge Stat > Regresión >
Regresión o presione Ctrl.+E para regresar a la
Regresión en el recuadro.
2.- Presione F3 para borrar el cuadro de
diálogo
3.- Completa el recuadro como se indica a
continuación:
4.-Click OK.
Interpretando tus resultados
Use un α de 0.05 para todos los
anαlisis.
Ecuación de regresión
La ecuación que relaciona la respuesta y la
predicción es:
Knock = 23.8 – 0.296 +3.19 AFR +0.359 entrada + 0.0134
descarga
Tabla de coeficientes
Tenga el cuidado al interpretar los coeficientes de la
regresión múltiple.
El p-valor para
cada variable sólo indica si es significante en el modelo
presente.
Por ejemplo, la chispa no es una predicción
significante en el modelo presente (p = 0.363). Sin embargo, si
quitas la descarga del análisis, la chispa se hace significativa,
está altamente correlacionados (r = – 0.723,p = 0.005, vea
página 3.49) y así explica la misma
variación en el golpe.
El análisis de la regresión: el golpe
contra la chispa, succión, la descarga,
Interpretando tus resultados
Cuidado con multicolinealidad
Cuando las predicciones son sumamente correlacionadas,
la estimación del coeficiente de regresión puede
ser inestable (Significa que varían ampliamente de un
ejemplo al siguiente). Esta condición es llamada
multicolinealidad, y eso hace que la evaluación
sea importante en términos individuales en la dificultad
del modelo.
Puedes usar la correlación para tratar de
identificar las fuentes
potenciales de la multicolinealidad. Si hay multicolinealidad
extrema en un modelo, MINITAB mostrará un mensaje en la
ventana de la sesión y quita una o más variables
para reducir el problema.
Nunca quites mas de una predicción en
ningún momento
Una buena forma de Escoger las predicciones de un modelo
de regresión múltiple es tratar a todas las
combinaciones potenciales usando el modelo de procedimientos de
comparación como el mejor subconjuntos o una
regresión gradual.
El análisis de la regresión: el golpe
contra la chispa, succión, la descarga
Interpretando tus resultados
R²(R-Sq) y R² ajustó
(R-Sq(adj))
El nuevo modelo explica 98.8% de la variabilidad en la
respuesta, lo cual es una mejora sobre el R² logrando usar
solamente AFR para predecir el golpe
Sin embargo R² nunca disminuirá cuando
aumente la predicción al modelo, aun cuando eso no resulte
un buen modelo. La estadística de R² ajustada (R-Sq(adj)
= 98.2%) es ajustado para el número de condiciones en el
modelo, y debe usarse cuando son comparados los modelos con
diferente números las predicciones.
El R² ajustado para el modelo con sólo AFR
como el predictor tenía 91.6% años. así, el
modelo actual con un R² esta ajustado 98.2% se
mejora.
Análisis de Variación
Las hipótesis para un modelo de la
regresión múltiple es:
Ho: todo β1 (a excepciσn de
β0) son iguales a cero
H1: al menos uno βi (no incluye β0 ) no es
igual a cero
Porque p (0.000) es menos que α (0.05), puedes
rechazar Ho.
El modelo de la regresión, con la chispa, AFR,
Succión, y descarga como las predicciones, es
significativamente mejor que la restricción del modelo el
cual incluye no predicciones.
El análisis de la regresión: el golpe
contra la chispa, succión, la descarga,
Consideraciones Finales
Conclusiones prácticas
La ecuación de la regresión para la Chispa
usando ejemplar, AFR, Succión y Descarga para predecir el
Golpe es:
El golpe = 23.8-0.296 Chispa + 3.19 AFR + 0.359
Succión +0.0134 Descarga.
Este modelo responde de 98.8% de la variabilidad en el
Golpe.
Hay problemas del
multicolieanidad con el modelo. Sin embargo, la chispa sumamente
correlacionado con la Descarga.
En el próximo ejemplo, usarás los mejores
Subconjuntos para procesar a todos los posibles modelos con estas
cuatro predicciones y Escoger el mejor.
Consideraciones estadísticas
No puedes usar el análisis de la regresión
para afirmar que los cambias en las predicciones causan cambios
en la respuesta, a menos que los valores de las
predicciones cambien niveles predeterminados en un experimento
controlado. Si los valores de las predicciones variar al azar,
otros factores pueden influir en las predicciones y la
respuesta.
No deberías aplicar los resultados de
regresión y los valores de respuesta que son salidas de tu
rango de los ejemplos.
La precisión de medida es importante. La falta de
precisión te lleva a la inexactitud estimada de los
coeficientes.
Ten cuidado de no pasar por alto los factores
potencialmente importantes al diseñar un estudio de
regresión.
Tenga cuidado con multicolinealidad.
Cuando las variables de la predicción
están sumamente correlacionadas:
- Los coeficientes estimados de la regresión
pueden ser inestables (Ellos pueden variar ampliamente de una
muestra a la
siguiente muestra) - Puede ser difícil evaluar la importancia de
las condiciones individuales del modelo.
Nunca quite más de una predicción en
ningún momento.
Una buena forma de Escoger las predicciones de un modelo
de regresión múltiple es tratar a todas las
combinaciones potenciales usando el modelo de procedimientos de
comparación como el mejor sub conjuntos o
una regresión gradual.
Mejores Subconjuntos de la Regresión
El ejemplo 5 Reduciendo el Golpe del Motor
Problema
Estás intentando identificar las variables
importantes que efectúan el Golpe del motor. Las
siguientes variables están bajo las
consideraciones:
- La elección del momento adecuado de la
chispa - La proporción de aire-combustible (AFR)
- La temperatura
de la succión - La temperatura de la descarga
Recolección de datos
Los datos son recolectados al azar de 13 motores
seleccionados
Herramientas
Stat > Regressions>Best subsets.
Stat>Regressions>Regressions.
Set de Datos
KNOCK.MPJ
REGRESIONES DE LOS MEJORES
SUBCONJUNTOS
¿Cuál es el mejor subconjunto de
regresión?
La regresión de los mejores subconjuntos
evalúa todas las posibles combinaciones de las
predicciones para ayudarle a determinar qué
combinación hace al mejor modelo de las regresiones.
MINITAB usa un criterio de R2 máximo para Escoger al mejor
modelo . Otro criterio puede proporcionar a un modelo
diferente.
¿Cuándo usar los mejores conjuntos de
regresión?
Use la regresión de los mejores subconjuntos
cuando usted tiene mucho potencial de predicciones y así
varios modelos de regresión para Escoger.
¿Por qué usar el mejor subconjunto de
regresión?
Los mejores subconjuntos pueden disipar las siguientes
preguntas:
- ¿ Qué combinación de tus
factores es él más eficaz para predecir tu
respuesta? - ¿Cuál es el mejor modelo de
regresión posible usando de 5 a 20
predicciones?
Por ejemplo,
- ¿Está un modelo usando 10 variables
para predecir la suavidad del helado mas que uno que usa
sólo temperatura y velocidad en
la mezcla?
Escogiendo un modelo apropiado
Use los mejores Subconjuntos para ayudarle a Escoger a
un modelo de las regresiones múltiples para el Golpe y
evita los problemas siguientes:
- Los modelos incómodos e ineficaces son el
resultado de muchas predicciones. - Coeficientes inestables que resultan de redundante y
predicciones correlacionadas. - Habilidad inadecuada de predicciones que resulta
pocas predicciones.
Predicciones libres
Entre todas las cuatro variables en las predicciones
Libre. MINITAB probará todas las posibles combinaciones de
estas variables y el reporte estadístico para los mejores
modelos. (Variables de entradas de las Predicciones en todos los
modelos serán incluidas en cada modelo.)
Best Subsets
1.- Seleccione
Stat>Regressions>Best.
2.-Completa el recuadro como se indica a
continuación:
3.- Click OK
Interpretando tus resultados
Los Xs al derecho de la tabla indica qué
predicciones son incluidas en cada modelo.
Variables
La columna de Vars indica el número de
predicciones en el modelo.
R2 (R-Sq) y R2 ajustó
(R-Sq(adj))
Al comparar a modelos:
Si el número de predicciones es el mismo, busque
al modelo con el R2 más alto.
Si el número de predicciones es diferente, busque
al modelo con el R2 más alto.
Cp
Busque a modelos dónde Cp es pequeño y
acerca el número de parámetros en el modelo. Por
ejemplo, para modelo con 3 predicciones y el interceptor, busque
a un modelo con un Cp cerca de 4 La fórmula Para Cp
es:
Cp = (SSEp/MSEm)-(n-2p)
Donde SSEp son las sumas de error de los cuadrados para
el modelo con los parámetros de p (incluso el
interceptor), MSEm el error de la media cuadrada para el modelo
con toda las predicciones de m, y n es el número de
observaciones.
Los mejores Subconjuntos de regresión: el Golpe
contra la Chispa, AFR, la Succión, la Descarga,
La contestación es el Golpe
Interpretación tus resultados
Variabilidad
S es una estimación de la media variabilidad
sobre la línea de las regresiones. Matemáticamente,
S es la raíz cuadrada positiva del MSE. En general, tu
quieres que S sea tan pequeño como posible.
Conclusión
Basado en éstos criterios, el modelo con AFR, la
Succión, y la Descarga es el mejor. El modelo
Conteniendo todos las cuatro predicciones es comparable,
pero S para este modelo es ligeramente más grande y
allí no parece ser cualquier ganancia en R2 ajustado para
usar el modelo. Es generalmente sabio Escoger al modelo
más simple a menos que un modelo más complicado sea
claramente mejor.
Los mejores Subconjuntos de regresión: el
Golpe contra la Chispa, AFR, la Succión, la
Descarga
La contestación es el Golpe
Evaluando el último Modelo
Usa la Regresión para evaluar al
último modelo. Calcule la ecuación de
regresión y confirme que todas las asunciones sobre los
residuales sean conocidas.
Regression
1.- Escoge Stat > Regresión >
Regresión
2.- En Response, enter knock.
3.- En Predictors, enter AFR intake
exhaust
4.- Click Graphs
5.– Complete el recuadro como se indica a
continuación:
6.- click OK en cada recuadro.
Interpretando tus resultados
Use una α de 0.05 para todos los
anαlisis.
La ecuación de regresión
La ecuación de regresión es:
El golpe = 16.5 +3.21 AFR +O.386 Succión +0.0166
Descarga
Tabla del coeficiente
El valor de p más bajos (p < 0.05) en la tabla
del coeficiente indica que todas las condiciones en el modelo son
significantes.
Análisis de variación
Porque p (0.000) es menor que α
(0.05) puedes rechazar H0. El modelo de la
regresión que incluye AFR; las Succiones y la Descarga son
significativamente buenas que el modelo restringido que no
incluye ninguna predicción.
Interpretando tus resultados
Las gráficas residuales verifican que se han
reunido todas las asunciones acerca de los residuales. Los
residuales:
- No parta substancialmente de la
normalidad. - Aparece la distribución aleatoria a
cero. - Aparece tener la variación constante por los
todos valores de ajustes. - No exhiba un tiempo – el
efecto del orden.
Consideraciones finales
Conclusiones prácticas
El mejor modelo para predecir el golpe es:
Knock= 16.5 +3.21 AFR+0.386 Intake + 0.0166
Exhaust
Consideraciones estadísticas
Antes de usar el mejor subconjunto de regresión
para evaluar los modelos de regresión que son diferentes,
asegúrate de que tus predicciones y respuestas son validas
para todo el modelo potencial sean modelos validos de
regresión.
Todos reglas y las guías también
pertenecen a los modelos de la regresión múltiple
también aplican cuando Escoge un modelo que usa este
procedimiento.
Objetivos:
- Compare grupos de
variables usando una prueba de varianza. - Compare las medias de las muestras recolectadas en
diferentes niveles de un solo factor utilizando One-Way
ANOVA. - Compare las medias de las muestras recolectadas en
diferentes niveles de un solo factor usando el análisis
de la media. - Compare las medias de las muestras recolectadas en
diferentes niveles de uno o más factores utilizando
Balance ANOVA. - Compare las medias de las muestras recolectadas en
diferentes niveles en mas de un factor utilizando el Modelo
Lineal General.
Contenidos
Ejemplos y ejercicios | Propósito | Pagina |
ANOVA sentido único | 136-149 | |
Ejemplo 1 El Precalentamiento del CRT Time | Evalúe la diferencia entre los medios | |
El análisis de la media | 150-154 | |
Ejemplo 2 El Precalentamiento del CRT Time | Evalúe la diferencia entre los grupos de | |
ANOVA equilibrado | 155-167 | |
Ejemplo 3 El Uso de la pintura | Emplee el blocking de variables para reducir la | |
El Modelo Lineal General | 168-185 | |
Ejemplo 4 La Distancia de frenado | Evalúe la diferencia entre las medias del | |
Ejercicio 4.1 Prueba de Vino | Evalúe la diferencia entre las medias del | |
Ejercicio 4.2 El Volumen | Evalúe la diferencia entre las medias del |
One Way ANOVA
Ejemplo 1
Precalentamiento del CRT Time
Ejercicio
Tu estás probando tres lotes de tubos de rayo
catódico para determinar si los períodos del
precalentamiento son consistentes.
Recolección de datos
Una muestra aleatoria de cuatro tubos se toma de cada
lote y es probada durante el tiempo del
precalentamiento.
Herramientas
Stat > ANOVA > Test for Equal
Variances.
Stat > ANOVA > One-Way.
Set de datos
CRT.MPJ
Nombre | Tipo de dato | Tipo de Variable | Niveles |
Tubetype | Numérico | Factor | 1,2,3 |
Time_sec | Numérico | Respuesta |
ANOVA One Way
¿Qué es ANOVA One-Way?
One-Way ANOVA (Análisis de varianza)
procedimiento es una generalización independiente de las
pruebas t. Al
contrario de la prueba t. Sin embargo, One- Way ANOVA puede
usarse para analizar las medias de más de dos grupos
(muestras) de una vez.
La lógica
básica detrás de ANOVA es:
- La variación dentro del grupo sólo es
debida al error aleatorio. - Por consiguiente, si la cantidad de variación
de los grupos es similar dentro de los grupos (lo alto dela
grafica), es probable que la media del grupo sólo
difiera también debido al error aleatorio.
- Sin embargo, si la variación dentro del grupo
es relativamente grande dentro del grupo de variación (
gráfico) es probable que las diferencias entre las
medias del grupo sean causadas por las diferencias por las
marcadas de los niveles de factor.
¿Cuándo usar One-Way
ANOVA?
Use One-Way ANOV (también llamado el solo factor
ANOVA) cuando tengas respuestas continuas de datos de dos o
más niveles fijos de un solo factor.
Antes de aceptar los resultados en el ANOVA, debes
verificar las siguientes suposiciones acerca del residual y
validar los resultados.
- La residual debe ser independiente ( y ser la
azar). - La residual no tiene una desviación sustancial
de la distribución normal. - La residual debe tener constantes variaciones a
través de los niveles de factor.
¿Por qué usar One Way
ANOVA?
One-Way ANOVA te puede ayudar las preguntas de la
respuesta como:
- ¿Hay diferencias entre los productos de
tus proveedores? - ¿Hay diferencias entre los tratamientos de los
grupos?
Por ejemplo
- ¿ La dureza de las muestras de plásticos de tus cuatro o proveedores son
diferentes? - ¿La combustión es más eficaz
cuándo usas el aditivo de combustible A, B o
ningún aditivo de combustible? - ¿Las fuerzas de las muestras plásticas
son de sus cuatro proveedores diferente? ¿La
combustión es más eficaz cuándo usted usa
el aditivo de combustible UN, combustible B aditivo, o
ningún aditivo de combustible?
Validando la Variación Iguales
Usa la prueba para las Variaciones iguales para validar
las suposiciones que las variaciones de todos los grupos
comparados sean iguales.
Las respuestas de datos de cada grupo deben estar en la
misma columna, con el nivel de factor indicado en otra
columna.
Use el nivel de confianza de 95% por default.
Test for Equal Variances
1.- Abre el proyecto
CRT.MPJ.
2.- Escoge Stat >ANOVA >Test for Equal
Variances.
3.- Completo el cuadro de diálogo como
indica a continuación>
4.- Pulse el botón OK
Interpretando sus resultados
Intervalos de Confianza
Los intervalos de confianza son útiles para
comparar la σ para las diferentes
poblaciones. Sin embargo, tu decisión acerca si las
variaciones son iguales deben ser basado en una prueba de
varianza apropiada.
Del gráfico, aparece una sigma para el tubo tipo
2, más largo que para los otros grupos.
Pruebas de las variaciones
Los resultados incluyen dos pruebas de la
variación separadas.
Qué prueba uses depende de tus datos:
- Si tus datos son continuos y normalmente
distribuidos, use la Prueba de Bartlett"s. (Sí solamente
se comparan dos grupos, un F-prueba reportara
instantáneamente una prueba Bartlett"s). - Si sus datos son continuos, pero no necesariamente
normalmente distribuidos, use la Prueba de
Levene"s.
Conclusión
Los p-valores para ambas pruebas (p=0.100 para
Bartlett"s Test; p=0.248 para Levene"s Test) es mayor que 0.05.
Pero no hay bastante evidencia así ( que con un nivel de
0.05 σ) se concluye que las
variaciones no son iguales.
Ejecutando One-Way ANOVA
Usa One-Way ANOVA para comparar la media del tiempo de
calentamiento para diferentes tipos de tubos de rayo
catódico, y crea los gráficos para visualizar los
datos.
One- Way
1.- Escoge el
Stat>ANOVA>One-Way.
2.- Complete el recuadro como se indica a
continuación:
3.- Click Graphs.
4.- Selecciona Doplots of data and Boxplots of
data.
5.- Click OK en cada cuadro de
diálogo.
Interpretando sus resultados
Boxplots
La grafica boxplot muestra que el rango de valores en el
Grupo 2 es más grande, que el de los otros
grupos.
Dotplots
La grafica dotplot revela que el grupo 2 contiene una
sola observación con un extraordinario valor
alto. Con sólo 4 observaciones en cada grupo, tal
línea de fuera tiene largos efectos en la media y una
desviación de la muestra.
Tales fuera de línea como esta puede ser el
resultado de una variación aleatoria, o ellos pueden
indicar que algún empalme pasó en tu proceso. Tu
debes investigar las líneas de fuera para determinar que
causo que eso fuera posible.
Para el presente análisis, asume que todas las
observaciones son válidas.
Interpretando sus resultados
El análisis de varianza
La primera fila en la tabla del análisis de
varianza contiene todas las estadísticas asociadas con el
factor: tybetype. La siguiente fila contiene todas las
estadísticas asociadas con el error aleatorio (
error).
Los grados de libertad
Los grados de libertad (DF) se refieren al número
de valores usados para calcular la suma de los cuadrados (SS)
para cada fuente.
La suma de cuadrados
La suma de cuadrados (SS) es la medida de la cantidad de
variabilidad que cada fuente contribuye a los datos. Note que el
importe global de variabilidad en los datos (SS suman, 378.7) es
igual al SS para el tubetype (114.7) más el SS para el
Error (264.0).
Media cuadrada
(MS) para cada fuente es igual al SS dividió por
el DF.
- El MS para el factor es una estimación del
promedio de la media junto con el grupo de
variabilidad. - El MS para el error es una estimación del
promedio dentro del grupo.
ANOVA sentido único: el time_sec contra el
tubetype
Interpretando sus resultados
F-estadística
F es el radio de la
variabilidad contribuida por el factor de la variabilidad
contribuida por el error. Es calculado como el MS para el factor
(el tubetype) dividió por el MS para el error.
Cuando las diferencias entre el nivel de factor de la
media es similar a las diferencias entre las observaciones de
cada nivel. F será cerrado a 1.
Si la variabilidad entre el nivel de factor de la media
es mas larga que la variabilidad entre las observaciones dentro
del factor, F será más grande que 1.
El P-valor
P-valor es la probabilidad que
F sería tan grande como es (o más grande) si su
factor no tiene los efectos. Cuando F es grande, sugiere que el
nivel de factor de la media es más diferente que los
esperados para la ocasión. Así que
p-valor es pequeño.
Use el p – el valor de probar las hipótesis lo
siguiente:
Ho( hipótesis nula) todos los factores del nivel
de la son iguales.
H1(la hipótesis alternativa) todos los factores
del nivel de la son diferentes.
Conclusión:
Porque P es mayor que (0.05), tu no puedes rechazar Ho.
No hay suficiente evidencia para sugerir que los niveles de las
medias son diferentes.
Interpretando sus resultados
95% CIs individuales Para la Media
Para cada nivelado de tu factor MINITAB despliega el
intervalo de confianza., Así como lo siguiente las
estadísticas:
- N——— Número de
observaciones. - Mean— Media de las observaciones.
- StDev— Desviación estándar de las
observaciones
Los intervalos de confianza
Los intervalos de confianza representan rangos de
valores probables para la media de cada nivel. Tu puedes estar
seguro en un
95% que µ ( de la población de la media) para cada nivel esta
dentro del rango indicado.
Calculando los intervalos, MINITAB combina las
desviaciones estándar de cada nivel con la
estimación agrupada de σ (
desviación estándar de la población)
también llamada desviación estándar agrupada
( Pooled StDev).
Note que hay mucho traslapo entre los intervalos para
los tres los tipos de tubos diferentes. Ésta es una buena
indicación de que las medias no son significativamente
diferentes uno del otro
Sin embargo, la prueba de la comparación es
necesaria antes de que cualquier conclusión pueda
figurar.
ANOVA sentido único: el time_sec contra el
tubetype
Validando las Suposiciones de la
Residual
Antes de que tu puedas confiar en los resultados de un
One-Way ANOVA, tu debes revisar que todas las suposiciones acerca
de la residual han sido encontradas.
Usa One Way para crear unan grafica de
residuales.
One-Way
1.-Escoja Stat >ANOVA > One-Way o
presiona Ctrs + E para regresar al recuadro de One
Way.
2.-Click Graphs.
3.- Complete el recuadro como se indica a
continuación
- – Click OK en cada cuadro de
diálogo.
Interpretando sus resultados
La grafica de probabilidad normal
Usa la grafica de probabilidad normal de la residual
para verificar que tu residual no este desviado sustancialmente
de la distribución normal.
- Si la residual viene de la distribución
normal, los puntos seguirán una línea
recta. - Si la residual no viene de la distribución
normal, los puntos no seguirán una línea
recta.
Basado en esta grafica, es razonable asumir que la
residual de los datos de CRT no están desviados
sustancialmente de la distribución normal.
Como notaste previamente, hay una línea de fuera
en el conjunto de datos. Tu debes investigar la línea de
fuera para determinar que fue lo que la hizo posible.
Alternativas
Tu también puedes usar un histolograma de la
residual para evaluar la normalidad. Sin embargo la grafica de
probabilidad normal es generalmente fácil de interpretar,
especialmente para muestras pequeñas.
Interpretando sus resultados
Residuales contra Fits
Use la grafica de la residual versus las fits para
verificar que las siguientes suposiciones han sido
encontradas:
- Variaciones constantes a través de la
combinación de todos los factores. - No están fuera de línea los
datos.
Si tú ves cualquier tipo de patrón en la
grafica, una de estas suposiciones encontradas han sido violada.
La tabla abajo resume los tipos de patrones que tú puedes
ver
Los patrones: | Indica… |
La extensión desigual de las | La variación de tu residual no es |
Un punto está situado muy lejos del | Fuera de línea. |
Hay un residual extraordinariamente alto da que la
apariencia de una variación no constante. Tu debes
poder
determinar que causo esta línea de fuera. Tal vez es
apropiado volver a analizar los datos sin esta línea. Sin
embargo tu solamente deberías remover la
observación para estabilizarla, sin puede establecer que
no era representativo de la población.
Interpretando sus resultados
La residual versus el orden
Utiliza la grafica de la residual contra el orden para
verificar que la residual es independiente.
- Si hay un efecto debido al orden de la
recolección de los datos, los residuos no se
esparcirán aleatoriamente cerca del cero. Tu debes ser
capaz de detectar este patrón en la grafica. - Si hay un efecto debido al orden de la
recolección de los datos, la residual esta
aleatoriamente cerca del cero.
La grafica revela la misma fuera de línea
identificada en la grafica de residual contra el Fitted values
plot.
Ignorando la línea de fuera por un momento, hay
dos valores muy bajos que ocurren uno después del
otro.
Tal vez en alguna causa especial causo que la
recolección de los tubos y las pruebas del tiempo de
calentamiento fueran mas rápidamente que los otros
tubos.
Tal vez valga la pena investigar.
Puede haber también evidencia de un aumento
sistemático en el precalentamiento para los primeros
cuatro tubos probados.
Consideraciones finales
Conclusiones prácticas
El análisis los tubos de rayo catódico no
revelaron ninguna diferencia en el tiempo de calentamiento. Sin
embargo existen problemas potenciales con el estudio:
- Fuera de línea— Un valor aparece fuera de
línea y debe ser investigado. Puede haber también
evidencia de un incremento sistemático en el tiempo de
calentamiento de los primeros cuatro tubos
probados. - Los Patrones— dos tubos consecutivos tienen
más corto el tiempo de calentamiento que lo
normal. - Bajo Power— basado en una estimación de un
5.416, el power de la prueba para descubrir una diferencia de 7
segundos (a los 0.05 nivel) es solamente de 0.2642 . Esto es
está menos de un 27% de oportunidad para descubrir una
diferencia. De hecho en el orden tu tienes un power de 0.80, y
deberías tener una diferencia de .80
segundos/
Basado en estos resultados, quizás el curso mejor
de acción
sería asegurar el proceso bajo control y
recolectar muestras grandes y realizar la prueba nuevamente. Con
una sigma reducida de 3.0 y una recolección de 6 muestras
de tubos de cada lote, tu puedes detectar una diferencia de 7
segundo con un power de 0.9133
Consideraciones estadísticas
Comparando el nivel del factor múltiple con un
solo ANOVA es preferible a hacer una comparación de dos
niveles del tiempo con dos muestras separadas Esto es porque
dirigiendo los aumentos de las pruebas extras incrementa tu
posibilidad de error tipo 1 (rechazando Ho, cuando Ho es
verdadera.
Las suposiciones de la independiente son criticas. Si
las observaciones son afectadas sistemáticamente por otros
factores que el que usted este estudiando los resultados de este
ANOVA son sin sentido.
La suposición de la normalidad no es generalmente
crucial especialmente en muestras grandes.
Ejemplo 2 CRT Revisión de tiempo de
calentamiento
Problema
En el ejemplo 1 (página 4-3) realizaste una
prueba de tres lotes de tubo de rayo catódico para
determinar si los periodos de calentamiento son
consistentes.
Colección de datos:
Una muestra al azar de los cuatro tubos es tomada de
cada grupo y probadas para determinar el tiempo de calentamiento
(Los datos de la muestra son tomados del ejemplo 1, Pagina
4-3).
Herramientas:
Stat > ANOVA >Analysis of Means
Set de Datos
CRT.MPJ
Nombre | Tipo de dato | Tipo de Variable | Niveles |
Tubetype | Numérico | Factor | 1,2,3 |
Time_sec | Numérico | Respuesta |
Análisis de la media
¿Qué es un análisis de la
media?
No es nada parecido que el ANOVA, el cual es usado
para determinar si el nivel de la media difiere de algún
otro, el análisis de la media ( ANOM) es usado para
determinar si el nivel de la media es diferente de la gran
media.
La gran media es la media de todas las observaciones sin
tener en cuenta el nivel. Por ejemplo: si tú tienes cuatro
observaciones por cada 3 niveles en el factor, la gran media es
la suma de las 12 observaciones divididas entre 12.
El resultado de un análisis de la media es
usualmente similar al obtenido con el ANOVA. Sin
embargo:
- El análisis de la media es generalmente
más sensible que el ANOVA, cuando un nivel de la media
es difiere del resto. - ANOVA es generalmente más sensible que el
análisis de la media cuando los niveles de los grupos de
la media son diferentes cada uno de los otros.
¿Cuándo usar el análisis de
la media?
Usa el análisis de la media cuando tengas datos
de uno o dos factores. Los datos deben de proceder de la
distribución normal, Binomial o Distribución de
Poisson.
¿Porqué usar el análisis de
la media?
El análisis de la media te ayuda a responder
preguntas tales como:
- ¿Es un tratamiento mejor que el
promedio?
Por ejemplo:
- Entre tablas tratadas con diferentes acabados, un
acabado confiere mejor que el promedio de las otras
características utilizadas.
Desarrollo del análisis de la
media
Use el análisis de la media para evaluar los
datos. Use un ∞ de 0.05 para la prueba
Análisis de la media:
1. – Elija: Stat > ANOVA >Analysis of
Means.
2.- Complete el recuadro como se indica a
continuación
3.- Presione OK
Interpretando tus resultados
El análisis de la media comparado con el nivel de
la media (puntos negros) con la gran media (línea central
verde. La gran media es la media de las 12
observaciones.
Si un nivel de la media es mayor o menor que el valor
critico representado por la línea decisiva (en rojo) esta
es significativamente diferente de la gran media.
Conclusiones:
Ninguno de los niveles individuales de la media de los
datos de la CRT son significativamente diferentes de la gran
media.
Consideraciones finales
Consideraciones prácticas:
Diferencias no significativas fueron detectadas en medio
del nivel del factor de la media y de la gran media.
Sin embargo recordemos que cuando los mismos datos
fueron analizados únicamente con el procedimiento de ANOVA
se observaron algunos problemas con el control del proceso. La
mayor desventaja del procedimiento de Análisis de la media
es que no suministra graficas de
residual para ayudarte ubicar problemas en los datos.
Consideraciones estadísticas
Los resultados del análisis de la media son
usualmente similares a los obtenidos con ANOVA, Sin
embargo:
- El análisis de la media es generalmente
más sensible que el ANOVA, cuando un nivel de la media
es diferente del resto. - ANOVA es generalmente más sensible que el
análisis de la media cuando los niveles de los grupos de
la media son diferentes cada uno de los otros.
Si bien usando ANOVA con dos factores, el diseño
debe tener balance (esto es, debe tener los mismos números
de observaciones por cada combinación de niveles de
factor.
Si bien usando ANOVA con datos binomiales, np y n(1-p)
deben los dos tener por lo menos cinco, porque ANOVA usa una
aproximación normal de la binomial ( n es el tamaño
de muestra que deben tener todas las muestras, y P es
generalmente proporcional.
Para datos de Poisson, la media debe ser por lo menos de
5.
Ejemplo 3 Desgaste de pintura
Problema
Estas estudiando las características que deben
llevar los cuatros diferentes tipos de pintura
amarilla para carreteras.
Recolección de datos:
Pruebas de restos de cada pintura que fueron aplicadas
en las carreteras de Filadelfia, Pittsburg, Harrisburg y
Scranton, Pensilvania.
Después de un tiempo conveniente de exposición
al mal tiempo y al tráfico, el desgaste de la pintura fue
medido en cada una de las cuatro localizaciones. Un alto puntaje
de la media arrojo que la pintura estaba erosionada.
Herramientas:
Stat > Anova-One-way.
Graph > Chart.
Stat-ANOVA > Balanced ANOVA.
Set de Datos
PNTWEAR.MPJ
Balanced ANOVA
¿Qué es el balance
ANOVA?
Balance ANOVA es similar al ANOVA, excepto que las
respuestas pueden ser clasificadas en dos o más factores
al mismo tiempo.
Por ejemplo: La tabla de abajo es el diseño de un
estudio para evaluar si la temperatura del motor funcionando es
un factor de ambos: Peso del aceite y las
revoluciones por minuto del motor.
RPM | |||
Aceite | 1,000 2,000 3,000 | ||
5w30 | RPM = 1,000 Aceite = 5w30 | RPM = 2,000 Aceite = 5w30 | RPM = 3,000 Aceite = 5w30 |
10w30 | RPM = 1,000 Aceite =10w30 | RPM = 2,000 Aceite =10w30 | RPM = 3,000 Aceite = 10w30 |
La información de cada celda de la tabla
representa la única combinación de RPM y aceite.
Las observaciones son clasificadas en las dos
variables.
¿Cuándo usar Balance
ANOVA?
Usa Balance ANOVA cuando tengas respuestas continuas de
datos fijos en uno o más factores. Los datos deben estar
balanceados, Esto es, "deben tener los mismos números de
observaciones en cada celda del diseño.
Antes de aceptar los resultados en el ANOVA, debes
verificar las siguientes suposiciones acerca del residual y
validar los resultados.
- La residual debe ser independiente ( y ser la
azar). - La residual no tiene una desviación sustancial
de la distribución normal. - La residual debe tener constantes variaciones a
través de los niveles de factor.
¿Por qué que usar Balance
ANOVA?
Balance ANOVA te puede ayudar a responder preguntas
tales como:
- ¿Hay diferencias en tus productos a causa de
varios factores identificados? - ¿Son ciertas combinaciones de los niveles de
factor ideales?
Por ejemplo,
- ¿El nivel de temperatura del motor funcionando
cambia por el factor de RPM o Peso del aceite?. - ¿Existen ciertos cambios de maquinas en tus
planta que son mas productivos que otros, o es una maquina mas
productiva en ciertos cambios, pero no en otras?
Ejecutando One Way ANOVA
Para una comparación, primero ejecuta one-way
ANOVA, para analizar el desgaste de la pintura como un factor del
tipo de pintura solamente.
One-Way ANOVA
1.- Abre el proyecto PNTWEAR.MPJ.
2.- Escoge Stat > ANOVA-ONE WAY
.
3.- En Respuesta enter PntWear.
4.- En Factor enter Paint.
5.- Click OK.
Interpretando tus resultados
Aunque la mejor pintura es la de Y-0242 (media = 14.25)
y la peor de Y-1725m (media = 10.75) estas diferencias fueron no
significativas "en el nivel 0.05 ∞ (p =0.115).
Graficando los datos
Información importante se pierde cuando no
incluyes el factor de localización en tu análisis.
Para ilustrar esto, usa el chart para crear unas barras agrupadas
ilustrando el desgaste de la pintura en función de
ambos tipos: de pintura y locacion.
Chart
1.- Escoge Graph > Chart.
2.- Complete el recuadro como se indica a
continuación.
* Asegúrate de cambiar para cada uno de
Graph a Group.
3.- Click: Options.
4.- Revisa el Group y enter
Paint.
5.- Click OK en cada recuadro.
Interpretando tus resultados
La grafica muestra una gran cantidad de variabilidad en
los datos asociados con Localización. En general, el menor
desgaste de pintura se presenta en Philadelphia y la peor en
Scranton.
Cuando tu no incluyes "Localización" en tu
análisis, esta variabilidad es atribuida al error (dentro
del grupo con variación). Esto disminuye tu F
ratio.
Usando una segunda variable del bloque de
variación de Locación.
Incluyendo locación en tu análisis quieres
prevenir la variabilidad asociada con este factor, donde se les
atribuye el error. Esto incrementara tu habilidad para detectar
diferencias en desgaste de cada pintura.
Usa Balance ANOVA para analizar si el desgaste de
pintura es un factor de ambos Pintura y Localización. Esto
es llamado: Diseño aleatorio del bloque, porque el factor
de interés
es la pintura, y Localización es incluido solamente para
reducir el error de variabilidad, Tal factor es llamado "Variable
de bloque".
La respuesta debe estar en una columna con descripciones
y columnas adicionales indicando los niveles de cada factor por
cada observación.
Balance ANOVA
1.- Escoge Stat > ANOVA > Balance
ANOVA.
2.- Complete el recuadro como se indica a
continuación
3.- Click OK.
Interpretando tus resultados
En este modelo el efecto de ambos: Pintura y
Localización son significantes en un nivel 0.05 ∞ (p
= 0.003 y 0.007 respectivamente).
Note que el MS del error (también llamado MSE) en
este modelo es solamente 1.285, comparado con el 4.190 del modelo
que no incluyo localización como factor, porque el MSE es
el denominador de todos los F-ratios, reduciendo el MSE,
incrementa el F-Values.
Analizando el residual
Después de que confíes en los resultados
de ANOVA, debes revisar, para estar seguro de todas las
suposiciones acerca del residual que hayas encontrado.
Usa Balance ANOVA para crear una tabla de
Residual.
Balanced ANOVA
1.- Escoge Stat > ANOVA > Balanced
ANOVA y presiona Ctrl + E para regresar a Balance Analysis
of Variance de los recuadros.
2.- Click Graphs.
3.- Marca las cuatro
opciones bajo Residual Plots.
4.- Click OK en cada recuadro.
Interpretando tus resultados
Usa un cuadro de distribución normal y un
histolograma para verificar que tu residual no este desviado
considerablemente de la distribución normal.
- Si la residual viene desde la distribución
normal, los puntos tienen una línea recta en la grafica
normal y en el histolograma no tiene una forma de campana
recta. - Si el residual no viene desde una distribución
normal, los puntos no continúan en línea recta en
la grafica Normal y en el histolograma no tiene forma de
campana.
Basado en los recuadros, es razonable asumir que la
residual no esta desviada sustanciablemente de la
distribución normal. (Normalmente pruebas ejecutadas del
residual (no presentadas en este ejemplo) produce que p = valor
menos de 0.423.)
Interpretando tus resultados
Usa las graficas de residual contra el ajuste para
verificar que las siguientes suposiciones han sido
encontradas:
- Variaciones constantes a través de la
combinación de todos los factores. - No están fuera de línea los
datos.
Si tú ves cualquier tipo de patrón en la
grafica, una de estas suposiciones encontradas has sido violada.
La tabla abajo resume los tipos de patrones que tú puedes
ver:
Los Patrones | Indican……… |
La extensión desigual de las | La variación de tu residual no es |
Un punto está situado muy lejos del | Fuera de línea. |
Para los datos del desgaste de pintura, la varianza de
la residual aparece bastante constante.
Interpretando tus resultados
Usa la grafica de la residual contra el orden de los
datos para verificar que las residuales son
independientes.
- Si hay algún efecto debido a la
recolección de los datos, la residual no será
aleatoriamente dispersa cerca del cero. Tú serás
capaz de detectar este patrón en la grafica. - Si no hay algún efecto debido al orden de la
recolección de datos las residuales serán
aleatoriamente dispersas cerca del cero.
No hay ningún patrón que aparezca en las
residuales, por lo tanto las suposiciones de independencia
son validas.
Consideraciones finales
Conclusiones prácticas:
Inicialmente un simple análisis de los tipos de
pintura no revelo diferencias significativas. Sin embargo cuando
Locación fue incluida en el análisis de un bloque
de variable, efectos significativos de la pintura fueron
revelados.
Esto ilustra una de las ventajas del modelo de
Multi-Factor ANOVA:
- Tú puedes algunas veces disminuir la cantidad
de un error inexplicable de variación en la respuesta,
si incluyes factores adicionales en el modelo. - Tú puedes algunas veces aprovechar recursos
investigando dos o más factores en el mismo
tiempo. - Con un modelo apropiado, tú puedes evaluar
interacciones entre dos factores. Esta interacción ocurre cuando los efectos de
un factor cambian basándose en el nivel de algún
otro factor.
Consideraciones estadísticas:
Para usar Balance ANOVA tus datos deben estar
balanceados.
Es importante validar las suposiciones de la residual
después dibujando las conclusiones finales de los
resultados de cualquier ANOVA.
Modelo Lineal General
Ejemplo 4 Distancia de frenado.
Problema:
Tú quieres conocer si la distancia que le toma a
un carro para frenar en un pavimento mojado es afectada por los
siguientes factores:
- El Modelo de la llanta (Llanta).
- La banda de rodadura (Tread).
- Si el seguro de freno es adecuado (ABS).
Colección de datos
El mismo carro es utilizado para la recolección
de los datos. La distancia requerida para frenar a una velocidad
de 40 millas por hora en un pavimento mojado fue medida con cada
combinación de llantas, banda de rodadura y el ABS.
Corridas experimentales fueron realizadas en orden
aleatorio.
Herramientas:
Stat-Table > Cross Tabulation.
Stat-ANOVA > Balanced ANOVA.
Stat-ANOVA > General Linear Model.
Set de datos
BRAKEDIS.MPJ
Nombre | Tipo de datos | Tipo de variable | Niveles |
Llanta | Texto | Factor | MX,GT,LS |
Banda de rodadura | Numérico | Factor | 10, 1.5 |
ABS | Texto | Factor | Capaz No capaz |
Distancia | Numérico | Respuesta |
Modelo lineal General
¿Qué es el Modelo lineal general (
GLM)?
GLM es similar al Balance ANOVA excepto que:
- Puede ser usado en pruebas de diseño no
balanceadas. - Puede ser usado también para comparar los
niveles individuales de las medias.
¿Cuándo usar el Modelo lineal
general?
Usa el GLM cuando tengas respuesta continúas de
datos de niveles estables de uno o más factores. El
diseño no debe ser balanceado.
Después de aceptar los resultados del ANOVA,
tú debes verificar que las siguientes suposiciones acerca
de la residual sean validas en tus datos:
- La residual debe ser independiente (y de esta manera
al azar). - La residual no debe estar desviada sustanciablemente
de la distribución normal.
La residual debe tener constantes variaciones a
través de todos los niveles de factor.
¿Por qué usar el Modelo lineal
general?
GLM te ayuda a responder preguntas tales
como:
- ¿Hay diferencia en tu producto
debido a diferentes factores identificados? - ¿Son ciertas combinaciones de niveles de
factor ideales?
Por ejemplo,
- ¿Es el color del plástico generalmente
mejor cuando la presión es alta, o depende este de la
presión?
Observando los datos en la tabla
Usa CROSS tabulación para crear una tabla con los
datos para ver posibles diferencias entre doce combinaciones
tratadas.
Cross tabulación
1.- Abre el proyecto BRAKEDIS.MPJ.
2.- Escoge Stat > Table-Statistics
descriptive.
3.- En Classification variables enter Tire
Tread ABS.
4.- En Asociated variables enter
Distancia.
5.- Complete el recuadro como se indica a
continuación.
6.- Click OK en cada recuadro.
Interpretando tus resultados
Principales efectos
Note que la media de la distancia de frenado cuando el
ABS no es utilizado es de 90.667. Este es más largo que la
distancia que requiere para frenar con ABS (74.750) la diferencia
es llamada Principales efectos del ABS.
Efectos de interacción
Note que:
- Cuando el ABS fue no utilizado, el 1.5 mm de la banda
de rodadura frena mas rápidamente
( media = 90.16 ) que el 10.mm de banda de rodadura (
media =91.167).
- Cuando el ABS fue utilizado, el 10.0 mm de banda de
rodadura (media = 73.833) frena mas rápidamente que el
1.5 mm de la banda de rodadura"( media = 75.667).
Los efectos son llamados interacción del
ABS by tread, porque los efectos de la banda de rodadura
dependen del nivel del ABS. (Sin embargo las diferencias no
son grandes. Una prueba apropiada revelara que la
interacción no es significante.
Analizando tu modelo completo
Usa el balance ANOVA para analizar el modelo completo.
El modelo completo contiene todos los posibles efectos e
interacciones.
Anotaciones
Para indicar los términos de interacción,
simplemente junta los nombre con un asterisco. De esta manera el
modelo completo de frenado a distancia de los datos contiene los
siguientes términos:
Como un atajo el modelo completo puede ser usado
también cargando los datos en barra vertical.
Tire Tread I ABS
Las barras verticales le dicen al minitab que considere
los efectos principales e interacciones contenidas en medio de
los términos indicados.
Balance ANOVA
1.- Escoge Stat > ANOVA > Balanced
ANOVA.
2.-Complete el recuadro como se indica a
continuación
3.- Click OK.
Interpretando tus resultados
Usa el Valor de P, para la prueba de
significancía de cada término. En este modelo los
siguientes efectos son significantes en un 0.05
∞.
- Llanta (p = 0.003).
- ABS (p = 0.000).
Porque hubo solamente dos niveles del ABS (capaz y no
capaz), tú sabes que la significancía en los
términos refleja diferencias significativas entre los dos
niveles.
Prueba de comparación
Porque hubo tres niveles en las llantas, tu quieres
realizar una comparación estadística en orden para
determinar cuales niveles son diferentes entre cada
uno.
El procedimiento Balanced ANOVA no permite comparaciones
individuales entre niveles de la media, por eso vas a usar el
Modelo lineal general para dirigir las pruebas después de
eliminar las no significancías y revisar el
residual.
Ajustando el modelo reducido
El paso siguiente para ajustar el modelo reducido es
removiendo los términos no significantes. Usa el modelo
lineal general para ajustar el modelo con solo la llanta y el
ABS. (El modelo proporciona opciones para analizar las
diferencias entre niveles individuales de la media).
Tú debes también crear graficas de
residual, para poder validar las suposiciones de la
prueba.
Modelo Lineal General
1.- Escoge Stat > ANOVA > General Linear
Model.
2.- Complete el recuadro como se indica a
continuación.
3.- Click Graphs.
4.- Revisa las opciones bajo Residual
Plots.
5.- Click OK en cada recuadro.
Interpretando tus resultados
Como es esperado, ambos: Llanta y ABS, tengan una
significancía de 0.005 ∞ del nivel en el modelo
ajustado.
Interpretando tus resultados
Basado en la grafica de probabilidad normal y en el
histolograma es razonable asumir que el residual no esta desviado
sustanciablemente de la distribución normal.
Interpretando tus resultados
La grafica de la residual contra el ajuste, confirma que
la variación de la residual es bastante
constante.
La grafica de la residual contra el orden de los datos
no presenta ningún patrón, de esa manera las
suposiciones de independencia parecen ser validas.
No parece haber ninguno fuera de
línea.
Graficando los principales efectos e
interacciones
Comparación gráfica de la
media
Ahora que tú te has establecido en un modelo,
este es usado para visualizar los resultados del análisis
de la media utilizando las graficas y los principales efectos e
interacciones.
Aunque tú has elegido no incluir todos los
términos del modelo final, es de mucha ayuda incluir todos
los factores en las graficas para visualizar términos
significantes y no significantes.
Principales efectos e interacciones
graficas
1.- Elige Stat > ANOVA > Main Effects
Plot.
2.- En Response presiona
Distance.
3.- En Factors presiona Tire Tread
ABS.
4.- Presiona OK.
5.- Elige Stat > ANOVA > Interactions
Plot.
6.- En Response presiona
Distance.
7.- En Factors presiona Tire Tread
ABS.
8.- Presiona OK.
Interpretando tus resultados
La gráfica de efectos principales de llanta y ABS
tienen líneas inclinadas, indicando que estos efectos son
importantes.
En esta gráfica esta claro que:
- La Llanta con la distancia mas corta de frenado fue
la GT. - Las distancias de frenado mas cortas fueron llevadas
a cabo con el sistema
ABS.
La grafica de la banda de rodadura muestra una
pequeña inclinación sugiriendo que los efectos no
son significativos. Las bandas de rodadura producen casi
idéntica frenada a distancia.
Interpretando tus resultados
Las interacciones de la grafica muestran los dos
sentidos de la interacción. Los nombre de los factores a
la izquierda de cada grafica son representados en el eje Y, y
todos los factores llamados por debajo de cada grafica son
representados en el eje X.
Las líneas de cada grafica en su mayor parte
paralelas, sugieren que no hay interacción en medio de
ningún término. Pero es quizás alguna
evidencia de una interacción entre las llantas y la banda
de rodadura pero el ANOVA índico que esto no fue
significante.
Conduciendo la comparación del
desgaste de pintura
Utilice el modelo lineal para probar las diferencias
entre los niveles de factores significantes.
General Linear Model
1.- Elija Star > ANOVA > General Linear
Model.
2.- Presione F3 para regresar a las opciones
generales
3.- En Response enter
Distancia.
4.- En Model enter Tire ABS.
5.- Presiona Comparison.
6.- Completa el recuadro como se indica a
continuación:
7.- Presiona OK en cada
recuadro
Interpretando tus resultados
Use un ∞ de 0.05 para todas las
pruebas.
La primera tabla compara las llantas GT con las LS y las
MX. Los resultados revelan que el promedio de distancia de
frenado obtenidos con las llantas GT es significativamente mas
bajo que los obtenidos con cualquier de las otras llantas LS (p =
0.0008) y MX (p = 0.0131).
La segunda tabla compara las llantas LS y MX, donde no
hubo diferencias significativas (p = 0.4436)
Consideraciones finales
Conclusiones prácticas
En los términos de frenado y pavimento mojado, la
mejor llanta es la GT. También es mejor tener el sistema
ABS disponible, y no parece muy importante que la banda de
rodadura sea de 10. mm o 1.5 mm de profundidad.
Consideraciones estadísticas
Las ventajas del procedimiento incluyen lo
siguiente:
- Puede ser usado con un modelo
desbalanceado. - Puede ser usado para evaluar las diferencias entre
niveles individuales de medias.
Es importante validar las suposiciones del residual,
antes de dibujar cualquier conclusión final de los
resultados del ANOVA.
Este análisis incluye factores estables
significando que los niveles incluidos fueron de interés
directo y no significo que fueran generalizados a otros niveles.
El procedimiento del modelo lineal general puede también
ser usado con factores aleatorios, los cuales son factores para
que los niveles sean seleccionados aleatoriamente y sean
proyectados para representar una mayor población de
posibles niveles.
Un ejemplo excelente es un estudio de un gage
R&R.
Todos los factores en este análisis fueron
cruzados significando por ejemplo, que cada nivel de llanta puede
ser probado con cada nivel de banda de rodadura. Los factores son
considerados jerarquizados si todos lo niveles de un factor
suceden completamente dentro de un nivel de otro.
Ejercicio 4.1 Prueba de vinos
Problema:
Tú tratas de determinar si existen diferencias
significativas en la calidad de tres
vinos: Matador, Conquistador y Saeta.
Colección de datos
10 jueces de vinos probaron tres vinos cada uno y cada
uno califico su calidad. El orden de las pruebas fue aleatorio y
cada juez pruebo los vinos en diferente orden.
Instrucciones:
1.- Use el modelo lineal General para analizar los
puntajes en función del vino.
- Incluye los jueces en el bloque de variables para
reducir la variabilidad. - Realiza el ajuste (Fits) y el residual.
- Incluye el pairwise comparación en el factor
del vino en tus resultados.
2.- Genera los efectos principales en la gráfica
de vinos.
3.- usa Stat > Regression > Residual Plots
para validar las suposiciones del modelo.
Set de Datos
RIOJA.MPJ
Ejercicio 4.2 Contenido de fosfato
Problema
Tú quieres evaluar cuanto tiempo toma el uso del
gravímetro contra el método
spectometrico para medir el contenido fosfato que contienen dos
tipos de material.
Colección de datos
Seis ingenieros tomaron muestras del contenido de
fosfato de cada material usando cada método.
Los datos son de J. Neter, W. Wasserman y M.H. Kutner
(1985) Aplicación lineal del modelo estadístico,
segunda edición
Irwin , In. Pagina 936.
Instrucciones
1.- Use el modelo lineal general para analizar el
tiempo como una función del material y del
método.
- Incluye a los ingenieros en el bloque de variables
para reducir la variabilidad. - Realiza el ajuste (Fits) y el residual.
- Incluye el pairwise comparación y la
interacción entre el método * material en tus
resultados.
2.- Genera una grafica de interacción del
material * método.
3.- Usa Stat > Regression > Residual
Plot para validar el modelo de suposiciones.
Set de datos
PHOSPHAY.MPJ
Trabajo elaborado por
Lic. Cecilia C. Díaz García
Lic. Angélica Esquivel
Ing. Maria Valle
Maestría en Administración y Liderazgo
Materia
Estadística para administradores
Alumnas de la Universidad del
Noreste de Coahuila
Página anterior | Volver al principio del trabajo | Página siguiente |