Interpretando tus resultados
Dos-ejemplos T para Supp1 rA vs Supp1
Rb
N | Media | StDev | SE Media | |
Supp1Ra | 10 | 162.614 | 0.599 | 0.19 |
Suppl1rB | 12 | 155.13 | 1.13 | 0.33 |
Diferencia = mu Supp1rA – mu Supp1rB
Estimación por diferencia: 7.484
95% CI para diferencia: (6.687, 8.281)
T- Testo de diferencia = 0 ( vs no = ): T- Valor = 19.82
P-Valor = 0.000 DF = 17
La resistencia a
ruptura media (medio), y dos medidas de desviación
estándar de la variabilidad-(StDev) y del error de
estándar del medio (el SE Mean)- se presenta para cada
surtidor.
Los intervalos de confianza.
La diferencia entre los medios de la
muestra
(7.484) se utilizan para estimar la diferencia entre los medios
de la población (mu SupplrA-mu SupplrB). El
intervalo de la confianza para la diferencia se basa en esta
estimación la variabilidad dentro de las
muestras.
Usted puede tener una confianza del 95% que la
diferencia entre los medios de la población está
entre 6.687 y 8.281 PSI.
T-valor y el p-valor
El t-valor para la prueba es 19.82, que se asocia a un
p-valor de menos de 0.0005 (que redondeado a 0.000).
Así, usted puede rechazar la hipótesis nula en el 0.05 ά – nivel, y
concluye que las fuerzas son diferentes.
Consideraciones Finales.
Conclusiones prácticas.
El plástico
de A`s del surtidor es perceptiblemente más fuerte y menos
variable que el surtidor B`s. sin embargo recuerda que el
surtidor A también carga más para su producto.
Ahora usted debe decidir si la diferencia entre los surtidores es
de significación práctica.
Usted es el 95% confiable que la diferencia verdadera
entre los surtidores es entre 6.687 y 8.281 pis. Usted decide que
no está dispuesto a pagar el precio alto
más elevado para la pequeña fuerza de
diferencia.
Consideraciones Estadísticas.
Al usar una t-prueba de la dos-muestra:
- La muestra debe ser al azar.
- Las muestras deben ser independientes.
- Los datos de la
muestra deben ser continuos. - Los datos independientes de la muestra deben ser
distribuidas normalmente
Debe ser observado que el procedimiento de
la t-prueba es bastante robusto a las violaciones de la
asunción de la normalidad, la condición de que las
observaciones se recogen aleatoriamente y los datos son
continuos, unimodal, y razonablemente simétricas
(véase a la caja, al cazador, y a Cazador (1978). Estadística para Experimentos,
John Wiley & Sons, Inc.).
Prueba- t Pareada
3 Ejemplos del Estacionamiento de los
Carros.
Problema
Un grupo de
consumidor desea
determinar si hay una diferencia en la manipulación de
capacidad entre dos coches populares. Para medir la capacidad de
dirección de los coches, el tiempo lleva
conductores el parque paralelo que cada uno de los coches se
registra.
Recolección de datos
Veinte conductores parquean ambos coches (en orden al
azar), y el tiempo del estacionamiento registrado (en
segundos).
Herramientas
Stat > Estadísticas Básicas >
Paired
Set de Datos
CARCLT.MPJ
Nombre | Tipo de Dato | Tipo de |
Carro – A | Numérico | Respuesta |
Carro – B | Numérico | Respuesta |
Prueba-t Pareada
¿Qué es una prueba t
pareada?
En una prueba t pareada tu puedes determinar si la media
de la diferencia entre las observaciones pareadas es
significativa Estadísticamente, es equivalente a realizar
una Prueba t de una-muestra de una diferencia. Una t-prueba
pareada se puede también utilizar para evaluar si la
diferencia es igual al valor específico.
Las observaciones pareadas se relacionan de una cierta
manera. Los ejemplos incluyen:
- Pesos registrados para los individuos antes y
después un programa de
ejercicio. - Muestras tomadas de la misma parte con dos diferentes
dispositivos de medida.
¿Cuándo utilizar una prueba t
pareado?
Use una Prueba t pareada cuando tengas una muestra
escogida al azar de observaciones pareadas. Los datos deben ser
continuos.
¿Porqué usar una prueba t
pareada?
Las pruebas t
pareadas t puede ayudar a responder preguntas tales
como:
- ¿Un nuevo tratamiento causa la diferencia en
el producto? - ¿Dos instrumentos de medida hacen lo
mismo?
Para el ejemplo:
- ¿Tratando la madera de
construcción con ciertos productos
químicos aumenta su vida útil? - ¡Pueden dos calibradores medir idénticas
partes de la misma manera?
Conduciendo una prueba t de pareada
Tu estas intentando determinar si un coche se puede
estacionar más rápidamente que otro. Porque se
emparejan los datos (cada individuo
estaciono ambos coches), tu utilizaras una prueba t pareado para
probar las hipótesis
siguientes:
- Ho: La diferencia de la media entre las observaciones
pareadas en la población es cero. - H1: La diferencia de la media entre las observaciones
pareadas en la población no es cero.
Cree los dotplots y los boxplots para ayudar a
visualizar los datos. Utilice el nivel de la confianza del
defecto del 95% para la prueba.
t Pareadas
1.- Abre el Project CARCLT.MPJ.
2.- Elija Stat > Estadísticas
básicas > Pareo t.
3.- Completa el recuadro como se indica a
continuación:
4.- Click Graficas.
5.- Elija Doplot de diferencias y
Boxplot de diferencias.
6.- Click OK en cada recuadro.
Interpretando tus resultados
El boxplot y el dotplot ilustran las diferencias entre
las observaciones pareadas.
La diferencia de la media ( aproximadamente 2) es
representa por el X. Ho representa la diferencia de la
población que estas probando (cero.
El intervalo de confianza
MINITAB también dibuja el intervalo de confianza
para la diferencia de la media de la población. Así
que la hipótesis nula es verdad, tu esperarais que Ho
estuviera dentro de este intervalo.
Porque el intervalo de la confianza no esta incluido en
Ho, tu puedes rechazar la hipótesis nula y concluir que al
coche A le toma mas tiempo estacionar que al coche B.
Interpretando tus resultados
Las medias de los tiempos para estacionarse son 34.87
segundos para el coche A y 32.90 segundos para el coche B. La
diferencia es 1.967 segundos.
Los puntos finales para el intervalo de confianza del
95% para la diferencia de la media son de 0.171 y
3.764.
T-valor y p-valor
La prueba da un valor de t de 2.29, se asocia con un
p-valor de 0.034. Así, tu puedes rechazar la
hipótesis nula en el nivel 0.05 ά y concluir que el
tiempo requerido para estacionar el coche A es mayor que el
tiempo requerido para estacionar el coche B.
Prueba T para Carros A – Carros
–B
Consideraciones finales
Conclusiones prácticas
En promedio, a los conductores les tomo 1.967 segundos
mas estacionar el coche A que el coche B. Esta diferencia aunque
pequeña es estadísticamente
significativa.
¿Es una diferencia de 2-segundos de importancia
practica?. Esto lo decides tu.
Los tiempos levemente más largos para
estacionarse se asocian a la frustración creciente del
conductor, los 2 segundos pueden ser importantes. También,
esta diferencia puede ser de mayor importancia a los conductores
que seguido se estacionan paralelo.
Consideraciones Estadísticas
Cuando usar una prueba t pareada:
- Las observaciones deben ser pareadas.
- Los datos deben ser continuos.
- Las diferencias deben ser distribuidas
normalmente.
Debe ser observado que el procedimiento de la prueba t
es bastante robusto para las violaciones de las suposiciones de
la normalidad, a condición de que los pares de
observaciones se recojan aleatoriamente y los datos sean
continuos, unimodal, y razonablemente simétricos
(véase a la caja, al cazador, y a Cazador (1978).
Estadística para Experimentos, John Wiley & Sons,
Inc.).
Utilizando observaciones pareadas eliminas la
variabilidad causada por individuos. Por ejemplo, al
conductor 1 le tomo 18.9 segundos para estacionar el coche y 18.2
segundos para estacionar el coche B. En contraste, al conductor
18 le tomó 43.8 y 41.1 segundos para estacionar los mismos
coches. Obviamente, hay mucha variabilidad entre los conductores.
Pero analizando las diferencias para cada conductor, tu eliminas
esta variabilidad de los cálculos, aumentando el power de
tu prueba.
Ejercicio 3.1 Comparaciones de
Calibradores
Ejercicio
Tu estás considerando la compra de dos diversos
gage para medir válvulas:
Calibradores por EasyGage y Too1It. Tu deseas comparar las dos
marcas de
fábrica del calibrador para determinarse si ofrecen las
mismas medidas de promedio.
Utilice un ά-nivel de 0.05 para todas las
pruebas.
Recolección de datos
Doce operadores cada uno midieron la misma
válvula con los dos diversos calibradores. (El orden en la
cual utilizaron el calibrador fue seleccionado
aleatoriamente.)
Instrucciones
1.- Use una prueba t pareada para determinar si las
medidas de cada calibrador son diferentes.
2.- Con la desviación de estándar de la
diferencia de la muestra como estimación de ά ,
calcule la energía de la prueba al detectar una media de
la diferencia de 0.005 cm.. (Indirecta: Conducir una t-test paired es lo
mismo que conducir una t-prueba de la una-muestra es la
diferencia entre las observaciones pareadas.
Por lo tanto, tu puedes utilizar Stat > Power and
sample size > 1- Sample t para evaluar el
power de la prueba t pareada.
3.- ¿cuál es la energía de la
prueba de detectar una diferencia de la media de 0.001
centímetro?
Set de datos
CALIPERS.MPJ
Nombre | Tipo de dato | Tipo de variable |
Operator | Numérico | Respuesta |
Easy gage | Numérico | Respuesta |
Toollt | Numérico | Respuesta |
Diff | Numérico | Respuesta |
Prueba de una Proporción
Ejemplo 4 Televisiones Reparadas por
Tarifa
Ejercicio
Tu quieres determinar si la proporción de tu
sistema de
televisión
de 35- pulgada necesitara ser reparado en el plazo de 4
años de la compra, es diferente que el índice de la
industria 6.8%
( 0.068)
Recolección de datos
Aproximadamente 100,000 encuestas
fueron enviadas a los clientes que
compraron una televisión 35-plagadas. De los 2,856
clientes que regresaron las encuestas, 236 indicaron que su
televisión había requerido la reparación en
el plazo de 4 años de la compra.
Herramientas
Stat > Estadísticas Básicas > 1
Proporción
Set de datos
Ninguno
Prueba de una proporción
¿Qué es una prueba de
proporción?
Una prueba de una proporción te ayuda determina
si una proporción de la población es diferente de
un valor específico (proporción de la
prueba.)
¿Cuándo utilizar una prueba de una
proporción?
Usa una prueba de proporción para evaluar la
proporción de los datos de una sola muestra.
¿Porqué usar una prueba de una
proporción?
Una prueba de una proporción te puede ayudar a
contestar preguntas tales como:
- ¿Es una población diferente de
0.5? - b) ¿Es una proporción mayor o menor que
el criterio?
Por el ejemplo,
- ¿En un programa de inteligencia
artificial es posible contestar Sí / No
preguntas con mayor exactitud del 50%?. - ¿Está el porcentaje de averías
de los sujetadores plásticos debajo del máximo
aceptable?.
Conduciendo una prueba de una
proporción
Tu estás evaluando los resultados de un examen
enviado a los clientes que compraron una de sus
televisiones.
La proporción de los que respondieron con
televisión que la necesito reparación dentro de los
4 años es 236 / 2856 = 0.0826. El promedio de la
industrial es 0.068.
Utiliza una prueba de una proporción para
determinar si esta diferencia es significativa.
Las hipótesis para la prueba es:
- Ho: la proporción de la población para
sus clientes es igual a 0.068. - H1: la proporción de la población para
los clientes no es igual a 0.068.
Utilice un nivel de la confianza del 95%.
1 Proporción:
1.- Elija Stat > La Estadística
Básica > 1 Proporción.
2.- Seleccione Summarized data.
3.- En el Número de ensayos, tipo
2856.
4.- En el Número de éxitos,
tipo 236.
5.- Click Opciones.
6.- Complete el recuadro como se indica a
continuación:
7.- Click OK en cada recuadro.
Interpretando tus resultados
Utilice ά de 0.05 para la prueba.
Los resultados sugieren que el índice de la
reparación para su televisión (muestra p = 0.083)
sea más alta que el índice a nivel industrial de
0.068
- El intervalo de confianza del 95% (0.0727992 A
0.093339) no incluye 0.068. - El p-valor (0.003) es menos que ά
(0.005.)
Tu debes rechazar la hipótesis nula, ya que el
índice de tu reparación igual que el índice
a nivel industrial.
Mas / Para cálculos de intervalos de
confianza, vea ayuda de Minitab.
Test y CI para una Proporción
Consideraciones finales
Conclusiones prácticas
La evidencia sugiere que la proporción de que tu
televisión requiera reparación dentro de los de 4
años de la compra es mayor que la proporción del
índice a nivel industrial de 0.068.
Por supuesto, la mayoría de los clientes que
recibieron el examen no lo devolvió. Es siempre posible
que los clientes que han tenido un problema en su
televisión son los más probables en devolver el
examen. Si ésta es la causa, la proporción real
puede ser mucho menos de 0.082633.
Consideraciones estadísticas
Cuantas más observaciones tu tengas, más
power tendrá tu prueba de una
proporción.
También puedes aumentar el power
aumentando ά. Sin embargo
esto también aumenta la posibilidad de que ocurra el error
tipo 1.
Objetivos:
- Mida el grado de la asociación linear entre
dos variables
usando los gráficos y la
estadística. - Modelo para la relación entre variables de
respuestas continuas y unas o más variables de
predicción. - Determine la fuerza de la relación entre
variable de respuesta continua y unas o más variables de
predicción.
Contenidos
Correlación
Ejemplo 1 de Sistemas de
Medias
Ejercicio
Tu has desarrollado un sistema de medida en línea
que usted cree medirán el pH como
exactamente el sistema actual en su laboratorio.
El sistema en línea proporcionaría una
regeneración más rápida y la capacidad de
ajustar los sistemas en tiempo real. Tu quieres saber si los dos
sistemas producen lecturas similares del pH.
Recolección de datos
La colección de datos ambos sistemas se utiliza
para medir el pH de 20 Jornadas aleatoriamente seleccionadas del
producto de limpieza.
Herramientas
Graph > Plot
Stat > Basic Statistics >
Correlation
Set de Datos
LABSTEST.MPJ
Nombre | Tipo De datos | Tipo de |
Laboratorio | Numérica | Respuesta |
En línea | Numérica | Respuesta |
Correlación
¿Qué es
correlación?
La muestra del coeficiente de correlación r, mide
el grado de la asociación linear entre dos variables (el
grado en la cual una variable cambia con otra).
Una correlación positiva indica que ambas
variables tienden a incrementarse juntas. Una correlación
negativa indica que una variable se incrementa, y la otra
decrece.
¿Cuándo utilizar la
correlación?
Utiliza la correlación cuando tengas datos para
que dos variables continuas y desees determinen si hay una
relación linear entre ellas. La correlación no
dirá si estas variables están relacionadas de una
manera no lineal.
Algunos estadísticas creen que la
correlación no debe ser utilizado si una variable y es
dependiente de la respuesta de la otra.
¿Porqué usar la
correlación?
La correlación te puede ayudar a contestar
preguntas tales como:
- ¿Están dos variables relacionadas en
una manera linear?. - ¿Cuál es fuerza de la
relación?.
Por ejemplo,
- ¿Hay una relación entre la temperatura
y la viscosidad del
aceite de
cocina?. - ¿Es fuerte la relación entre la
exposición ultravioleta y la fuerza
reducida en el material de nylon de la tienda?.
Dibujando los datos
Creando un diagrama te
ayudará a visualizar la relación entre las medidas
tomadas por los dos sistemas que estás utilizando para
medir el pH.
Graficando las variables
Grafica el laboratorio y el Online de la variable en X y
Y respectivamente.
Plot
1.- Abre el proyecto
LABTEST.MPJ.
2. Escoge Graph > Plot
3.- Completa el recuadro como se indica a
continuación:
4.- Click OK
Interpretando tus resultados
El diagrama Online contra medidas del laboratorio
indica:
- Hay una relación fuerte entre los dos sistemas
que miden. Cuando los valores
para el laboratorio cambian, también lo hacen los
valores para
Online. - Los datos siguen una línea bastante recta que
sugiere que la relación es linear. - Los altos valores del sistema en línea se
asocian a altos valores del sistema del laboratorio, indicando
que la relación es positiva.
¿Que se hace después?
Porque la relación es linear, usted puede
calcular la correlación para cuantificar la fuerza de la
asociación.
Calculando la correlación
Tu deseas calcular el coeficiente de correlación
de Pearson para determinar la fuerza de la asociación
linear entre las medidas en Online y del laboratorio.
Correlación
1.- Escoge Stat > Basic Statistics >
Correlacion.
2.- Enter en Variable Laboratorio.
3.- Click OK.
Interpretando tus resultados
Correlación: Laboratorio En
línea.
Prueba de la Correlación Laboratorio En
línea = 0.959
P – Valor = 0.000
Use una ά 0.05 para el texto.
Pearson correlación
El coeficiente de la correlación de la muestra
(r) es calculado por la fórmula:
El valor de r estará siempre entre -1 y
1:
- 1 indica una correlación positiva
perfecta. - 0 indica ninguna correlación.
- -1 indica una correlación negativo
perfecto.
P-valor
La prueba del p-valor las hipótesis
siguientes:
Ho: El coeficiente de correlación (p o rho) para
la relación entre las poblaciones es igual a
cero.
H1: p no es igual a cero.
Conclusión:
El coeficiente de correlación (0.959) indica que
ahí una fuerte asociación lineal positiva entre la
media del Laboratorio y la del Online. Además el p-valor
(0.000) es menos que & (0.05), entonces tus puede rechazar la
hipótesis nula, ya que no existe ninguna asociación
lineal.
¿Que se hace después?
Antes de sustituir el sistema de laboratorio con el
sistema en línea, tu necesitas evaluar dos aspectos
adicionales entre la relación de los dos. Incluso si la
correlación era perfecto (r=1), todavía
podrían haber diferencias importantes entre los
sistemas:
- Las medidas de un sistema podrían ser
coherentemente más altas que las medidas del
otro.
El coeficiente de correlación no dirige estas
cuestiones de tendencia y sensibilidad.
Anotación de la gráfica
Utilice el diagrama del argumento para
ayudarte a evaluar si la medida de los dos sistemas es similar, y
si los sistemas son igualmente sensibles:
- Traza con los datos los mismos valores del
mínimo y del máximo para ambas X. - Y Agregue una línea para indicar donde
X=Y. (usted podría agregar la línea
después de que el gráfico sea creado usando las
herramientas
para graficas de
MINITAB`s. Sin embargo, la caja del subdiálogo de la
anotación proporciona una manera más exacta de
agregar líneas al gráfico).
Plot
1.-Elige Graph >
Plot.
2.- Del capítulo, elige el
minuto y el máximo.
3.-Elige el mismo mínimo y
máximo para las X de X y de Y.
4.- Click OK
5.– Para anotación, elija la
línea.
6. – Completa el recuadro como se indica a
continuación:
7.- Clic OK en cada recuadro.
Interpretando tus resultados
Para cada punto referente en la línea, X
es igual a Y. Si ambos sistemas van encima con las mismas
medidas para cada muestra, entonces todos los puntos de
referencias caerán en esta línea.
Comparando los datos en la línea de referencia
revela lo siguiente:
- Todos, menos un punto está debajo de la
línea, indicando que el sistema en línea produce
medidas constantemente más altas que el sistema del
laboratorio. - La línea que los datos siguen tiene
básicamente la misma cuesta que la línea de
referencia. Esto indica que los valores de los rangos indican
que los dos sistemas son similares.
Consideraciones finales
Conclusiones prácticas
Hay una fuerte correlación positiva del (0.959)
entre las medidas tomadas con el laboratorio y con los sistemas
en línea.
Sin embargo el sistema en línea
rinde medidas constantemente más altas que lo hace el
sistema del laboratorio. Esto puede indicar la necesidad de
recalibración.
Los resultados de los límites en
el experimento indican que es menos costoso y más
fácil utilizar el sistema en línea y puede ser un
reemplazo conveniente para el sistema de medida del
laboratorio.
Consideraciones estadísticas
La Correlación cuantifica el grado de la
asociación linear entre dos variables.
Una correlación fuerte no implica una
relación de causa y efecto. Para el ejemplo, una
correlación fuerte entre dos variables puede ser debido a
la influencia de una tercera variable, no bajo
consideración.
Un coeficiente del correlación cerca de cero no
significa necesariamente ninguna asociación, sólo
que esa asociación no es linear. Tu debes trazar siempre
sus datos de modo que puedas identificar relaciones lineares
cuando estás se presenten.
Algunos estadísticos discuten que la
correlación que sea utilizada si una variable es una
respuesta dependiente de la otra.
La correlación asume que los valores de ambas
variables están libres de variar. Tu no puedes utilizar la
correlación si fijas los valores de una variables una para
estudiar cambios en otra.
Regresión Simple
Ejercicio
Tu sospechas que la revoltura tiene un impacto en el
nivel de impurezas en tu producto de pintura.
Recolección de datos
Las impurezas fueron medidas para lotes de pintura
revueltas en rangos de movimientos a partir de 20 a 42 RPM
(revoluciones por minuto.)
Herramientas
Stat > Regression > Fitted Line
Plot.
Stat > Regression > Fitted Line
Plots.
Set de Datos
PAINT.MPJ
¿Qué es la regresión
simple?
La regresión simple examina la relación
entre una variable de respuesta continua (Y) y una variable de
predicción (X). La ecuación general para un
modelo de
regresión simple es:
Y = Y =
βo +
β1 X +
έ
Donde Y es la respuesta, X es la
predicción,
βo la es el
interceptor (el valor de Y cuando X iguala el cero),
β1 la es
la cuesta, y
έ es el error aleatorio.
¿Cuándo usar la regresión
simple?
Usa la regresión simple cuando tu tengas Y
continua y solo una X. Las siguientes condiciones deben ser
encontradas:
- X puede ser ordinal, o continúa.
- En la teoría, X debería ser fijada. En
la práctica, sin embargo, a menudo le permiten para
variar. - Cualquier variación arbitraria en la medida de
X es asumida para ser insignificante comparada con el rango en
cual X es medido.
Los valores de Y obtenidos en su muestra se
diferenciarán de estas predicciones por el modelo de
regresión (a no ser que todos los puntos resulten caer
sobre la línea perfectamente recta.). Llaman residual a
estas diferencias.
Antes de la aceptación de los resultados de un
análisis de regresión, tu debes
verificar que las suposiciones siguientes sobre los residuales
son válidas para tus datos:
- Ellos son independientes (y así
arbitrarios). - Ellos están distribuidos
normalmente. - Ellos tienen constantes variaciones a través
de todos los valores de X.
¿Por qué usar la regresión
simple?
La regresión simple te puede ayudar a contestar
preguntas tales como:
- ¿Cómo importante es X en la
predicción Y? - ¿Qué valor puedes tu esperar para Y
cuándo X es 20? - ¿Cuánto es que cambio de Y
si X en una unidad?
Por ejemplo,
- ¿Cómo el proceso de
la temperatura de tratamiento se relaciona con la dureza de su
acero? - ¿Que fuerza tendrá su acero si usted lo
trata a una temperatura particular? - ¿Cuánto más difícil
tratar será su acero si aumentas la temperatura en 100?
°?
Ajustando el modelo lineal
Tu quieres determinar el efecto de tarifa de movimiento
sobre la cantidad de impurezas en la pintura. Utiliza Fitted
Line Plot para calcular y graficar la ecuación de la
regresión
Fitted Line Plot
1.- Abre el Project PAINT.MPJ.
2.- Escoge Stat > Regression > Fitted
Plot.
3.- Completa el recuadro como se indica a
continuación:
4.- ClicK OK
Interpretando tus resultados
Regresión la ecuación
La ecuación de Regresión relaciona la
predicción (stirrate) con la respuesta (la
impureza):
Impureza =-0.289277 + 0.456643 stirrate
La inclinación de la línea de
regresión, 0.456643, indica cuanto un cambio en la
impureza es asociado con cada cambio de una unidad de
stirrate.
S
S es una estimación del promedio de variabilidad
media sobre la línea de regresión. La S es la
raíz cuadrada positiva de MSE. La mejor ecuación
predice la respuesta, mas bajo S será.
R2 (R-Sq)
La R2 (Cuadrada de r) es la
proporción de la variabilidad en la respuesta que es
explicada por la ecuación. Así, el 93.4 % de la
variación en la impureza puede ser explicado por su
relación lineal con el Stirrate.
Valores aceptables para R2
varían dependiendo del estudio. Por ejemplo, los
Ingenieros que estudian reacciones
químicas pueden requerir una R2del
90 % o más. Sin embargo, alguien estudiando el comportamiento
humano (que es más variable) puede estar satisfecho
con valores de R2 inferiores.
Ajustada (cuadrado de r (adj))
R2 ajustada es sensible al
número de términos (condiciones) en el modelo y es
importante comparar los modelos con
diferentes números de términos (Ver
3-58).
La menor línea de regresión
cuadrada
Los coeficientes para la ecuación de
regresión son escogidos para reducir al mínimo la
suma de las diferencias cuadriculadas entre los valores de
respuesta observados en la muestra y aquellos predichos por la
ecuación.
En otras palabras, las distancias verticales entre los
puntos y la línea son reducidas al mínimo,
ilustrado a la derecha. El resultado es llamado: La menor parte
de la línea de regresión cuadrada.
Esté atento a esta líneas de fuera usando
los procedimientos de
la regresión. Algún líneas de fuera
(llamados altos puntos ) tienen un efecto grande sobre el
cálculo
de la menor parte de línea de regresión de
cuadrado. En tales casos, la línea más puede puede
representar al resto de datos muy bien.
Note: este gráfico ha sido corregido para
la
ilustración.
Interpretando tus resultados
Use el análisis de varianza (ANOVA) resultados
para evaluar si su modelo de regresión simple es
útil. El ANOVA compara su modelo a un modelo restringido
que no usa Stirrate (X) para predecir la impureza
(Y):
- Modelo de Regresión: Y =
βo +
β1 X +
έ - Modelo Restringido: Y = Y =
βo+
έ
El modelo restringido declara que los cambios de Y
están previstos únicamente al error arbitrario
(έ). Es equivalente a un modelo de
regresión simple con una cuesta
(β1) de
cero. Así, las hipótesis para el ANOVA
son,
- Ho:
β1 es igual
para cero. - H1:
β1 no es igual
a cero.
Interprete el p-valor (P) así:
- Si el p-valor es menos que o igual a
ά , deseche Ho. El modelo de
regresión explica considerablemente más
variabilidad en la respuesta que hace el modelo restringido.
La β1 no
iguala el cero. - Si el p-valor es a mayor, usted no puede rechazar la
Ho.
β1 no es
considerablemente diferente del cero.
Conclusión
Usando un ά 0.05, tu
puedes rechazar el modelo simple restringido y afirmar que
Stirrate realmente tiene un efecto significativo lineal sobre la
Impureza.
Análisis de Regresión: Impureza contra
Stirrate
Adicionando confianza y
Predicción
Confidencialidad y bandas de
predicción.
Tu también quieres saber si confiar que la media
y los puntos individuales en la variable Y, Impurezas caen dentro
de ciertos límites de variabilidad.
Residuales y Fits
El Residual es la diferencias entre los valores
ajustados de su modelo y los valores observados. Son las
estimaciones de punto de la respuesta estimados para cada nivel
de la variable independiente. Tu debes almacenar estos valores
para usar más tarde.
Use un nivel de confianza de falta del 95 %.
Fitted Line Plot
1.- Escoja Stat > La
Regresión > Fitted Line Plot presione Ctrl +
E para volver al dialogo Fitted
Line Plot al cuadro.
2.- . Click Opciones.
3.- Completa el recuadro de diálogo
como se indica a continuación:
4.- Click OK.
5. – Click Storage.
6.- Elige Residuals y Fits.
7- Click OK en cada recuadro.
Interpretando tus resultados
Intervalo de confianza
El 95% de confianza define un excelente rango de valores
en la población de la media de Y. Para cualquier valor
dado de X, tu pues confiar que la población de la
media de Y esta entre las líneas indicadas.
Intervalo de predicción
El intervalo de predicción del 95 % define una
gama probable de valores de Y para observaciones
individuales. Para cualquier valor dado de X, tu puedes
confiar con un 95 % que el valor correspondiente de Y para
una observación estará entre las
líneas indicadas.
Regresión Plot
Creando una gráfica del
Residual
El residual para cada observación es la
diferencia entre el valor observado de la respuesta y el valor
predictivo por el modelo (el valor ajustado). Por ejemplo, si el
valor de respuesta observado es 12 y el modelo predice 10, el
residual es 2.
Suposiciones
Para confirmar que tu análisis de
regresión es válido, tu debes verificar todas las
suposiciones sobre los residuales. Usa las graficas de la
residual para comprobar que los residuales:
- Sean aleatorios (independientes el uno del
otro) - Estén normalmente distribuidos.
- Tienen la misma discrepancia a través de todos
los valores de X
Nota : Si tienes más que una columna de
residuales y Fits sobre su hoja de trabajo, se
cuidadoso al seleccionar las columnas correctas cuando crees las
graficas de la residuales.
Residual Plot
1. Escoja Stat >
Regresión > Residuales Plots0
2. Completar el recuadro como se indica a
continuación:
3. –Click OK
Interpretando tus residuales
La gráfica de probabilidad de
Normalidad
Usa la grafica de la probabilidad normal de la residual
para verificar que el residual no este desviada sustancialmente
de la distribución normal.
- Si los residuales viene de una distribución
normal, los puntos aproximadamente seguirá una
línea directa. - Si los residuales no vienen de una
distribución normal, los puntos no seguirá una
línea directa.
Basado en este grafico, es razonable asumir que los
residuales para sus datos no se desvía considerablemente
de una distribución normal. Una prueba de normalidad para
estos datos (no mostrado dio un p-valor de 0.252.)
Histograma
Tu puedes usar el histograma de las residuales para
evaluar la normalidad. Sin embargo, la grafica de probabilidad
normal es generalmente más fácil para hacer de
interpretar, sobre todo para pequeñas muestras.
Interpretación sus resultados
Gráfica
La gráfica presenta los residuales en el orden de
la recolección de los datos ( proporcionando los datos que
fueron entrados en el misma orden en la cual ellos fueron
recogidos). Use la grafica para verificar que el residual es
independiente.
- Si hay un efecto debido a la orden de recolección de datos, el residual no
estará disperso aleatoriamente sobre el cero. Tu debes
ser capaz de detectar este patrón en la
gráfica. - Si no hay ningún efecto debido al orden de
recolección de datos, los residuales estará
disperso aleatoriamente sobre el cero
No aparece haber en ningún momento efecto de
orden en el set de datos presentes.
Interpretando tus resultados
Residuales Versus Fits
Use el grafico de los residuales versus ajustes para
verificar que:
- El modelo no omite ningún termino
cuadrático. - La variación es constante es constante a
través de todos los valores ajustados. - No hay valores fuera de línea en tus
datos.
Si tu puedes ver cualquier tipo de patrón en esta
grafica, una de estas suposiciones ha sido violada.
La tabla debajo resume el patrón típico
que puedes ver.
El patrón | Indica |
Curvilíneo | Un término cuadrático puede fallar |
La extensión desigual de las | La variación de las residuales no es |
Un punto está situado muy lejos del | Esta fuera de línea. |
La grafica de los datos no parece revelar ningún
patrón.
Consideraciones finales
Conclusiones prácticas
El análisis simple de la regresión linear
reveló que el aumento de los ritmos de revoltura
está asociados a los niveles crecientes de impurezas en su
pintura
La pendiente de la ecuación de la
regresión indica que cuando tu aumentas el ritmo del
revolvimiento en 1 rpm, el nivel de impurezas aumenta en
0.456643.
Tu puedes usar la ecuación para determinar
qué las impurezas serán diferentes para las
mezclas de
pintura. Sin embargo, la ecuación es solamente
válida para la gama de datos que usted ha hecho un
muestreo
(revolviendo entre 20 y 42).
Consideraciones estadísticas
Tu no puedes utilizar el análisis de la
regresión para afirmar que los cambios en la
predicción fueron causados por la respuesta, a menos que
los valores del predictor fueran fijos en los niveles
predeterminados en un experimento controlado. Si los valores de
los predictor se permiten variar aleatoriamente, otros factores
pueden influenciar la predicción y la
respuesta.
Tu no debes aplicar los resultados de la
regresión a los valores que son de X que
están fuera de su gama de la muestra. Por ejemplo, Tu no
debes utilizar la ecuación de la regresión derivada
en este ejemplo para predecir los niveles de impureza para un
índice del revolvimiento de 100, porque los más
altos ritmos de revolvimiento implicada en el análisis son
de 42. La relación entre Revolvimientos y la impureza
puede ser muy diferente para el ritmo de revolvimientos de
42.
Ten cuidado de las líneas de fuera cuando uses el
procedimiento de regresión. Algunas líneas de
fuera( llamadas
Esté alerta para los afloramientos al usar
procedimientos de la regresión. Algunos afloramientos
(llamados puntos altos de apalancamiento) tienen un efecto grande
en el cálculo de la línea menor de la
regresión de los cuadrados. En tales casos, la
línea puede no representar el resto de los datos muy
bien.
Ejercicio 2.1
Protectores de Erosión
Ejercicio
Tu estas intentando predecir cómo los protectores
de acero de la erosión para las turbinas de vapor resisten
la pérdida de la abrasión.
La resistencia directamente que mide a la
abrasión es difícil, costosa, y destructiva. Por lo
tanto, tu esperas poder predecir
la resistencia a la abrasión usando la dureza de acero,
que es más conveniente y menos costosa medir.
Recolección de datos:
La pérdida y la dureza de la abrasión de
la recolección de datos fueron medidas para 24 protectores
aleatoriamente seleccionados de la erosión.
Instrucciones
1. Utilice la Fitted Line Plot para ajustar el modelo
simple de la regresión linear con la abrasión como
la respuesta y la dureza como el predictor: Incluya la confianza
y la predicción en sus resultados, y asegúrate de
almacenar las residuales y los ajustes.
2. Utiliza los diagramas
residuales de validar las suposiciones necesarias.
Set de Datos
EROSION.MPJ
Ejemplo 3 del caudal de la corriente.
Ejercicio
Tu estás conduciendo un estudio de los impactos
para el medio ambiente
y quieres utilizar la profundidad de una corriente para estimar
el caudal.
Recolección de datos:
La profundidad y el flujo fueron registrados para una
sola corriente en un periodo de 6 meses.
Herramientas
Graph > plot.
Stat > Regression > Fitted Line
Plot.
Stat > Regresión > Argumentos
Residuales.
Set de Datos:
FLOW.MPJ
Regresión Polinomial
¿Que es Regresión
polinomial?
Como la regresión
lineal, La regresión polinomial examina la
relación entre una variable continua de la respuesta
(Y y una variable del predictor (X). Es diferente
de la regresión simple, sin embargo, un modelo polinomial
puede incluir los términos para los exponentes de
X:
Donde Y es la respuesta, X es el
predictor, βo
es el coeficiente para el término linear,
β1 es el coeficiente para el término
ajustado, β2 es el coeficiente para el
término cuadriculado, β3 es el coeficiente
para el término cubicado, y έ es error al
azar.
¿Cuándo utilizar la Regresión
Polinomial?
Usa la Regresión Polinomial cuando tengas tiene
una Y continua y un solo X, y evidencia o
teoría sugiriendo no-linealidad.
- X Puede ser ordinal o continuo o en la
teoría. - En teoría X debe ser fijo. En la
práctica, sin embargo, se permite a menudo
variar. - Cualquier variación aleatoria en la medida
de X se asume como insignificante comparado en el
rango en donde es medida X.
Después de aceptar los resultados en el
análisis de la regresión simple, tu debes verificar
que las siguientes suposiciones acerca del residual sean validas
en tus datos.
- Deben ser independientes (y así al
azar). - Deben ser distribuidos normalmente.
- Deben tener variación constante a
través de todos los valores de X.
¿Porqué usar la Regresión
Polinomial?
La Regresión Polinomial te puede ayudar a
responder preguntas tales como:
- ¿Incrementando X incrementa Y
para algunos valores del rango y disminuye para
otras? - ¿Qué valor puedes tu esperar para
Y cuando X es 20?
Por ejemplo,
- ¿Agregando más cobre a su
aleación siempre es mas fuerte o la fuerza disminuye en
concentraciones más altas? - Como puedes esperar que tu aleación sea de
0.01% de cobre.
Dibujando los datos
Para visualizar la relación entre la profundidad
de la corriente y el caudal, utilice el diagrama para crear un
scatterplot con la respuesta (flujo) en el y-axis y el predictor
(profundidad) en el x-axis.
Plot
1.- Abre el Project FLOW.MPJ.
2.- Elija El Graph >
Plot
3.- Completa el recuadro como se indica a
continuación:
4.- Click OK
Interpretando tus resultados
La gráfica revela una relación
potencialmente no lineal entre la profundidad y el
flujo.
Por ejemplo, Note que un aumento 1.5- pies en
profundidad a partir de la 0.5 a 2 pies parece aumentar dos veces
el flujo tanto como un aumento en profundidad a partir del 6.0 a
7.5 pies.
Ajustando el modelo linear
Usa la grafica del modelo linear, para evaluar que tan
bien esta el modelo de regresión linear en los
datos.
Fitted Line Plot
1.- Elige Stat > Regression >
Fitted Line Plot.
2.- Completa el recuadro como se indica a
continuación:
3.- Click OK
Interpretando tus resultados
La ecuación linear que mejor describe los datos
es:
Flujo = 0.301672 + 0.0726395 Profundidad
R2 (R-r-Sq)
El R2 para el modelo linear indica que 91.5%
de la variabilidad en flujo es explicado por profundidad de la
corriente.
¿Que sigue?
Mientras que un porcentaje de la variabilidad es
explicado por el modelo linear, parece una línea levemente
curvada cabría incluso mejor. Tu debes evaluar cómo
en modelo cuadrático caben estos datos.
Regresión Plot
Ajustando el Modelo Cuadrático
Usa el Fitted Line Plot para cuadrar tu modelo de
regresión cuadrático. Almacene los ajustes y las
residuales para una reexaminación más
futura.
Fitted Line Plot
1.- Elige el Stat > Regresión
> Fitted Line Plot o presiona Ctrl+E para volver
a Fitted Line Plot del recuadro.
2.- Completa el recuadro como se indica a
continuación:
3.- Clic Storage.
4.- Compruebe las Residuals y los
Fits.
5.- Click OK en cada recuadro.
Interpretando tus resultados
Ecuación de Regresión
La Regresión cuadrática que mejor describe
los datos es:
Flujo = 0.245230 + 0.133027 Profundidad
– 0.0087100 Depth**2
R2 (R-r-Sq) y R2- adjuntos (R –
Sq(adj))
R2 indica que el modelo cuadrático
considera 96.0% de la variabilidad en el caudal. Éste es
algo más que el R2 de 91.5% obtenidos con el
modelo linear (véase 3-32).
La estadística ajustada de R2
estadística ajustada es ajusta según el
número de términos en el modelo, y debe ser
utilizada al comparar modelos con diversos números de
predictores.
El R2 ajustado para el modelo
cuadrático (95.3%) es mayor que el R 2 ajustado
para el modelo linear (90.7%), indicando que el término
adicional mejora la predicción.
Regresión Plot
Interpretando tus resultados
Utilizan una ά 0.05 para todas las
pruebas.
Análisis de Varianza
El p-valor para el modelo en su totalidad (0.000) es
significativo, indicando que el modelo es útil.
El p-valor para el término linear (0.000) es
también significativo, indicando que explica una cantidad
significativa de variabilidad.
Pasado, el p-valor para el término
cuadrático (0.004) es significativo, indicando eso que
agrega este término al modelo linear mejora la
predicción perceptiblemente.
Análisis Polinómial De la
Regresión:
Graficando los residuales
Utilizan las residuales y los ajustes correr graficas de
diagnóstico en el modelo cuadrático.
Tu estás utilizando diagramas residuales para verificar
que las suposiciones sobre el término del error en el
modelo de la regresión han sido encontradas.
Residual Plots
1.- Elige Stat > Regresión >
Residual Plots.
2.- Completa el recuadro como se indica a
continuación:
3.- Click OK
Interpretando tus resultados
Diagramas de Probabilidad Normal
Usa los diagramas de probabilidad normal de los residuos
para verificar que tus residuos no se desvían
substancialmente de una distribución normal.
- Si los residuos vienen de una distribución
normal, los puntos seguirán una línea recta
aproximadamente - Si los residuos no vienen de una
distribución normal, los puntos no seguirán una
línea recta
Basado en este diagrama, es razonable asumir que los
residuos para tus datos no se desvían substancialmente una
distribución normal. ( Una prueba de normalidad para estos
datos (no mostrado) permitió un p-valor de
0.340.)
Histograma
Puedes también usar el histograma de los residuos
para evaluar la normalidad. Sin embargo, la probabilidad normal
es generalmente más fácil de interpretar sobre todo
para las muestras pequeñas.
Interpretando tus resultados
Grafica 1
En la Grafica 1 se presenta los residuales en el orden
de la recolección de datos (los datos que entraron en el
mismo orden en los que fueron recolectados) usa esta grafica para
verificar que los residuos son independientes.
- Si hay un efecto debido al orden de colección
de datos los residuales en ceros no serán esparcidos al
azar. Podrás detectar una tendencia en el
plot. - Si no hay efecto debido al orden de colección
de datos, los residuales en ceros se esparcirán al
azar
Los datos no aparecerán en ningún tiempo o
los efectos del orden de los datos presentes.
Interpretando tus resultados
Los residuales vs Fits
Use el plot de los residuales vs los Fits para
verificarlo:
- El modelo no está perdiendo ninguna
condición cuadrática - La variación es constante por todo los valores
de los Fits. - No hay datos fuera de línea.
Si ves cualquier tipo de modelo en el plot uno de estas
asunciones ha sido violada. Tu puedes ver en el siguiente cuadro
debajo el resumen de los modelos típicos.
Este modelo | Indica… |
Curvilíneo | Un término cuadrático puede estar |
La extensión desigual de las residuales a | La variación de los residuales no es |
Un punto está situado muy lejos del | Fuera de línea |
Agregando confianza y predicción a las
Cintas
Creando una nueva fitted line plot del modelo agregando
confianza y predicción a las cintas. Mostrando las cintas
y los intervalos te da una mejor idea de la variabilidad y
estabilidad del modelo cuadrático.
Fitted Line Plot
1.- Escoge Stat > Regression > Fitted
Line Plot.
2. -Bajo Type of Regresión Model,
Escoge Quadratic.
3.-Pulse el botón las
Opcions.
4.-Completa el recuadro como se indica a
continuación:
5.- pulse el botón OK en cada cuadro de
diálogo
Interpretando tus resultados
El intervalo de confianza
El 95% intervalo de confianza define un rango probable
de valores para la media de la población de Y. para
cualquier valor dado de X, usted puede ser 95% seguro que la
media de la población para Y está entre las
líneas indicadas.
El intervalo de la predicción
El 95% intervalo de la predicción define una
demostración del rango de los valores de Y por las
observaciones individuales. Por cualquier valor dado en X tu
puedes tener 95% de confiabilidad correspondiente al valor de Y
por una observación que será dentro de las
líneas indicadas.
Consideraciones Finales
Conclusiones prácticas
El análisis indica que la relación entre
la profundidad de la corriente y proporción del flujo es
más bien cuadrática que lineal. Cuando la corriente
es baja, pequeños incrementos se muestran en los
resultados de la profundidad y grandes incrementos en el flujo.
Sin embargo, cuando la corriente llega a ser mas profundo, los
mismos incrementos en la profundidad causan menos cambios en el
flujo.
Consideraciones Estadísticas
Tu no puedes usar la análisis de la
regresión para afirmar que los cambios en las predicciones
cambian las causas en la respuesta, a menos que el valor
predictivo fuere arreglado en la predeterminación de
niveles en un experimento controlado. Si los valores predictivos
se permiten variar al azar, otros factores pueden influenciar en
ambos los predictivos y la respuesta.
No debes aplicar los resultados de la regresión
para responder a los valores que están fuera del rango de
la muestra.
Ejercicio 3.1 Descarga Diesel
Estas investigando los efectos de humedad en las
emisiones de la descarga de camiones diesel
Recolección de datos
Los datos son de la Hare C.T. (1997). "Light Duty Diesel
Emisión Correction Factors for Ambient Conditions" el
informe final a
la Agencia de protección del ambiente bajo
contrato No.
68-02-1777, Instituto de la investigación sudoeste, San Antonio,
TX.
Instrucciones
1.- La información de la grafica visualiza la
relación entre las variables.
2.- Usa Fitted Line Plot para adaptar el modelo
apropiado de regresión.
3.- Asegúrate de verificar las
asunciones necesarias con las graficas los
residuales.
Set de Datos
EL DIESEL. MPJ
Ejemplo 4 Reduciendo el golpe del Motor
Problema
Trataras de identificar las llaves predoctoras del golpe
del motor.
Las siguientes variables están bajo las
siguientes consideraciones:
- La elección del momento adecuado de la
chispa - La proporción de aire-combustible (AFR)
- La temperatura de la succión
- La temperatura de la descarga
Recolección de los datos
Los datos son recolectados al azar de 13 motores
seleccionados, todos trabajan con gasolina con un octanaje tasa
de 87.
Herramientas
Graph > Matrix
plot
Stat > Basic Statistics >
Correlation
Stat > Regression > Regression
Set de Datos
KNOCK.MPJ
Regresión Múltiple
¿Cuál es la regresión
múltiple?
La regresión múltiple examina la
relación entre una respuesta continua variable (Y) y
más de un predictor (X) de variables. La ecuación
general para un modelo de la regresión múltiple
es:
Y .= β0 + β1 X1 + β2 X2 + β3 X3
+…. +ε
Donde Y es que la respuesta, β0 es el intercepte
cada Xi es un predictor variable con una cuesta de βi, y
ε es el error aleatorio.
Cuándo usar la regresión
múltiple
Use la regresión múltiple cuando tienes un
Y continuo y más de una X.
- X puede ser ordinal, o continua.
- En teoría, X debería arreglarse. En la
practica, sin embargo, con frecuencia permite la
varianza. - Cualquier variación aleatoria en la medida de
X se asume que es una comparación insignificante en el
rango en el cual X es medido.
Antes de aceptar los resultados de análisis de la
regresión, debes verificar las siguientes asunciones sobre
los residuales que son válidos para la
información:
- Ellos deben ser independientes (y así
aleatorios). - Ellos deben ser de distribución
normal. - Ellos deben tener una variación constante por
todo los valores de X .
Por qué usa la regresión
múltiple
La regresión múltiple puede ayudar a
contestar las siguientes preguntas:
¿Qué tan importantes son tus variables X
en predicción con tus valores Y?
¿Qué valor esperas de Y cuando X1 es 20 y
X2 es 3?
¿Cuánto cambiarán Y si aumentas X3
por una unidad?
Por ejemplo,
¿Cómo procesas la temperatura y porosidad
relacionada a la dureza del acero?
¿Qué tan duro esperas que tu acero esta si
tu proceso se encuentra a cierta temperatura por cierto
tiempo?
¿Qué tan resistente es la dureza del acero
si incrementas la temperatura a 100 °?
Creando una Matriz
Plot
Usaras primero una matriz plot y coeficientes de
correlación primero para ver si las relaciones existen
entre la contestación inconstante y las variables de la
predicción.
Variables del gráfico
Es más fácil mirar la relación
entre la respuesta y la predicción cuando entras en la
respuesta de la ultima variable en las variables del
gráfico.
Matriz Plot
1.– Abre el proyecto KNOCK.MPJ
2. – Escoge Graph > Matriz
Plot.
3.- Complete el recuadro como se indica a
continuación:
4. – Click Options.
5. – Bajo Matriz Display Escoge Lower
Left.
6. – Click OK cada recuadro.
Interpretando tus resultados
Los resultados incluyen los gráficos para cada
combinación de variables.
Fíjate para evaluar la relación entre el
golpe y las predicciones.
Parece ser una correlación negativa entre el
golpe y chispa. Allí también parece ser
correlaciones positivas entre el golpe y cada uno de las
predicciones restante
¿Qué sigue?
Usa la correlación para evaluar las fuerzas de
relación lineal.
Cálculo de las Correlaciones
múltiples
Cree una matriz de correlación para evaluar las
asociaciones entre el golpe y las predicciones.
Correlación
1.- Escoge Stat>Basic
Statistics>Correlation
2.- Completa el recuadro como se indica a
continuación:
3.- Click OK
Interpretando tus resultados
La salida incluye el coeficiente de correlación y
el p-valor para cada par de variables. (Use un 0.05 para todas
las comparaciones.)
Una sugerencia en la matriz plot, hay una
correlación negativa significante entre el golpe y chispa
( r = -0.699, p=0.008). Hay también, correlaciones
positivas significantes entre el golpe y cada uno de las
predicciones restante:
- AFR(r = 0.961,P = 0.000)
- Intake ( r =0.673.P = 0.012)
- Exhaust ( r = 0.682, P = 0.010)
Que sigue.
Porque AFR tiene la relación lineal más
fuerte con la regresión de uso de golpe para ajustarse a
un modelo de la regresión lineal simple con el golpe como
la contestación y AFR como las predicciones.
Encajando a un modelo de la regresión
simple
Usa la regresión para realizar un análisis
de la regresión lineal simple para el golpe y AFR.
Podrías también usar Fitted Line Plot antes de
realizar un análisis.
Regresión
1.- Escoja Stat > Regresión >
Regression
2.– Completa el recuadro como se indica a
continuación:
3.- Click OK
Interpretando tus resultados
Ecuación de la Regresión
La ecuación relacionada con la respuesta y la
predicción es:
Knock = 25.5+4.25 AFR
Esto indica que el golpe aumenta 4.25 veces por el
aumento de la unidad en AFR
Tabla de coeficientes
Las hipótesis para cada coeficiente
es:
- Ho: el coeficiente es igual a cero
- H1: el coeficiente no es igual a cero
El valor-p para la constante (β0 , la
intercepciσn) y el coeficiente de AFR (β1, la cuesta)
ambos son menores de 0.05. Asν nosotros podemos rechazar Ho
para cada uno a los 0.05 α-level y concluimos que estos
coeficientes no son cero. En este modelo, AFR es una
predicciσn significativamente
estadística del golpe.
El análisis de la
regresión: el golpe contra AFR
Interpretando tus resultados
R²(R-Sq)
El R² indica los 92.3% de la variabilidad del golpe
predicho por este modelo.
El Análisis de la varianza
Llamada que las hipótesis para un modelo de la
regresión lineal simple son:
- Ho: β1 es igual a cero
- H1: β1 no es igual a cero
¿Qué sigue?
El modelo de la regresión simple con AFR es
útil para la predicción del golpe. Sin embargo, es
posible que el Power de la predicción adicional puede ser
ganada incluyendo otras predicciones en el modelo de
regresión.
El análisis de la regresión: el golpe
contra AFR
Página anterior | Volver al principio del trabajo | Página siguiente |