Interpretando tus resultados
Dos-ejemplos T para Supp1 rA vs Supp1 Rb
|
N |
Media |
StDev |
SE Media |
|
|
Supp1Ra |
10 |
162.614 |
0.599 |
0.19 |
|
Suppl1rB |
12 |
155.13 |
1.13 |
0.33 |
Diferencia = mu Supp1rA – mu Supp1rB
Estimación por diferencia: 7.484
95% CI para diferencia: (6.687, 8.281)
T- Testo de diferencia = 0 ( vs no = ): T- Valor = 19.82 P-Valor = 0.000 DF = 17
La resistencia a ruptura media (medio), y dos medidas de desviación estándar de la variabilidad-(StDev) y del error de estándar del medio (el SE Mean)- se presenta para cada surtidor.
Los intervalos de confianza.
La diferencia entre los medios de la muestra (7.484) se utilizan para estimar la diferencia entre los medios de la población (mu SupplrA-mu SupplrB). El intervalo de la confianza para la diferencia se basa en esta estimación la variabilidad dentro de las muestras.
Usted puede tener una confianza del 95% que la diferencia entre los medios de la población está entre 6.687 y 8.281 PSI.
T-valor y el p-valor
El t-valor para la prueba es 19.82, que se asocia a un p-valor de menos de 0.0005 (que redondeado a 0.000).
Así, usted puede rechazar la hipótesis nula en el 0.05 ά - nivel, y concluye que las fuerzas son diferentes.
Consideraciones Finales.
Conclusiones prácticas.
El plástico de A`s del surtidor es perceptiblemente más fuerte y menos variable que el surtidor B`s. sin embargo recuerda que el surtidor A también carga más para su producto. Ahora usted debe decidir si la diferencia entre los surtidores es de significación práctica.
Usted es el 95% confiable que la diferencia verdadera entre los surtidores es entre 6.687 y 8.281 pis. Usted decide que no está dispuesto a pagar el precio alto más elevado para la pequeña fuerza de diferencia.
Consideraciones Estadísticas.
Al usar una t-prueba de la dos-muestra:
Debe ser observado que el procedimiento de la t-prueba es bastante robusto a las violaciones de la asunción de la normalidad, la condición de que las observaciones se recogen aleatoriamente y los datos son continuos, unimodal, y razonablemente simétricas (véase a la caja, al cazador, y a Cazador (1978). Estadística para Experimentos, John Wiley & Sons, Inc.).
Prueba- t Pareada
3 Ejemplos del Estacionamiento de los Carros.
Problema
Un grupo de consumidor desea determinar si hay una diferencia en la manipulación de capacidad entre dos coches populares. Para medir la capacidad de dirección de los coches, el tiempo lleva conductores el parque paralelo que cada uno de los coches se registra.
Recolección de datos
Veinte conductores parquean ambos coches (en orden al azar), y el tiempo del estacionamiento registrado (en segundos).
Herramientas
Stat > Estadísticas Básicas > Paired
Set de Datos
CARCLT.MPJ
|
Nombre |
Tipo de Dato |
Tipo de Variable |
|
Carro - A |
Numérico |
Respuesta |
|
Carro - B |
Numérico |
Respuesta |
Prueba-t Pareada
¿Qué es una prueba t pareada?
En una prueba t pareada tu puedes determinar si la media de la diferencia entre las observaciones pareadas es significativa Estadísticamente, es equivalente a realizar una Prueba t de una-muestra de una diferencia. Una t-prueba pareada se puede también utilizar para evaluar si la diferencia es igual al valor específico.
Las observaciones pareadas se relacionan de una cierta manera. Los ejemplos incluyen:
¿Cuándo utilizar una prueba t pareado?
Use una Prueba t pareada cuando tengas una muestra escogida al azar de observaciones pareadas. Los datos deben ser continuos.
¿Porqué usar una prueba t pareada?
Las pruebas t pareadas t puede ayudar a responder preguntas tales como:
Para el ejemplo:
Conduciendo una prueba t de pareada
Tu estas intentando determinar si un coche se puede estacionar más rápidamente que otro. Porque se emparejan los datos (cada individuo estaciono ambos coches), tu utilizaras una prueba t pareado para probar las hipótesis siguientes:
Cree los dotplots y los boxplots para ayudar a visualizar los datos. Utilice el nivel de la confianza del defecto del 95% para la prueba.
t Pareadas
1.- Abre el Project CARCLT.MPJ.
2.- Elija Stat > Estadísticas básicas > Pareo t.
3.- Completa el recuadro como se indica a continuación:

4.- Click Graficas.
5.- Elija Doplot de diferencias y Boxplot de diferencias.
6.- Click OK en cada recuadro.
Interpretando tus resultados
El boxplot y el dotplot ilustran las diferencias entre las observaciones pareadas.
El intervalo de confianza
MINITAB también dibuja el intervalo de confianza para la diferencia de la media de la población. Así que la hipótesis nula es verdad, tu esperarais que Ho estuviera dentro de este intervalo.
Porque el intervalo de la confianza no esta incluido en Ho, tu puedes rechazar la hipótesis nula y concluir que al coche A le toma mas tiempo estacionar que al coche B.


Interpretando tus resultados
Las medias de los tiempos para estacionarse son 34.87 segundos para el coche A y 32.90 segundos para el coche B. La diferencia es 1.967 segundos.
Los puntos finales para el intervalo de confianza del 95% para la diferencia de la media son de 0.171 y 3.764.
T-valor y p-valor
La prueba da un valor de t de 2.29, se asocia con un p-valor de 0.034. Así, tu puedes rechazar la hipótesis nula en el nivel 0.05 ά y concluir que el tiempo requerido para estacionar el coche A es mayor que el tiempo requerido para estacionar el coche B.
Prueba T para Carros A – Carros –B

Consideraciones finales
Conclusiones prácticas
En promedio, a los conductores les tomo 1.967 segundos mas estacionar el coche A que el coche B. Esta diferencia aunque pequeña es estadísticamente significativa.
¿Es una diferencia de 2-segundos de importancia practica?. Esto lo decides tu.
Los tiempos levemente más largos para estacionarse se asocian a la frustración creciente del conductor, los 2 segundos pueden ser importantes. También, esta diferencia puede ser de mayor importancia a los conductores que seguido se estacionan paralelo.
Consideraciones Estadísticas
Cuando usar una prueba t pareada:
Debe ser observado que el procedimiento de la prueba t es bastante robusto para las violaciones de las suposiciones de la normalidad, a condición de que los pares de observaciones se recojan aleatoriamente y los datos sean continuos, unimodal, y razonablemente simétricos (véase a la caja, al cazador, y a Cazador (1978). Estadística para Experimentos, John Wiley & Sons, Inc.).
Utilizando observaciones pareadas eliminas la variabilidad causada por individuos. Por ejemplo, al conductor 1 le tomo 18.9 segundos para estacionar el coche y 18.2 segundos para estacionar el coche B. En contraste, al conductor 18 le tomó 43.8 y 41.1 segundos para estacionar los mismos coches. Obviamente, hay mucha variabilidad entre los conductores. Pero analizando las diferencias para cada conductor, tu eliminas esta variabilidad de los cálculos, aumentando el power de tu prueba.
Ejercicio 3.1 Comparaciones de Calibradores
Ejercicio
Tu estás considerando la compra de dos diversos gage para medir válvulas: Calibradores por EasyGage y Too1It. Tu deseas comparar las dos marcas de fábrica del calibrador para determinarse si ofrecen las mismas medidas de promedio.
Utilice un ά-nivel de 0.05 para todas las pruebas.
Recolección de datos
Doce operadores cada uno midieron la misma válvula con los dos diversos calibradores. (El orden en la cual utilizaron el calibrador fue seleccionado aleatoriamente.)
Instrucciones
1.- Use una prueba t pareada para determinar si las medidas de cada calibrador son diferentes.
2.- Con la desviación de estándar de la diferencia de la muestra como estimación de ά , calcule la energía de la prueba al detectar una media de la diferencia de 0.005 cm.. (Indirecta: Conducir una t-test paired es lo mismo que conducir una t-prueba de la una-muestra es la diferencia entre las observaciones pareadas.
Por lo tanto, tu puedes utilizar Stat > Power and sample size > 1- Sample t para evaluar el power de la prueba t pareada.
3.- ¿cuál es la energía de la prueba de detectar una diferencia de la media de 0.001 centímetro?
Set de datos
CALIPERS.MPJ
|
Nombre |
Tipo de dato |
Tipo de variable |
|
Operator |
Numérico |
Respuesta |
|
Easy gage |
Numérico |
Respuesta |
|
Toollt |
Numérico |
Respuesta |
|
Diff |
Numérico |
Respuesta |
Prueba de una Proporción
Ejemplo 4 Televisiones Reparadas por Tarifa
Ejercicio
Tu quieres determinar si la proporción de tu sistema de televisión de 35- pulgada necesitara ser reparado en el plazo de 4 años de la compra, es diferente que el índice de la industria 6.8% ( 0.068)
Recolección de datos
Aproximadamente 100,000 encuestas fueron enviadas a los clientes que compraron una televisión 35-plagadas. De los 2,856 clientes que regresaron las encuestas, 236 indicaron que su televisión había requerido la reparación en el plazo de 4 años de la compra.
Herramientas
Stat > Estadísticas Básicas > 1 Proporción
Set de datos
Ninguno
Prueba de una proporción
¿Qué es una prueba de proporción?
Una prueba de una proporción te ayuda determina si una proporción de la población es diferente de un valor específico (proporción de la prueba.)
¿Cuándo utilizar una prueba de una proporción?
Usa una prueba de proporción para evaluar la proporción de los datos de una sola muestra.
¿Porqué usar una prueba de una proporción?
Una prueba de una proporción te puede ayudar a contestar preguntas tales como:
Por el ejemplo,
Conduciendo una prueba de una proporción
Tu estás evaluando los resultados de un examen enviado a los clientes que compraron una de sus televisiones.
La proporción de los que respondieron con televisión que la necesito reparación dentro de los 4 años es 236 / 2856 = 0.0826. El promedio de la industrial es 0.068.
Utiliza una prueba de una proporción para determinar si esta diferencia es significativa.
Las hipótesis para la prueba es:
Utilice un nivel de la confianza del 95%.
1 Proporción:
1.- Elija Stat > La Estadística Básica > 1 Proporción.
2.- Seleccione Summarized data.
3.- En el Número de ensayos, tipo 2856.
4.- En el Número de éxitos, tipo 236.
5.- Click Opciones.
6.- Complete el recuadro como se indica a continuación:

7.- Click OK en cada recuadro.
Interpretando tus resultados
Utilice ά de 0.05 para la prueba.
Los resultados sugieren que el índice de la reparación para su televisión (muestra p = 0.083) sea más alta que el índice a nivel industrial de 0.068
Tu debes rechazar la hipótesis nula, ya que el índice de tu reparación igual que el índice a nivel industrial.
Mas / Para cálculos de intervalos de confianza, vea ayuda de Minitab.
Test y CI para una Proporción

Consideraciones finales
Conclusiones prácticas
La evidencia sugiere que la proporción de que tu televisión requiera reparación dentro de los de 4 años de la compra es mayor que la proporción del índice a nivel industrial de 0.068.
Por supuesto, la mayoría de los clientes que recibieron el examen no lo devolvió. Es siempre posible que los clientes que han tenido un problema en su televisión son los más probables en devolver el examen. Si ésta es la causa, la proporción real puede ser mucho menos de 0.082633.
Consideraciones estadísticas
Cuantas más observaciones tu tengas, más power tendrá tu prueba de una proporción.
También puedes aumentar el power aumentando ά. Sin embargo esto también aumenta la posibilidad de que ocurra el error tipo 1.
Objetivos:
Contenidos

Correlación
Ejemplo 1 de Sistemas de Medias
Ejercicio
Tu has desarrollado un sistema de medida en línea que usted cree medirán el pH como exactamente el sistema actual en su laboratorio. El sistema en línea proporcionaría una regeneración más rápida y la capacidad de ajustar los sistemas en tiempo real. Tu quieres saber si los dos sistemas producen lecturas similares del pH.
Recolección de datos
La colección de datos ambos sistemas se utiliza para medir el pH de 20 Jornadas aleatoriamente seleccionadas del producto de limpieza.
Herramientas
Graph > Plot
Stat > Basic Statistics > Correlation
Set de Datos
LABSTEST.MPJ
|
Nombre |
Tipo De datos |
Tipo de Variable |
|
Laboratorio |
Numérica |
Respuesta |
|
En línea |
Numérica |
Respuesta |
Correlación
¿Qué es correlación?
La muestra del coeficiente de correlación r, mide el grado de la asociación linear entre dos variables (el grado en la cual una variable cambia con otra).
Una correlación positiva indica que ambas variables tienden a incrementarse juntas. Una correlación negativa indica que una variable se incrementa, y la otra decrece.
¿Cuándo utilizar la correlación?
Utiliza la correlación cuando tengas datos para que dos variables continuas y desees determinen si hay una relación linear entre ellas. La correlación no dirá si estas variables están relacionadas de una manera no lineal.
Algunos estadísticas creen que la correlación no debe ser utilizado si una variable y es dependiente de la respuesta de la otra.
¿Porqué usar la correlación?
La correlación te puede ayudar a contestar preguntas tales como:
Por ejemplo,
Dibujando los datos
Creando un diagrama te ayudará a visualizar la relación entre las medidas tomadas por los dos sistemas que estás utilizando para medir el pH.
Graficando las variables
Grafica el laboratorio y el Online de la variable en X y Y respectivamente.
Plot
1.- Abre el proyecto LABTEST.MPJ.
2. Escoge Graph > Plot
3.- Completa el recuadro como se indica a continuación:

4.- Click OK
Interpretando tus resultados
El diagrama Online contra medidas del laboratorio indica:
¿Que se hace después?
Porque la relación es linear, usted puede calcular la correlación para cuantificar la fuerza de la asociación.

Calculando la correlación
Tu deseas calcular el coeficiente de correlación de Pearson para determinar la fuerza de la asociación linear entre las medidas en Online y del laboratorio.
Correlación
1.- Escoge Stat > Basic Statistics > Correlacion.
2.- Enter en Variable Laboratorio.

3.- Click OK.
Interpretando tus resultados
Correlación: Laboratorio En línea.
Prueba de la Correlación Laboratorio En línea = 0.959
P – Valor = 0.000
Use una ά 0.05 para el texto.
Pearson correlación
El coeficiente de la correlación de la muestra (r) es calculado por la fórmula:

El valor de r estará siempre entre -1 y 1:
P-valor
La prueba del p-valor las hipótesis siguientes:
Ho: El coeficiente de correlación (p o rho) para la relación entre las poblaciones es igual a cero.
H1: p no es igual a cero.
Conclusión:
El coeficiente de correlación (0.959) indica que ahí una fuerte asociación lineal positiva entre la media del Laboratorio y la del Online. Además el p-valor (0.000) es menos que & (0.05), entonces tus puede rechazar la hipótesis nula, ya que no existe ninguna asociación lineal.
¿Que se hace después?
Antes de sustituir el sistema de laboratorio con el sistema en línea, tu necesitas evaluar dos aspectos adicionales entre la relación de los dos. Incluso si la correlación era perfecto (r=1), todavía podrían haber diferencias importantes entre los sistemas:
El coeficiente de correlación no dirige estas cuestiones de tendencia y sensibilidad.
Anotación de la gráfica
Utilice el diagrama del argumento para ayudarte a evaluar si la medida de los dos sistemas es similar, y si los sistemas son igualmente sensibles:
Plot
1.-Elige Graph > Plot.
2.- Del capítulo, elige el minuto y el máximo.
3.-Elige el mismo mínimo y máximo para las X de X y de Y.
4.- Click OK
5.- Para anotación, elija la línea.

6. – Completa el recuadro como se indica a continuación:

7.- Clic OK en cada recuadro.
Interpretando tus resultados
Para cada punto referente en la línea, X es igual a Y. Si ambos sistemas van encima con las mismas medidas para cada muestra, entonces todos los puntos de referencias caerán en esta línea.
Comparando los datos en la línea de referencia revela lo siguiente:

Consideraciones finales
Conclusiones prácticas
Hay una fuerte correlación positiva del (0.959) entre las medidas tomadas con el laboratorio y con los sistemas en línea.
Sin embargo el sistema en línea rinde medidas constantemente más altas que lo hace el sistema del laboratorio. Esto puede indicar la necesidad de recalibración.
Los resultados de los límites en el experimento indican que es menos costoso y más fácil utilizar el sistema en línea y puede ser un reemplazo conveniente para el sistema de medida del laboratorio.
Consideraciones estadísticas
La Correlación cuantifica el grado de la asociación linear entre dos variables.
Una correlación fuerte no implica una relación de causa y efecto. Para el ejemplo, una correlación fuerte entre dos variables puede ser debido a la influencia de una tercera variable, no bajo consideración.
Un coeficiente del correlación cerca de cero no significa necesariamente ninguna asociación, sólo que esa asociación no es linear. Tu debes trazar siempre sus datos de modo que puedas identificar relaciones lineares cuando estás se presenten.
Algunos estadísticos discuten que la correlación que sea utilizada si una variable es una respuesta dependiente de la otra.
La correlación asume que los valores de ambas variables están libres de variar. Tu no puedes utilizar la correlación si fijas los valores de una variables una para estudiar cambios en otra.
Regresión Simple
Ejercicio
Tu sospechas que la revoltura tiene un impacto en el nivel de impurezas en tu producto de pintura.
Recolección de datos
Las impurezas fueron medidas para lotes de pintura revueltas en rangos de movimientos a partir de 20 a 42 RPM (revoluciones por minuto.)
Herramientas
Stat > Regression > Fitted Line Plot.
Stat > Regression > Fitted Line Plots.
Set de Datos
PAINT.MPJ

¿Qué es la regresión simple?
La regresión simple examina la relación entre una variable de respuesta continua (Y) y una variable de predicción (X). La ecuación general para un modelo de regresión simple es:
Y = Y = βo + β1 X + έ
Donde Y es la respuesta, X es la predicción, βo la es el interceptor (el valor de Y cuando X iguala el cero), β1 la es la cuesta, y έ es el error aleatorio.
¿Cuándo usar la regresión simple?
Usa la regresión simple cuando tu tengas Y continua y solo una X. Las siguientes condiciones deben ser encontradas:
Los valores de Y obtenidos en su muestra se diferenciarán de estas predicciones por el modelo de regresión (a no ser que todos los puntos resulten caer sobre la línea perfectamente recta.). Llaman residual a estas diferencias.
Antes de la aceptación de los resultados de un análisis de regresión, tu debes verificar que las suposiciones siguientes sobre los residuales son válidas para tus datos:
¿Por qué usar la regresión simple?
La regresión simple te puede ayudar a contestar preguntas tales como:
Por ejemplo,
Ajustando el modelo lineal
Tu quieres determinar el efecto de tarifa de movimiento sobre la cantidad de impurezas en la pintura. Utiliza Fitted Line Plot para calcular y graficar la ecuación de la regresión
Fitted Line Plot
1.- Abre el Project PAINT.MPJ.
2.- Escoge Stat > Regression > Fitted Plot.
3.- Completa el recuadro como se indica a continuación:

4.- ClicK OK
Interpretando tus resultados
Regresión la ecuación
La ecuación de Regresión relaciona la predicción (stirrate) con la respuesta (la impureza):
Impureza =-0.289277 + 0.456643 stirrate
La inclinación de la línea de regresión, 0.456643, indica cuanto un cambio en la impureza es asociado con cada cambio de una unidad de stirrate.
S
S es una estimación del promedio de variabilidad media sobre la línea de regresión. La S es la raíz cuadrada positiva de MSE. La mejor ecuación predice la respuesta, mas bajo S será.
R2 (R-Sq)
La R2 (Cuadrada de r) es la proporción de la variabilidad en la respuesta que es explicada por la ecuación. Así, el 93.4 % de la variación en la impureza puede ser explicado por su relación lineal con el Stirrate.
Valores aceptables para R2 varían dependiendo del estudio. Por ejemplo, los Ingenieros que estudian reacciones químicas pueden requerir una R2del 90 % o más. Sin embargo, alguien estudiando el comportamiento humano (que es más variable) puede estar satisfecho con valores de R2 inferiores.
Ajustada (cuadrado de r (adj))
R2 ajustada es sensible al número de términos (condiciones) en el modelo y es importante comparar los modelos con diferentes números de términos (Ver 3-58).

La menor línea de regresión cuadrada
Los coeficientes para la ecuación de regresión son escogidos para reducir al mínimo la suma de las diferencias cuadriculadas entre los valores de respuesta observados en la muestra y aquellos predichos por la ecuación.
En otras palabras, las distancias verticales entre los puntos y la línea son reducidas al mínimo, ilustrado a la derecha. El resultado es llamado: La menor parte de la línea de regresión cuadrada.
Esté atento a esta líneas de fuera usando los procedimientos de la regresión. Algún líneas de fuera (llamados altos puntos ) tienen un efecto grande sobre el cálculo de la menor parte de línea de regresión de cuadrado. En tales casos, la línea más puede puede representar al resto de datos muy bien.
Note: este gráfico ha sido corregido para la ilustración.

Interpretando tus resultados
Use el análisis de varianza (ANOVA) resultados para evaluar si su modelo de regresión simple es útil. El ANOVA compara su modelo a un modelo restringido que no usa Stirrate (X) para predecir la impureza (Y):
El modelo restringido declara que los cambios de Y están previstos únicamente al error arbitrario (έ). Es equivalente a un modelo de regresión simple con una cuesta (β1) de cero. Así, las hipótesis para el ANOVA son,
Interprete el p-valor (P) así:
Conclusión
Usando un ά 0.05, tu puedes rechazar el modelo simple restringido y afirmar que Stirrate realmente tiene un efecto significativo lineal sobre la Impureza.
Análisis de Regresión: Impureza contra Stirrate

Adicionando confianza y Predicción
Confidencialidad y bandas de predicción.
Tu también quieres saber si confiar que la media y los puntos individuales en la variable Y, Impurezas caen dentro de ciertos límites de variabilidad.
Residuales y Fits
El Residual es la diferencias entre los valores ajustados de su modelo y los valores observados. Son las estimaciones de punto de la respuesta estimados para cada nivel de la variable independiente. Tu debes almacenar estos valores para usar más tarde.
Use un nivel de confianza de falta del 95 %.
Fitted Line Plot
1.- Escoja Stat > La Regresión > Fitted Line Plot presione Ctrl + E para volver al dialogo Fitted Line Plot al cuadro.
2.- . Click Opciones.
3.- Completa el recuadro de diálogo como se indica a continuación:

4.- Click OK.
5. - Click Storage.
6.- Elige Residuals y Fits.
7- Click OK en cada recuadro.
Interpretando tus resultados
Intervalo de confianza
El 95% de confianza define un excelente rango de valores en la población de la media de Y. Para cualquier valor dado de X, tu pues confiar que la población de la media de Y esta entre las líneas indicadas.
Intervalo de predicción
El intervalo de predicción del 95 % define una gama probable de valores de Y para observaciones individuales. Para cualquier valor dado de X, tu puedes confiar con un 95 % que el valor correspondiente de Y para una observación estará entre las líneas indicadas.
Regresión Plot

Creando una gráfica del Residual
El residual para cada observación es la diferencia entre el valor observado de la respuesta y el valor predictivo por el modelo (el valor ajustado). Por ejemplo, si el valor de respuesta observado es 12 y el modelo predice 10, el residual es 2.
Suposiciones
Para confirmar que tu análisis de regresión es válido, tu debes verificar todas las suposiciones sobre los residuales. Usa las graficas de la residual para comprobar que los residuales:
Nota : Si tienes más que una columna de residuales y Fits sobre su hoja de trabajo, se cuidadoso al seleccionar las columnas correctas cuando crees las graficas de la residuales.
Residual Plot
1. Escoja Stat > Regresión > Residuales Plots0
2. Completar el recuadro como se indica a continuación:

3. –Click OK
Interpretando tus residuales
La gráfica de probabilidad de Normalidad
Usa la grafica de la probabilidad normal de la residual para verificar que el residual no este desviada sustancialmente de la distribución normal.
Basado en este grafico, es razonable asumir que los residuales para sus datos no se desvía considerablemente de una distribución normal. Una prueba de normalidad para estos datos (no mostrado dio un p-valor de 0.252.)
Histograma
Tu puedes usar el histograma de las residuales para evaluar la normalidad. Sin embargo, la grafica de probabilidad normal es generalmente más fácil para hacer de interpretar, sobre todo para pequeñas muestras.

Interpretación sus resultados
Gráfica
La gráfica presenta los residuales en el orden de la recolección de los datos ( proporcionando los datos que fueron entrados en el misma orden en la cual ellos fueron recogidos). Use la grafica para verificar que el residual es independiente.
No aparece haber en ningún momento efecto de orden en el set de datos presentes.

Interpretando tus resultados
Residuales Versus Fits
Use el grafico de los residuales versus ajustes para verificar que:
Si tu puedes ver cualquier tipo de patrón en esta grafica, una de estas suposiciones ha sido violada.
La tabla debajo resume el patrón típico que puedes ver.
|
El patrón |
Indica |
|
Curvilíneo |
Un término cuadrático puede fallar en tu modelo |
|
La extensión desigual de las residuales a través de los diferentes valores ajustados. |
La variación de las residuales no es constante. |
|
Un punto está situado muy lejos del cero. |
Esta fuera de línea. |
La grafica de los datos no parece revelar ningún patrón.

Consideraciones finales
Conclusiones prácticas
El análisis simple de la regresión linear reveló que el aumento de los ritmos de revoltura está asociados a los niveles crecientes de impurezas en su pintura
La pendiente de la ecuación de la regresión indica que cuando tu aumentas el ritmo del revolvimiento en 1 rpm, el nivel de impurezas aumenta en 0.456643.
Tu puedes usar la ecuación para determinar qué las impurezas serán diferentes para las mezclas de pintura. Sin embargo, la ecuación es solamente válida para la gama de datos que usted ha hecho un muestreo (revolviendo entre 20 y 42).
Consideraciones estadísticas
Tu no puedes utilizar el análisis de la regresión para afirmar que los cambios en la predicción fueron causados por la respuesta, a menos que los valores del predictor fueran fijos en los niveles predeterminados en un experimento controlado. Si los valores de los predictor se permiten variar aleatoriamente, otros factores pueden influenciar la predicción y la respuesta.
Tu no debes aplicar los resultados de la regresión a los valores que son de X que están fuera de su gama de la muestra. Por ejemplo, Tu no debes utilizar la ecuación de la regresión derivada en este ejemplo para predecir los niveles de impureza para un índice del revolvimiento de 100, porque los más altos ritmos de revolvimiento implicada en el análisis son de 42. La relación entre Revolvimientos y la impureza puede ser muy diferente para el ritmo de revolvimientos de 42.
Ten cuidado de las líneas de fuera cuando uses el procedimiento de regresión. Algunas líneas de fuera( llamadas
Esté alerta para los afloramientos al usar procedimientos de la regresión. Algunos afloramientos (llamados puntos altos de apalancamiento) tienen un efecto grande en el cálculo de la línea menor de la regresión de los cuadrados. En tales casos, la línea puede no representar el resto de los datos muy bien.
Ejercicio 2.1
Protectores de Erosión
Ejercicio
Tu estas intentando predecir cómo los protectores de acero de la erosión para las turbinas de vapor resisten la pérdida de la abrasión.
La resistencia directamente que mide a la abrasión es difícil, costosa, y destructiva. Por lo tanto, tu esperas poder predecir la resistencia a la abrasión usando la dureza de acero, que es más conveniente y menos costosa medir.
Recolección de datos:
La pérdida y la dureza de la abrasión de la recolección de datos fueron medidas para 24 protectores aleatoriamente seleccionados de la erosión.
Instrucciones
1. Utilice la Fitted Line Plot para ajustar el modelo simple de la regresión linear con la abrasión como la respuesta y la dureza como el predictor: Incluya la confianza y la predicción en sus resultados, y asegúrate de almacenar las residuales y los ajustes.
2. Utiliza los diagramas residuales de validar las suposiciones necesarias.
Set de Datos
EROSION.MPJ

Ejemplo 3 del caudal de la corriente.
Ejercicio
Tu estás conduciendo un estudio de los impactos para el medio ambiente y quieres utilizar la profundidad de una corriente para estimar el caudal.
Recolección de datos:
La profundidad y el flujo fueron registrados para una sola corriente en un periodo de 6 meses.
Herramientas
Graph > plot.
Stat > Regression > Fitted Line Plot.
Stat > Regresión > Argumentos Residuales.
Set de Datos:
FLOW.MPJ

Regresión Polinomial
¿Que es Regresión polinomial?
Como la regresión lineal, La regresión polinomial examina la relación entre una variable continua de la respuesta (Y y una variable del predictor (X). Es diferente de la regresión simple, sin embargo, un modelo polinomial puede incluir los términos para los exponentes de X:

Donde Y es la respuesta, X es el predictor, βo es el coeficiente para el término linear, β1 es el coeficiente para el término ajustado, β2 es el coeficiente para el término cuadriculado, β3 es el coeficiente para el término cubicado, y έ es error al azar.
¿Cuándo utilizar la Regresión Polinomial?
Usa la Regresión Polinomial cuando tengas tiene una Y continua y un solo X, y evidencia o teoría sugiriendo no-linealidad.
Después de aceptar los resultados en el análisis de la regresión simple, tu debes verificar que las siguientes suposiciones acerca del residual sean validas en tus datos.
¿Porqué usar la Regresión Polinomial?
La Regresión Polinomial te puede ayudar a responder preguntas tales como:
Por ejemplo,
Dibujando los datos
Para visualizar la relación entre la profundidad de la corriente y el caudal, utilice el diagrama para crear un scatterplot con la respuesta (flujo) en el y-axis y el predictor (profundidad) en el x-axis.
Plot
1.- Abre el Project FLOW.MPJ.
2.- Elija El Graph > Plot
3.- Completa el recuadro como se indica a continuación:

4.- Click OK
Interpretando tus resultados
La gráfica revela una relación potencialmente no lineal entre la profundidad y el flujo.
Por ejemplo, Note que un aumento 1.5- pies en profundidad a partir de la 0.5 a 2 pies parece aumentar dos veces el flujo tanto como un aumento en profundidad a partir del 6.0 a 7.5 pies.

Ajustando el modelo linear
Usa la grafica del modelo linear, para evaluar que tan bien esta el modelo de regresión linear en los datos.
Fitted Line Plot
1.- Elige Stat > Regression > Fitted Line Plot.
2.- Completa el recuadro como se indica a continuación:

3.- Click OK
Interpretando tus resultados
La ecuación linear que mejor describe los datos es:
Flujo = 0.301672 + 0.0726395 Profundidad
R2 (R-r-Sq)
El R2 para el modelo linear indica que 91.5% de la variabilidad en flujo es explicado por profundidad de la corriente.
¿Que sigue?
Mientras que un porcentaje de la variabilidad es explicado por el modelo linear, parece una línea levemente curvada cabría incluso mejor. Tu debes evaluar cómo en modelo cuadrático caben estos datos.
Regresión Plot

Ajustando el Modelo Cuadrático
Usa el Fitted Line Plot para cuadrar tu modelo de regresión cuadrático. Almacene los ajustes y las residuales para una reexaminación más futura.
Fitted Line Plot
1.- Elige el Stat > Regresión > Fitted Line Plot o presiona Ctrl+E para volver a Fitted Line Plot del recuadro.
2.- Completa el recuadro como se indica a continuación:

3.- Clic Storage.
4.- Compruebe las Residuals y los Fits.
5.- Click OK en cada recuadro.
Interpretando tus resultados
Ecuación de Regresión
La Regresión cuadrática que mejor describe los datos es:
Flujo = 0.245230 + 0.133027 Profundidad
- 0.0087100 Depth**2
R2 (R-r-Sq) y R2- adjuntos (R - Sq(adj))
R2 indica que el modelo cuadrático considera 96.0% de la variabilidad en el caudal. Éste es algo más que el R2 de 91.5% obtenidos con el modelo linear (véase 3-32).
La estadística ajustada de R2 estadística ajustada es ajusta según el número de términos en el modelo, y debe ser utilizada al comparar modelos con diversos números de predictores.
El R2 ajustado para el modelo cuadrático (95.3%) es mayor que el R 2 ajustado para el modelo linear (90.7%), indicando que el término adicional mejora la predicción.
Regresión Plot

Interpretando tus resultados
Utilizan una ά 0.05 para todas las pruebas.
Análisis de Varianza
El p-valor para el modelo en su totalidad (0.000) es significativo, indicando que el modelo es útil.
El p-valor para el término linear (0.000) es también significativo, indicando que explica una cantidad significativa de variabilidad.
Pasado, el p-valor para el término cuadrático (0.004) es significativo, indicando eso que agrega este término al modelo linear mejora la predicción perceptiblemente.
Análisis Polinómial De la Regresión:

Graficando los residuales
Utilizan las residuales y los ajustes correr graficas de diagnóstico en el modelo cuadrático. Tu estás utilizando diagramas residuales para verificar que las suposiciones sobre el término del error en el modelo de la regresión han sido encontradas.
Residual Plots
1.- Elige Stat > Regresión > Residual Plots.
2.- Completa el recuadro como se indica a continuación:

3.- Click OK
Interpretando tus resultados
Diagramas de Probabilidad Normal
Usa los diagramas de probabilidad normal de los residuos para verificar que tus residuos no se desvían substancialmente de una distribución normal.
Basado en este diagrama, es razonable asumir que los residuos para tus datos no se desvían substancialmente una distribución normal. ( Una prueba de normalidad para estos datos (no mostrado) permitió un p-valor de 0.340.)
Histograma
Puedes también usar el histograma de los residuos para evaluar la normalidad. Sin embargo, la probabilidad normal es generalmente más fácil de interpretar sobre todo para las muestras pequeñas.

Interpretando tus resultados
Grafica 1

En la Grafica 1 se presenta los residuales en el orden de la recolección de datos (los datos que entraron en el mismo orden en los que fueron recolectados) usa esta grafica para verificar que los residuos son independientes.
Los datos no aparecerán en ningún tiempo o los efectos del orden de los datos presentes.
Interpretando tus resultados
Los residuales vs Fits
Use el plot de los residuales vs los Fits para verificarlo:
Si ves cualquier tipo de modelo en el plot uno de estas asunciones ha sido violada. Tu puedes ver en el siguiente cuadro debajo el resumen de los modelos típicos.
|
Este modelo |
Indica… |
|
Curvilíneo |
Un término cuadrático puede estar perdiendo su modelo. |
|
La extensión desigual de las residuales a través de los diferentes valores ajustados.
|
La variación de los residuales no es constante |
|
Un punto está situado muy lejos del cero. |
Fuera de línea |

Agregando confianza y predicción a las Cintas
Creando una nueva fitted line plot del modelo agregando confianza y predicción a las cintas. Mostrando las cintas y los intervalos te da una mejor idea de la variabilidad y estabilidad del modelo cuadrático.
Fitted Line Plot
1.- Escoge Stat > Regression > Fitted Line Plot.
2. -Bajo Type of Regresión Model, Escoge Quadratic.
3.-Pulse el botón las Opcions.
4.-Completa el recuadro como se indica a continuación:

5.- pulse el botón OK en cada cuadro de diálogo
Interpretando tus resultados
El intervalo de confianza
El 95% intervalo de confianza define un rango probable de valores para la media de la población de Y. para cualquier valor dado de X, usted puede ser 95% seguro que la media de la población para Y está entre las líneas indicadas.
El intervalo de la predicción
El 95% intervalo de la predicción define una demostración del rango de los valores de Y por las observaciones individuales. Por cualquier valor dado en X tu puedes tener 95% de confiabilidad correspondiente al valor de Y por una observación que será dentro de las líneas indicadas.

Consideraciones Finales
Conclusiones prácticas
El análisis indica que la relación entre la profundidad de la corriente y proporción del flujo es más bien cuadrática que lineal. Cuando la corriente es baja, pequeños incrementos se muestran en los resultados de la profundidad y grandes incrementos en el flujo. Sin embargo, cuando la corriente llega a ser mas profundo, los mismos incrementos en la profundidad causan menos cambios en el flujo.
Consideraciones Estadísticas
Tu no puedes usar la análisis de la regresión para afirmar que los cambios en las predicciones cambian las causas en la respuesta, a menos que el valor predictivo fuere arreglado en la predeterminación de niveles en un experimento controlado. Si los valores predictivos se permiten variar al azar, otros factores pueden influenciar en ambos los predictivos y la respuesta.
No debes aplicar los resultados de la regresión para responder a los valores que están fuera del rango de la muestra.
Ejercicio 3.1 Descarga Diesel
Estas investigando los efectos de humedad en las emisiones de la descarga de camiones diesel
Recolección de datos
Los datos son de la Hare C.T. (1997). "Light Duty Diesel Emisión Correction Factors for Ambient Conditions" el informe final a la Agencia de protección del ambiente bajo contrato No. 68-02-1777, Instituto de la investigación sudoeste, San Antonio, TX.
Instrucciones
1.- La información de la grafica visualiza la relación entre las variables.
2.- Usa Fitted Line Plot para adaptar el modelo apropiado de regresión.
3.- Asegúrate de verificar las asunciones necesarias con las graficas los residuales.
Set de Datos
EL DIESEL. MPJ

Ejemplo 4 Reduciendo el golpe del Motor
Problema
Trataras de identificar las llaves predoctoras del golpe del motor.
Las siguientes variables están bajo las siguientes consideraciones:
Recolección de los datos
Los datos son recolectados al azar de 13 motores seleccionados, todos trabajan con gasolina con un octanaje tasa de 87.
Herramientas
Graph > Matrix plot
Stat > Basic Statistics > Correlation
Stat > Regression > Regression
Set de Datos
KNOCK.MPJ

Regresión Múltiple
¿Cuál es la regresión múltiple?
La regresión múltiple examina la relación entre una respuesta continua variable (Y) y más de un predictor (X) de variables. La ecuación general para un modelo de la regresión múltiple es:
Y .= β0 + β1 X1 + β2 X2 + β3 X3 +…. +ε
Donde Y es que la respuesta, β0 es el intercepte cada Xi es un predictor variable con una cuesta de βi, y ε es el error aleatorio.
Cuándo usar la regresión múltiple
Use la regresión múltiple cuando tienes un Y continuo y más de una X.
Antes de aceptar los resultados de análisis de la regresión, debes verificar las siguientes asunciones sobre los residuales que son válidos para la información:
Por qué usa la regresión múltiple
La regresión múltiple puede ayudar a contestar las siguientes preguntas:
¿Qué tan importantes son tus variables X en predicción con tus valores Y?
¿Qué valor esperas de Y cuando X1 es 20 y X2 es 3?
¿Cuánto cambiarán Y si aumentas X3 por una unidad?
Por ejemplo,
¿Cómo procesas la temperatura y porosidad relacionada a la dureza del acero?
¿Qué tan duro esperas que tu acero esta si tu proceso se encuentra a cierta temperatura por cierto tiempo?
¿Qué tan resistente es la dureza del acero si incrementas la temperatura a 100 °?
Creando una Matriz Plot
Usaras primero una matriz plot y coeficientes de correlación primero para ver si las relaciones existen entre la contestación inconstante y las variables de la predicción.
Variables del gráfico
Es más fácil mirar la relación entre la respuesta y la predicción cuando entras en la respuesta de la ultima variable en las variables del gráfico.
Matriz Plot
1.- Abre el proyecto KNOCK.MPJ
2. - Escoge Graph > Matriz Plot.
3.- Complete el recuadro como se indica a continuación:

4. - Click Options.
5. - Bajo Matriz Display Escoge Lower Left.
6. - Click OK cada recuadro.
Interpretando tus resultados
Los resultados incluyen los gráficos para cada combinación de variables.
Fíjate para evaluar la relación entre el golpe y las predicciones.
Parece ser una correlación negativa entre el golpe y chispa. Allí también parece ser correlaciones positivas entre el golpe y cada uno de las predicciones restante
¿Qué sigue?
Usa la correlación para evaluar las fuerzas de relación lineal.

Cálculo de las Correlaciones múltiples
Cree una matriz de correlación para evaluar las asociaciones entre el golpe y las predicciones.
Correlación
1.- Escoge Stat>Basic Statistics>Correlation
2.- Completa el recuadro como se indica a continuación:

3.- Click OK
Interpretando tus resultados
La salida incluye el coeficiente de correlación y el p-valor para cada par de variables. (Use un 0.05 para todas las comparaciones.)
Una sugerencia en la matriz plot, hay una correlación negativa significante entre el golpe y chispa ( r = -0.699, p=0.008). Hay también, correlaciones positivas significantes entre el golpe y cada uno de las predicciones restante:
Que sigue.
Porque AFR tiene la relación lineal más fuerte con la regresión de uso de golpe para ajustarse a un modelo de la regresión lineal simple con el golpe como la contestación y AFR como las predicciones.

Encajando a un modelo de la regresión simple
Usa la regresión para realizar un análisis de la regresión lineal simple para el golpe y AFR. Podrías también usar Fitted Line Plot antes de realizar un análisis.
Regresión
1.- Escoja Stat > Regresión > Regression
2.- Completa el recuadro como se indica a continuación:

3.- Click OK
Interpretando tus resultados
Ecuación de la Regresión
La ecuación relacionada con la respuesta y la predicción es:
Knock = 25.5+4.25 AFR
Esto indica que el golpe aumenta 4.25 veces por el aumento de la unidad en AFR
Tabla de coeficientes
Las hipótesis para cada coeficiente es:
El valor-p para la constante (β0 , la intercepciσn) y el coeficiente de AFR (β1, la cuesta) ambos son menores de 0.05. Asν nosotros podemos rechazar Ho para cada uno a los 0.05 α-level y concluimos que estos coeficientes no son cero. En este modelo, AFR es una predicciσn significativamente estadística del golpe.
El análisis de la regresión: el golpe contra AFR

Interpretando tus resultados
R²(R-Sq)
El R² indica los 92.3% de la variabilidad del golpe predicho por este modelo.
El Análisis de la varianza
Llamada que las hipótesis para un modelo de la regresión lineal simple son:
¿Qué sigue?
El modelo de la regresión simple con AFR es útil para la predicción del golpe. Sin embargo, es posible que el Power de la predicción adicional puede ser ganada incluyendo otras predicciones en el modelo de regresión.
El análisis de la regresión: el golpe contra AFR

Ingrese el e-mail y contraseña con el que está registrado en Monografias.com
Trabajos relacionados
Ver mas trabajos de Software |
|
Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.
Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.