
Objetivos
Prueba de Hipótesis
Ejemplo 1 Llenado Cajas de cereal
El propósito de este ejemplo es de introducir los conceptos de la prueba de hipótesis. Tu usaras un one-sample t-test para analizar datos procesados para determinar sí el proceso esta en el objetivo.
Problema
El objetivo. Tu quieres determinar sí el proceso esta en el objetivo
Recolección de datos
Para evaluar el proceso de la media. Elegirás 6 cajas de cereal al azar, las pesaras, y usaras los datos de ejemplo para estimar la media de la población.
Herramientas
Stat> Estadísticas básicas>1-Sample t
Data set
CEREALBX.MPJ

Prueba de hipótesis
¿Qué es una prueba de hipótesis?
Una prueba de hipótesis usa datos de ejemplo para probar una hipótesis acerca de la población de cual el ejemplo es tomado. El one-sample t-test es uno de los muchos procedimientos disponibles para la prueba de una hipótesis en MINITAB.
Por ejemplo, suponga que quiere probar la medida de las ruedas del pistón es igual a la longitud deseada del objetivo. Usted medirá un numero de ruedas y usara la medida de esas ruedas de ejemplo para estimar la medida de la rueda de la población. Este es un ejemplo de stastistical inference, usando información acerca de un ejemplo para hacer una inferencia acerca de una población.
¿Cuándo usar una prueba de hipótesis?
Usa una prueba de hipótesis cuando tengas datos de ejemplo y quieras hacer inferencias acerca de una o más poblaciones.
¿Por qué usar una prueba de hipótesis?
La prueba de hipótesis puede ayudar a contestar preguntas como:
Por ejemplo,
Probando la hipótesis nula
Necesitas determinar si la media de un proceso de empaque difiere significativamente del peso correcto que es 365 gramos. En Términos estadísticos, el proceso de la media es también llamado la población de la media.
Hipótesis de estadística
Hay 2 posibilidades, µ es igual a 365 o no lo es. Estas alternativas pueden ser usadas como 2 hipótesis:
Por que no puedes medir cada caja en la población, nunca podrás saber con exactitud cual hipótesis es correcta. Sin embargo una prueba de hipótesis apropiada pueda ayudarte a hacer un cálculo formal. Para estos datos la prueba apropiada es la one-sample t-test
1- Sample t
1.- Abre el proyecto CEREALBX.MPJ.
2.- Escoge STAT > Basic Statistics > 1-Sample t.
3.- Complete el recuadro como se indica a continuación:
4.- Click OK.

Interpretando tus resultados
La lógica de la prueba de hipótesis
Todas las pruebas de hipótesis siguen los mismos pasos:
Por ejemplo, los resultados de t-test indican que la muestra es 366.704. De esta manera el examen contestara la pregunta, "Si µ es igual a 365, como obtendrás una muestra de 366.704(o mayor). La respuesta es dada como una probabilidad que vale (P), que para esta prueba es igual a 0.143.
Tomando una decisión
Para tomar una decisión, necesitas Escoger el nivel de importancia, α (alpha), antes de la prueba:
Un valor típico para α es 0.05, pero valores mayores o menores puedes ser escogidos dependiendo de la exactitud requerida para la prueba. Asumiendo que escojas un α-Nivel de 0.05 para los datos del peso de la caja no tendrαs suficiente evidencia para rechazar H0. P(0.143) es mayor que α.
One-Sample T: Boxweigh
Test of mu = 365 vs not = 365
Variable N Mean StDev SE Mean 95% CI T P
BoxWeigh 6 366.704 2.403 0.981 (364.183, 369.226) 1.74 0.143
Consideraciones finales
Conclusiones prácticas
Basado en tus datos de muestra, no puedes rechazar la hipótesis nula al 0.05 nivel α. No hay suficiente evidencia para sugerir que los pesos completos son diferentes a .365 gramos.
Consideraciones de estadística
Cuando es conducida una prueba de hipótesis, siempre empiezas con dos hipótesis contrarias:
La hipótesis nula(H0):
La hipótesis alternativa(H1):
Cada prueba de hipótesis esta basada en una o más suposiciones acerca de los datos que están analizando. Si esas suposiciones no son conocidas, los resultados puede que no sean precisos. Las suposiciones de cada prueba serán exploradas cuando cada prueba sea discutida.
El Power de una prueba de estadística es la probabilidad de rechazar correctamente la hipótesis nula. La tabla de abajo muestra los 4 posibles resultados de la prueba de hipótesis.
Hipótesis nula
Decisión Verdadero Falso
|
Decisión correcta p=1-α |
Error tipo II p = B |
|
Error tipo I p = α |
Decisión correcta p = 1- α (Power) |
Falla al rechazar
Rechazar
El nivel α debe ser escogido antes de conducir la prueba:
Intervalos de confianza
Ejemplo 2 peso de la caja de cereal
Problema
Recuerde que esta tratando de confirmar que el embalaje del cereal esté en un objetivo. El objetivo del peso es de 365 gramos y necesitas asegurarte que el proceso de la media esté dentro de 2.5 gramos que es el objetivo.
Recolección de datos
Seis cajas de cereal fueron elegidas al azar y pesadas.
Herramientas
Stat > Basic statistics > 1-sample t
Set de Datos
CEREALBX.MPJ

Intervalos de confianza
¿Que es un intervalo de confianza?
Un intervalo de confianza es un rango de posibles valores para un perímetro de una población (tal como µ) que esta basada en un dato de muestra. Por ejemplo, muy seguido usaras una muestra para calcular µ. Un intervalo confidencial te dirá que tan lejos esperes ese cálculo.
¿Cuándo usar el intervalo de confianza?
Usa un intervalo de confianza para hacer inferencias de una o más poblaciones de muestra de datos.
¿Por que usar intervalos de confianza?
Los intervalos de confianza te pueden ayudar a contestar muchas de las mismas preguntas de la prueba de hipótesis:
Por ejemplo,
Usando el intervalo de confianza
En el ejemplo anterior, usamos una prueba de hipótesis para determinar si la media de tu proceso fuera diferente al valor del objetivo. También puedes usar un intervalo de confianza para evaluar ésta diferencia.
Esta Sesión window resulta para 1-sample t incluye valores para los fines mayor y menores del 95% del intervalo de confianza. Obtiene una grafica representativa del intervalo al seleccionar Boxplot en Graphs subdialog box.
1-Sample t
1.- Escoge Stat > Basic Statistics > 1-Sample t, or press Ctrl + E.
2.- Click Graphs
3.- Completa el recuadro como se indica a continuación:

4.- Clik OK en cada recuadro.
Interpretando tus resultados
Intervalo de confianza
El intervalo de confianza es un rango de posibles valores para µ. Esta mostrado gráficamente como una línea roja y dos escuadras cuadradas debajo del boxplot.
Es un intervalo de confianza de 95% por que tomamos 100 muestras de la misma población, los intervalos de 95 de las muestras incluirá a µ. Por lo tanto para cualquier ejemplo que pueda ser 95% seguro que la µ está dentro del intervalo de confianza.
Prueba de hipótesis
El punto rojo de la X representa la media de la muestra y el punto azul de H0 representa la prueba de la media (365). Puedes usar el intervalo de confianza para probar la hipótesis nula:
Por que H0 cae adentro del intervalo de confianza no puedes rechazar la hipótesis nula. No hay suficiente evidencia para concluir que µ no es 365 gramos, en el 0.05 nivel significante.

Consideraciones finales
Conclusiones prácticas
El intervalo de confianza de 95% (como el t-test) no provee suficiente evidencia para rechazar la hipótesis nula que la población de la media para el peso de las cajas de cereal sea de 365 gramos.
Consideraciones de Estadística
El intervalo de confianza provee un posible rango para
valores de µ(u otros parámetros de población).
En muchos casos, no puedes conducir un prueba de hipótesis usando un intervalo de confianza. Por ejemplo, si el valor de la prueba no es entre un 95% de un intervalo de confianza, puedes rechazar H0 en el nivel α 0.05. Sin embargo si tu estructuras un 99% de intervalo de confianza y no tiene una prueba de la media, puedes rechazar H0 en el nivel α 0.01.
Intervalos de confianza
Ejemplo 3 Entendiendo los intervalos de confianza
Problema
Este ejemplo Explora el concepto de las intervalos de confianza. Simularas la recolección de muestras al azar para una población normal usando MINITAB’s generador de números al azar.
Recolección de Datos
Tu debes generar 10 columnas de datos al azar
Herramientas
Calc > Random data > Normal.
Stat > basic Statistics > Display Descriptive Statistics.
Data set
Ninguno
Generando datos normales al azar
Usando un generado de datos al azar, puedes simular la recolección de datos al azar de una población con una media dada. (Esto es una situación en la cual de hecho puedes saber el valor de µ.)
Usando el generador de datos al azar para simular la colección de 10 muestras de una población con una media(µ) de 10 y de una desviación estándar de 1. Se generan 20 observaciones para cada muestra.
Normal
1. - Escoge File > New
2. - Selecciona MINITAB Project.
3. - Click OK.
4. - Escoge Calc > Random Data > Normal.
5.- Completa el recuadro como se indica a continuación:

6.- Click OK en cada recuadro.
Calculando intervalos de Confianza del 90%
Usa Display Descriptive Statistics para calcular intervalos de confianza del 90% para cada muestra. Por definición, 9 de cada 10 intervalos deben contiener la µ. Desde que sabes que la µ representa muestras que son iguales a 10, puedes verificar esto directamente.
En contraste a los intervalos de confianza del 95%, los de 90% son más angostos( esto es que incluyen menos valores). Porque estos contiene menos valores, es menos probable que contengan la µ.
Para probar la hipótesis nula que la µ no es igual a un valor dado, un intervalo de confianza de 90% corresponde a un .10. nivel de α.
Display Descriptive Statistics
1.- Escoge Stat > Basic Statistics > Graphical Summary.
2.- En Variables, enter C1-C10.
3.- Completa el Confidence level como se muestra:

4.- Clik Ok.
Interpretando tus resultados
90% de Intervalo de confianza para Mu (µ)
Toma un momento para repasar los intervalos de confianza para cada uno de tus muestras, Las opciones seria que uno de tus intervalos no va a contener µ(10).
Es posible que todos tus intervalos contengan µ. También es posible que ninguno lo tenga (aunque es extremadamente inusual). Sin embargo, si repites el ejercicio de la generación de muestras al azar y calculando el intervalo de confianza del 90%, encontraras ese aproximado 90% de los intervalos que contiene µ.
Resultados hipotéticos
Un ejemplo de un intervalo de confianza de 90% que no contenga µ es proveído por derecho. El intervalo se extiende de 10.0275 a 10.7894.
Date cuenta que este ejemplo en particular te llevará a un rechazo incorrecto de la hipótesis nula que µ es igual a 10 (asumiendo que escojas el nivel α de 0.10).
Intervalo de confianza de 90% para sigma
Date cuanta que la suma gráfica también incluye a un intervalo de confianza de 90% para σ (la desviación estándar de la población). El intervalo tiene en rango de 0.7882 a 1.3501. Si repites este procedimiento para un numero largo de muestras, cerca de 9 de 10 intervalos incluirá el valor para σ.
Estadísticas Descriptivas

Consideraciones finales
Conclusiones prácticas
Es probable que 1 de 10 intervalos de confianza de 90% que calcules no contengan µ. Si este procedimiento fuera repetido para un número largo de muestras, cada 10% de todos los intervalos confidenciales de 90% no tendrán µ.
Consideraciones de estadística
Este intervalo de confianza provee un rango de valores para µ(ó los parámetros de la población).
En promedio, el 90% de los intervalos de confianza de 90% calculados para muestras al azar tomado de una distribución normal de poblaciones incluirá a µ.
Power
Ejemplo 4 Evaluando el Power
Ejercicio
No estas seguro que confías en el resultado del análisis del llenado del peso (página 1-6). Vas a conducir el análisis del Power para determinar si recolectaste suficientes datos
Quieres asegurarte que el llenado de las cajas no difiera del objetivo del peso de 365 gramos no más de 2.5 gramos.
Recolección de datos
Vas a basar el análisis del Power en los resultados del t-test del ejemplo 1.
Herramientas
Stat> Power and Sample Size> 1-Sample t
Data set
Ninguno
Análisis del Power
¿Que es un análisis del Power?
Power es la habilidad de una prueba para detectar un efecto cuando existe. Cuando conduces una prueba de hipótesis, hay 4 posibles resultados:
Hipótesis nula
|
Decisión correcta p =1-α |
Error tipo II p = β |
|
Error tipo I p = α |
Decisión correcta p = 1- α (Power) |
Decisión Verdadero Falso
Falla al rechazar
Rechazar
El Power de la prueba es la probabilidad que rechazara la hipótesis nula correctamente, dado que la hipótesis nula es falsa. Puedes usar un análisis Power para determinar cuanto poder tiene esta prueba, o ayudar a designar una nueva prueba para que tenga el poder adecuado.
Cuando usar un análisis del Power
Usa un análisis del Power cuando estas diseñando un experimento o después de conducir una hipótesis nula. No se requieren datos. Necesitaras estimar σ (excepto por las pruebas de proporciσn).
¿Por qué usar un análisis del Power?
El análisis del Power te puede ayudar a responder preguntas como:
Por ejemplo,
Determinando el Power
Tu meta es determinar que tan ciertos son los resultados del análisis del llenado de las cajas de cereal (pagina1-6)
Valores
Si especificas valores para cualquiera de los 2 parámetros de la prueba, MINITAB calculará el parámetro restante:
Sigma
Porque el poder de una prueba es parcialmente determinada por la variabilidad en los datos, debes proveer un estimado para σ . Usa un estimado del historial o la desviaciσn estándar de la muestra.
1.- Escoge Stat > Power and Sample Size > 1-Sample t.
2.- Completa el recuadro como se indica a continuación:

3.- Click OK.
Interpretando tus resultados
Con 6 observaciones, una desviación estándar de 2.043 y un α de 0.05, el Power solo es de .5376. Esto significa que µ esta fuera del objetivo por 2.5 gramos, solo tienes un 53.76% de oportunidad para detectarlo.
De otra manera, hay un 46.24% de probabilidad que falles al rechazar H0 e incorrectamente concluye que el proceso está en el objetivo.
¿Qué sigue?
De manera que incrementes tu probabilidad de detectar un cambio si existe, es incrementar el tamaño de la muestra. Determinar él numero de observaciones requeridas para lograr el Power adecuado.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403

Determinando el Power
Con 6 observaciones el Power de tu prueba fue solo de 0.5376. Para tener mejores posibilidades de detectar un efecto si es que existe, deberás incrementar el poder de tu prueba, que por lo menos sea de 0.80 (como regla general).
Calcular el tamaño de la muestra requerida para llegar los niveles de Power de 0.80, 0.85, 0.95, y 0.95.
1-Sample t
1.- Escoge Stat > Power and Sample Size > 1-Sample t.
2.- Completa el recuadro como se indica a continuación:

3.- Clic OK.
Interpretando tus resultados
Para tener un Power de al menos 0.80 (objetivo del Power) para detectar una diferencia de 2.5 gramos al nivel α de 0.05, necesitaras una muestra de tamaρo 10.
Porque el tamaño de las muestras debe ser siempre un numero entero. El Power actual de la prueba con 10 observaciones (0.8327) es escasamente mayor que el objetivo Power.
Observaciones adicionales que dan mas Power:
Al duplicar el tamaño de la muestra de 6 a 12 cajas, incrementas tus posibilidades de detectar una diferencia de 2.5 gramos (sí es que existe) de 53.76% a 90.58%.
Tal ves no quieran incrementar tu Power demasiado. Si tu Power es demasiado alto, podrías empezar a detectar cambios que son demasiado pequeños para ser parcialmente importantes.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403

Power
Ejemplo 5 incrementando Power
Ejercicio
El resultado del análisis de tu Power sugiere que necesitas una muestra más grande para evaluar tu proceso. Con solo 6 observaciones, había muy poco Power para detectar un diferencia de 2.5 gramos
Recolección de datos
12 cajas de cereal son recolectadas al azar y pesadas
Herramientas
Stat> Basic statistic> 1-sample t
Data set
CEREALBX.MPJ
Nombre Tipo de dato Tipo de variable
BoxWeigh Numérico Respuesta
Probando la hipótesis nula
Analiza la nueva muestra para determinar si el proceso de la media es diferente a 365 gramos.
1-Sample t
1.- Abre el proyecto CEREALBX.MPJ.
2.- Escoge Stat> Basic Statistics> 1-Sample t
3.- Completa el recuadro como se indica a continuación:

4.- Haz clic en Graphs.
5.- Checa Boxplot of data.
6.- Click OK en cada recuadro.
Interpretando tus resultados
El t-test indica que la diferencia entre el proceso de la media y el objetivo de 365 gramos es significante en el nivel α 0.05
Aparece que las cajas de cereal están siendo sobre llenadas. Se deben tomar acciones correctivas para ajustar el proceso.
One-Sample T: MoreObs
Test of mu = 365 vs not = 365
Variable N Mean StDev SE Mean 95% CI T P
MoreObs 12 366.636 2.060 0.595 (365.327, 367.945) 2.75 0.019
Interpretando tus resultados
El boxplot ilustra lo que encontró la prueba:
Conclusión
La diferencia entre el proceso de la media y el valor del objetivo de 365 gramos es significante en el nivel α es de 0.05.

Consideraciones finales
Conclusiones prácticas
Es probable que tu primera prueba del llenado de las cajas de cereal no sea significante porque tu Power era demasiado bajo. Basado en el numero de observaciones (6), la diferencia que quieres detectar (2.5), y la variabilidad en los datos, la prueba tuvo un Power de solo 0.5376.
Usando una muestra grande te da mas Power, habilitándote para detectar la diferencia.
Consideraciones estadísticas
Para asegurar que tu prueba tenga suficiente Power, es una buena idea el conducir un análisis power para recolectar datos.
Las maneras de incrementar el Power de una prueba incluye:
Mayor Power significa una mayor probabilidad de detectar los errores. Sin embargo también incrementa la probabilidad de detectar errores pequeños que puede que no sean de interés. El proceso del conocimiento ayuda a determinar el nivel optimo del Power en una prueba.
Ejercicio 5.1 Detectando posibilidades en el diámetro de un balero
Ejercicio
Una parte del Balero manufacturado está fuera de especificaciones 0.05 cm de lo correcto. Un cambio de 0.01cm es considerado lo suficientemente importante para permitir el ajuste al equipo.
La desviación estándar de los diámetros es casi siempre de 0.004 cm.
Recolección de datos
Ninguno
Instrucciones
Data set
Ninguno
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05

Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05
Sample
Size Power Difference
5 0.9 0.0982944
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05
Sample
Size Power Difference
10 0.9 0.0577282
PRUEBA T Y PRUEBAS DE PROPORCIÓN
Objetivos
Contenidos

One-Sample t-Test
Ejemplo 1 Problema del Gran Queso
Ejercicio
Tu compañía, El Gran Queso, Inc., sospecha que uno de tus proveedores de leche le esta añadiendo agua a su leche para incrementar sus beneficios. Añadir agua a la leche incrementa su punto de congelación, que normalmente es de –0.545º C.
Recolección de datos
El punto de congelación es medido para 10 muestras al azar de la leche del proveedor.
Herramientas
Stat> Basic Statistics> Normality Test.
Stat> Basic Statistics> 1-Sample t.
Data set
CHEESE.MPJ


One-Sample T: FrzTemp
Variable N Mean StDev SE Mean 95% CI
FrzTemp 10 -0.539368 0.007799 0.002466 (-0.544947, -0.533790)
One-sample t-test
¿Qué es un One-Sample t-test?
Un One-Sample t-test te ayuda a determinar si µ (la población de la media) es igual a un valor d una hipótesis (la prueba de la media).
La prueba utiliza desviaciones estándar de una muestra para estimar σ (la desviaciσn estándar de la población). Si la diferencia entre la muestra de la media y la prueba de la media es grande relativamente a la variabilidad en la muestra, entonces µ es improbable que sea igual a la prueba de la media.
¿Cuándo usar un one-sample t-test?
Usa un one-sample t-test cuando tienes datos continuos de una sola muestra al azar.
La prueba asume que la población esta distribuida normalmente. Sin embargo es muy justo a las violaciones de esta suposición, proveídas las observaciones son recolectadas al azar y los datos son continuos y racionalmente simétricos. (ver Box, Hunter & Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
¿Por qué usar un one-sample t-test?
Un one-sample t-test te puede ayudar a responder preguntas tales como:
Por ejemplo,
Guías al Escoger las Herramientas de Estadística
Tipo de Variable de Respuesta

Probando la suposición de una normalidad
La prueba de Estadística apropiada para los datos de la temperatura congelante es un one-sample t-test. Esta prueba asume que la población esta normalmente distribuida.
Usa una prueba de normalidad para determinar si la suposición de la normalidad es valida para esos datos.
Prueba de normalidad

Interpretando tus resultados
Usa el normal probability plot para verificar que tus datos no se desvíen significativamente de una distribución normal.
Anderson-Darling normality test
Un p-value de Anderson-Darlin Test (0.0352) accesa a la probabilidad que los datos son de una población con distribución normal. Usando en α de 0.05, no hay suficiente evidencia para sugerir que los datos no son de una población normal.
Conclusión
Basado en el argumento y en la prueba es razonable asumir que tus datos no se desvían substancialmente de una distribución normal. Puedes proceder con el t-test.

Conduciendo el 1-sample t-test
Conducir un 1-sample t-test para determinar si la temperatura congelante de la leche del proveedor es mayor a –0.545º C.
No hay razón para sospechar que el proveedor quitara el agua de la leche. Así, no necesitas probar si la temperatura congelante es menor que –0.545º C. En esta situación, puedes usar una prueba 1-tailed (en la cual H1 es direccional):
La ventaja de la prueba 1-tailed es que te da mas Power para detectar la diferencia especificada. Sin embargo, una prueba 1-tailed no puede detectar una diferencia en la dirección contraria que especifica en H1. De esta manera si hay diferencias en ambas direcciones son de interés, deberás usar una 2 tailed test.
1-Sample t

Interpretando tus resultados
Usa un nivel α de 0.05 para la prueba.
T
El t-statistic (2.28) es calculado de esta manera:
T = (muestra de la media – prueba de la media) / SE media
Donde SE media es el error estándar de la media (una medida de variabilidad). Como el valor de t se incremente, el p-value se hace mas pequeño.
P
El p-value es 0.024. Porque este valor es menor que α(0.05), puedes rechazar la hipσtesis nula. El resultado sugiere que el agua o cualquier otro liquido halla sido añadido a la leche.
Power
Cuando sea apropiado, una prueba 1-tailed es mas poderosa que una prueba 2-tailed. Por ejemplo, una prueba 2-tailed (H1 : µ es diferente a –0.545) regresa a p-value de 0.048, que es mayor que 0.024.
One-Sample T: FrzTemp
Test of mu = -0.545 vs > -0.545

Consideraciones finales
Conclusiones prácticas
El 1-tailed, 1-sample t-test sugiere que la temperatura congelante de la leche del proveedor es mayor a la que debe ser, indicando que se le pudo haber añadido agua. Esta es una acusación muy seria para el proveedor. Podría ser mejor evaluar que tan cierto es antes de tomar una decisión.
Con un nivel α de 0.05, las probabilidades de haber concluido que se le ha aρadido agua cuando no es así son de 5%. Para estar seguro que no rechaces H0 incorrectamente, deberás Escoger valores menores para α, tales como 0.01 o hasta 0.001. Con un α de 0.01, no concluirαs que se le allá añadido agua a la leche (p = 0.024).
Consideraciones estadísticas
Cuando uses una 1-sample t-test:
Debe de ser notado que los procedimientos del t-test son muy justas a las violaciones de las suposiciones de normalidad, dadas esas observaciones son recolectadas al azar y los datos son continuos y racionalmente simétricos. (ver Box, Hunter & Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
Una prueba 1-tailed es mas poderosa que una prueba 2-tailed. A menos que la diferencia no este en la dirección esperada, Por ejemplo una prueba 1-tailed con una hipótesis alternativa, H1 : µ > -0.545 nunca será capaz de detectar la diferencia si alguien disminuye la temperatura congelante de la leche.
Ejercicio 1.1 Diámetro de los Valeros de Bola
Ejercicio
Tu compañía produce Valeros de bola y necesitas verificar que el tamaño del Balero que esté en las especificaciones. La especificación del diámetro para los Valeros es de 0.5cm.
Usa un nivel α de 0.05 para todas las pruebas.
Recolección de datos
10 Valeros son escogidos al azar y medidos.
Instrucciones
Data set
BEARINGS.MPJ


Two-Sample t-Test
Ejemplo 2 Resistencia plástica
Ejercicio
Tu compañía hace estuches de plástico para calculadoras. Necesitas comparar muestras de plásticos de 2 proveedores en cuanto a su resistencia. El proveedor A dice tenar el plástico mas fuerte, pero cuesta mas que del proveedor B.
Recolección de datos
Pellets seleccionadas al azar de un grupo de plástico son prensadas en agua hasta ser barquillas del mismo grueso. La resistencia para romperlos( en psi, libra por pulgada cuadrada) es tomada para cada barquilla.
Herramientas
Stat> Basic Statistics> Normality Test
Stat> Basic Statistics> 2 variances
Stat> Basic Statistics> 2-sample t
Set de Datos
PLASTIC.MPJ

Two-sample t-test
¿Qué es un two-sample t-test?
Una two-sample t-test te ayuda a determinar si 2 poblaciones de la media son iguales.
La prueba usa las desviaciones estándar de la muestra para estimar σ para cada población. Si la diferencia entre la muestra de la media es grande relativamente para la variabilidad estimada entre las poblaciones, entonces la media de la población son improbables a ser iguales.
Un two-sample t-test también te puede ayudar a evaluar si la media de 2 poblaciones es diferente por una cantidad especifica.
¿Cuándo usar una prueba two-sample t-test?
Usa una prueba two-sample t-test cuando tengas datos continuos de 2 muestras al azar independiente. Las muestras son independientes si las observaciones de un one.sample no están relacionadas a las observaciones de la otra muestra. Por ejemplo, 2 medidas son tomadas por un mismo operador no son independientes.
La prueba también asume que tus datos vienen de una población normalmente distribuida. Sin embargo es muy justo hacia las violaciones de esta suposición proveídas las observaciones son recolectadas al azar y los datos son continuos y razonablemente simétricos. (ver Box, Hunter & Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
¿Por que usar una prueba two-sample t-test?
Un two-sample t-test te puede ayudar a contestar preguntas tales como:
Por ejemplo,
Probando las suposiciones de la normalidad
La prueba de estadística mas apropiada para los datos del proveedor es la two-sample t-test. Esta prueba asume que los datos son de poblaciones distribuidas normalmente.
Usa la prueba de normalidad para determinar si la suposición de la normalidad es valida para estos datos.
Prueba de normalidad
Interpretando tus resultados
Usa la normal probability plot para verificar que tus datos no se desvíen significativamente de una distribución normal.
El plot para el SupllrA indica que la distribución de la muestra es razonablemente normal; todos los puntos están cerca de la línea.
El plot para el SupplrB sin embargo aparentemente muestra desviación de la normalidad.
Anderson-Darling Normality test
La desviación de la normalidad observada de SupplrB no es significante en un nivel α de 0.05. Ambas p-values(0.664 para SupplrA, y 0.083 para SupplrB) son mayor que 0.05.
Conclusión
Basado en el plot y las pruebas, es racional asumir que tus datos no se desvían substancialmente de una distribución normal. La suposición de una normalidad es relativamente satisfecha, así que puedes proceder con el t-test.


Comparando las variaciones
Antes de conducir el t-test, debes evaluar las variaciones de las 2 distribuciones para ver si difieren. Hay dos razones para esto:
Para asegurar que encontraste una diferencia entre 2 variaciones si es que existe una. Debes usar un nivel α de 0.10 para esta prueba en lugar de la normal de 0.05. Esto incrementara el power de la prueba.

Interpretando tus resultados
Intervalos de confianza
Los intervalos de confianza son útiles para comparar σ de las 2 poblaciones. Sin embargo, tu decisión acerca de sí las 2 variaciones son iguales será basadas en una apropiada prueba de variación.
Pruebas de variación
Los resultados incluyen 2 pruebas de variación separadas. El uso de la prueba depende de tus datos.
Los datos dados son racionalmente normales, así que puedes usar el F-test. Sin embargo, porque el p-value de la prueba de normalidad del proveedor B fue muy baja (0.083), hay que revisar los resultados de la prueba de Levene`s también.
Conclusión
Los p-values para ambos F-test (0.067) y la Levene`s (0.052) son menos que α (0.10), asν que puedes rechazar la hipótesis nula que las variaciones son iguales. Los resultados sugieren que las variaciones del plástico del proveedor A son más pequeños que las del proveedor B.

F-Test (normal distribution)
Test statistic = 0.28, p-value = 0.067
Levene's Test(any continuous distribution)
Test statistic = 4.27, p-value = 0.052
Test for Equal Variances for SupplrA, SupplrB
Interpretando tus resultados
Los mismos intervalos de confianza y las pruebas estadísticas incluidas en la ventana de resultados de la grafica también son proveídas en la ventana de sesión.
Test for Equal Variances: SupplrA, SupplrB
95% Bonferroni confidence intervals for standard deviations

F-Test (normal distribution)
Test statistic = 0.28, p-value = 0.067
Levene's Test(any continuous distribution)
Test statistic = 4.27, p-value = 0.052
Conduciendo el Two-Sample t-test
Por que los datos son razonablemente normales, tu puedes usar 2 Sample t -to test ya sea la resistencia del plástico de los dos diferentes proveedores.
La prueba de Hipótesis es:
Elabora dotplots y boxplots para ayudar a visualizar los datos.
Asumir discrepancias desiguales
Si asumes que las varianzas de las dos poblaciones son iguales, tu t-test será más confiable. Sin embargo, si asumes que la varianza es igual cuando no lo son, los resultados de tu t-test serán falsos. Así, si hay alguna duda, es mejor no asumir que son iguales.
Porque la variance test indica que la población de la varianza es diferente, no asuma que las varianzas son iguales.
2-Sample t

Interpretando los Resultados
Las gráficas ilustran dos puntos :


Interpretando tus Resultados
Two-Sample T-Test and CI: SupplrA, SupplrB
Two-Sample T-Test and CISupplrA, SupplrB

Individual Value Plot of SupplrA, SupplrB
Boxplot of SupplrA, SupplrB
El promedio del punto de quiebre del plástico (media) y dos medidas de la variabilidad—la desviación estándar (StDev) y el error estándar de la media (SE Mean)—se presentan en cada Proveedor.
Intervalos de Confianza
La diferencia entre la muestra de la media (7.484) se utiliza para estimar la diferencia entre la población de la media (mu SupplrA—mu SupplrB). El intervalo de confianza por la diferencia se basa en esta estimación y la variabilidad de las muestras.
Puede ser 95% confiable que la diferencia entre la población de la media es entre 6.687 y 8.281 psi.
T-value y p-value
El T-value para la prueba es 19.82, lo cual se asocia con un p-value menor que 0.0005 (lo cual se redondea a 0.000)
Así, puedes rechazar la Hipótesis nula en 0.05 α-level, donde concluye que las resistencias son diferentes.
Consideraciones finales
Conclusiones prácticas
El proveedor de plástico A es significativamente resistente y menos variable que el proveedor B. Sin embargo, observamos que el Proveedor A también nos cobra mas por el producto. Ahora tienes que decidir si la diferencia entre los Proveedores es significativa.
Se cuenta con el 95% de confianza de la verdadera diferencia entre el proveedor 6.687 y 8.281 psi. Tu decides pagar o no un precio alto por una pequeña diferencia en la resistencia.
Consideraciones estadísticas
Cuando utilizas two-sample t-test :
Debe acentuarse que el procedimiento para la t-test es lo suficientemente veraz a las violaciones de la Asunción de la normalidad, proveídas estas observaciones los datos son recolectados al azar, son continuos, unimodal y razonablemente sistemáticos. (ver Box, Hunter & Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
Manuak Minitabzafra | 2007-11-23 07:21:52
Muy completo entendi muchas cosas que no en clase, gracias.
Trabajos relacionados
Ver mas trabajos de Software |
|
Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.