Indice
1.
Introducción
2. Desarrollo
3. Diseño de
experimento
4. Series
Cronológicas
5. Conclusiones
6.
Bibliografía
Podemos decir que en estos tiempos en el entorno
empresarial cubano se hace muy poco uso y quizás nulo de
las técnicas y
métodos estadísticos que resultan de vital
importancia en la solución de disímiles problemas
que se dan a diario en nuestras empresas,
mientras el mundo de la informática se desarrolla cada vez
más y son muchos los programas que han
surgido entre los que se encuentran varios de análisis estadísticos.
Nuestro trabajo se desarrolló con el fin de conocer la
situación del peso de las gallinas pertenecientes a la
Unidad Económica Básica "Frank País" de Moa
en función
de la cantidad de pienzo y agua que
consumen, así como la influencia de los alimentos que
ingerimos a diario y los distintos horarios del día en
los valores de
presión
arterial.
Regresión Lineal Simple Y Múltiple
Problema 1.
En la Unidad Económica Básica "Frank País"
de Moa se desea conocer el peso promedio que alcanzarán
las gallinas en el próximo trimestre. A final de cada
trimestre estas gallinas son distribuidas a la población y se inicia nuevamente el ciclo
de crecimiento.
Se conoce la cantidad de pienzo y agua consumida por estas juega
un papel
determinante en el peso de las mismas.
En el actual trimestre se realizó un estudio donde se
obtuvieron los datos para 35
gallinas. (Ver anexo 1). (Los datos
recopilados no son reales).
Análisis de la Regresión Simple.
Variables:
- Variable dependiente: Y. Peso de las gallinas en
libras (lb.). - Variable independiente: X. Cantidad de pienzo
consumida en kilogramos (Kg.)
Dócima de la pendiente.
Planteamiento de las hipótesis:
Si se acepta H0 : la variable no es
significativa.(No existe relación lineal entre Y y X
).
Si se rechaza H0 la variable es significativa
(Existe relación lineal entre Y y X ).
F. variación | S.C | G.L | C.M | F | P |
Regresión | 153,198 | 1 | 153,198 | 90,58 | 0,0000 |
Residuos | 55,815 | 33 | 1,69136 | ||
Total | 209,013 | 34 |
El coeficiente de correlación = 0,856131(las
variables se encuentran relacionadas linealmente en un
85,6131%).
R2 = 73,2959 (Se ha eliminado un 73,2959 % de los
errores con la regresión).
El error estándar = 1,30052
Como el valor de
probabilidad
es 0,0000<0,05 se RH0 lo que quiere decir que el
pienzo es determinante en el peso de las gallinas.
La ecuación determinada para esta
estimación es:
Dócima de la falta de ajuste.
(El
modelo lineal
proporciona un buen ajuste).
(El
modelo lineal no proporciona un buen ajuste).
El modelo que mejor ajusta es el Square
Root-X
F. variación | S.C | G.L | C.M | F | P |
F.A | 36,1583 | 24 | 1,5066 | 0,69 | 0,7771 |
E.P | 19,6567 | 9 | 2,18407 |
Como el valor de probabilidad 0,7771>0,10 se
AH0 por lo que el modelo proporciona un buen
ajuste.
Análisis de la
Regresión múltiple:
Variables:
- Variable dependiente: Y. Peso de las gallinas en
libras (lb.). - Variable independiente: X1 .cantidad de
pienzo consumida en kilogramos (Kg.). - Variable independiente: X2 .cantidad de
agua consumida en litros (L.).
Dócima de la pendiente
F. variación | S.C | G.L | C.M | F | P |
Regresión | 177,586 | 2 | 88,7929 | 90,41 | 0,0000 |
Residuos | 31,4272 | 32 | 0,982099 | ||
Total | 209,013 | 34 |
R2 = 84,964 %
R2 ajustada =84,0243 %
Error estándar =0,991009
Error medio absoluto = 0,742858
Estadístico de Durbin Watson = 1,76054.
Como la probabilidad es menor que 0,05 entonces se
RH0, lo que indica que algunas de estas variables son
útiles para hacer estimaciones del peso de las gallinas
(Y).
Método paso a paso.(paso alante )
Con este método
podemos determinar cuáles variables del modelo son
significativas.
Estadígrafo para entrar = 4,14911
Estadígrafo para remover = 4,14911
En el paso número cero tenemos cero variables en el modelo
con 34 G.L para el error y un coeficiente de determinación
de 0,00 %.
En el paso número uno adicionamos la variable
X1 con un estadígrafo para entrar de 87,4949 y
como este valor es mayor que 4,14911 esta variable queda en el
modelo con 33 G.L para el error y un coeficiente de
determinación de 72,61 %.
En el paso número dos adicionamos la variable
X2 con un estadígrafo para entrar de 26,2859 y
como este valor es mayor que 4,14911 esta variable queda en el
modelo con 32 G.L para el error y un coeficiente de
determinación de 84,96 %.
Como podemos observar, tanto el pienzo como el agua que
consumen las gallinas son significativas en el peso de las
mismas.
El modelo tiene la siguiente ecuación:
Verificación
de supuestos:
Normalidad:
Si aproximadamente el 95 % de los residuos están en el
intervalo de ,
entonces no hay razón para rechazar el supuesto de
normalidad.
El intervalo es (-1,982018; 1,982018)
Se cumple el supuesto de normalidad ya que el 94,29 % de los
errores aleatorios se encuentran dentro del intervalo
indicado.
Homocedasticidad:
(Hay
Homocedasticidad)
Algún difiere (No hay Homocedasticidad)
n =35
c = 3
p =3
S.C Residual G.1 = 22, 2067
S.C Residual G.2 = 24,306
F = 1, 0945345
1,0945345<2,57693
Se acepta H0 por lo que se cumple el supuesto
de Homocedasticidad.
No autocorrelación:
(No hay
autocorrelación).
(Hay
autocorrelación)
n =35
dl =1,343
dv =1,584
RH0 AH0 RH0
0 1,343 1,584 2,416 2,657 4
d =1,76054. Se encuentra en la región de aceptación
por lo que se cumple este supuesto.
No multicolinialidad:
(No hay
multicolinialidad)
(Si hay
multicolinialidad)
R.C:
R.C:
>
4,13927
Se RH0 por lo no se cumple el supuesto de no
multicolinialidad.
Haciendo un pronóstico del peso que debería
alcanzar una gallina para un consumo de
pienzo de 10,6 Kg. y 9 L de agua obtuvimos un valor de 10,5669
con un error estándar 1,04204.
3. Diseño
de experimento
Problema 2.
En un estudio realizado por el ministerio de salud
pública se obtuvo que la mayor parte de la
población cubana que padece de Hipertensión
Arterial se concentra en las provincias orientales. Según
criterios médicos una de las causas fundamentales de tal
enfermedad es el régimen alimenticio que llevan las
personas. Se pudo observar además que los alimentos que se
consumen no provocan el mismo efecto en la presión para
los distintos horarios del día.
Es interés
de todos conocer cuáles son los alimento que podemos
consumir en mayor o menor medida, los horarios en que son menores
y mayores los valores de
tensión arterial, así como la mejor y la peor
combinación de estos factores.
Para darle respuestas a estas interrogantes se tomaron muestras
de valores de presión por 6 días en diferentes
horarios del día de una persona. (Ver
anexo 2).
Análisis de varianza para datos tipo
III
F. variación | S.C | G.L | C.M | F | P |
P. Efectos | |||||
A: Factor A. | 1733,33 | 2 | 866,667 | 39,00 | 0,0024 |
B: Factor H. | 1200,0 | 2 | 600 | 27,00 | 0,0048 |
C: Réplic. | 5,55556 | 1 | 5,55556 | 0,25 | 0,6433 |
Interacción | |||||
AB | 266,667 | 4 | 66,6667 | 3,00 | 0,1562 |
AC | 311,111 | 2 | 155,556 | 7,00 | 0,0494 |
BC | 44,4444 | 2 | 22,2222 | 1,00 | 0,4444 |
Residuos | 88,8889 | 4 | 22,2222 | ||
Total | 3650,0 | 17 |
Analizando el P-value del factor A. se obtuvo que para
se rechaza
H0 lo que significa que hay diferencias significativas
entre los alimentos que se consumen, por lo que la variable es
significativa en la inestabilidad de la presión.
Haciendo el mismo análisis para el factor H. se obtuvo que
para se rechaza
H0 lo que significa que hay diferencias significativas
entre los horarios del día en que se toma la
presión, por lo que la variable es significativa en la
inestabilidad de la presión.
Haciendo el análisis para las réplicas se obtuvo
que para se
acepta H0 lo que significa que la variable no es
significativa en la inestabilidad de la presión.
En las interacciones tenemos que solo es significativa la
interacción del factor A con las réplicas.
Para obtener en cuáles horarios y en cuáles
alimentos están estas diferencias significativas se uso
del método de Duncan obteniéndose:
Pruebas de
rangos múltiples para los datos por el Factor
A.
Método de Duncan con 95 % | |||
Factor A. | Conteo | Media LS | Grupos Homogéneos |
Verduras Harina Sal | 6 6 6 | 118,333 135,0 141,667 | X X X |
Contraste Diferencia | |||
Harina-sal Harina-verduras Sal-verduras | -6,66667 *16,6667 *23,3333 |
De aquí se deduce que existe homogeneidad entre
los alimentos harina y sal y existen diferencias significativas
entre harina-verduras y sal-verduras.
Pruebas de rangos múltiples para los datos por el
Factor H.
Método de Duncan con 95 % | |||
Factor H. | Conteo | Media LS | Grupos Homogéneos |
Meridiano Noche mañana | 6 6 6 | 121,667 131,667 141,667 | X X X |
Contraste Diferencia | |||
Mañana-meridiano Mañana-noche Meridiano-noche | *20,0 *10,0 *-10,0 |
De aquí se obtiene que existen diferencias
significativas entre los tres horarios.
Para el Factor A.
Chequeo de varianza.
Prueba C. de Cochran`s: 0,565217 P-value = 0,279372
Prueba de Bartlett`s: 1,15598 P-value = 0,368475
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de
varianza.
Para el Factor H.
Chequeo de varianza
Prueba C. de Cochran`s: 0,442177 P-value = 0,749976
Prueba de Bartlett`s: 1,17879 P-value = 0,322074
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de varianza.
Para el Factor Combi.
Pruebas de rangos múltiples para los datos por el Facto
Combi.
Método de Duncan con 95 % | |||
Factor Combi. | Conteo | Media | Grupos Homogéneos |
8 9 7 5 2 6 3 4 1 | 2 2 2 2 2 2 2 2 2 | 115,0 115,0 125,0 125,0 125,0 135,0 145,0 145,0 155,0 | X X XX XX XX XX XX XX X |
Con el experimento anterior llegamos a la
conclusión de que los alimentos que debemos consumir en
mayor proporción son las verduras y los que menos debemos
consumir son aquellos que contengan alto contenido de sal. El
horario del día en que la presión alcanza menores
valores es el meridiano y mayores valores por la mañana.
La mejor combinación es verduras-meridiano y la peor
sal-mañana.
Analizando el problema anterior pero con datos
correspondientes a cuatro semanas se desea analizar el comportamiento
de la presión en cada semana así podría
comportarse en los próximos días. (Ver anexo
3).
Tt = B0
Media: 139,6429
Varianza: 153,4439 Modelo híbrido.- Serie de tendencia constante estacional con
período 7.
B0 =139,643 p = 7 n = 28
E (1) =1,074 E (2) = 0,967 E (3) = 1,074 E (4) = 0,967
E (5) = 0,859 E (6) = 0,985 E (7) = 1,074
Varianza: 63,7500 Desv. Típica: 7,9844 - Estimación y chequeo.
- Diseño de pronóstico.
Horizonte (K): 2 N = 28 m = 28 n = 14
Función de pronóstico:
E (1) = 1,060 E (2) = 0,971 E (3) = 1,065 E (4) =
0,975
E (5) = 0,851 E (6) = 0,953 E (7) = 1,094
Media de los errores: – 5,361
Suma de cuadrados: 980,298 Cuadrado Medio: 75,405
Raíz del Cuadrado Medio: 8,683752
Cálculo del intervalo de confianza para un nivel
de confianza de 95 %.
Pronóstico para T = 30: 132,7373
Intervalo de confianza para el pronóstico (115,09;
150,38)
Desviación Estándar (1,25 DAP):9,0026
Valor del DAP: 7,20
Coeficiente de alisamiento del DPA: 0,250
Consideramos que en dicho trabajo hemos cumplido con los
objetivos
propuestos debido a que se puso en práctica los
conocimientos adquiridos en clases, con la aplicación de
métodos estadísticos en la resolución de
problemas, con el uso de paquetes de programas profesionales.
Obtuvimos como resultados que en el peso de las gallinas juega un
papel importante la cantidad de pienzo y agua consumida; que los
alimentos que ingerimos a diario, los diferentes horarios del
día y la combinación de estos factores influyen
significativamente en los valores de presión
arterial.
Recomendaciones
Exhortamos que se continúen realizando estos trabajos
investigativos debido a que nos permite elevar nuestros
conocimientos y llevarlos a la práctica, logrando formar
profesionales más integrales,
los cuales en futuro pueden rescatar aquellas técnicas
estadísticas que se han perdido.
Recomendamos además que la hora de seleccionar los
alimentos a ingerir tengamos presentes, cuáles son
aquellos más beneficiosos y los que resulten más
perjudiciales; que preferentemente predominen en nuestras mesas
las verduras y que en aquellos horarios tiende a alcanzar mayores
valores evitemos consumir alimento que contribuyen a elevar la
misma.
- García Francis, Ramón
y Coautores: Problemas Resueltos y Propuestos de Estadística Matemática II. Editorial Pueblo y
Educación. La Habana, 1986. - Guyon Dalmau, Luis y Coautores: Estadística
Matemática II. Ediciones Avenida del Bosque Nr. 168. La
Habana, 1986 (Dos tomos). - López Planes, Reinaldo: Diseño
Estadístico de experimento. - Probabilidades y Estadística para Ingenieros.
Segunda parte. Cuarta Edición
Anexo 1.
Datos del problema 1.
N. | Y (Peso en lb.) | X1 (Cant. Pienzo en Kg.) | X2 (Cant. Agua en L.) |
1 | 5 | 8 | 6 |
2 | 8 | 9,5 | 7,4 |
3 | 10 | 11 | 8,4 |
4 | 9 | 10 | 7,9 |
5 | 12 | 13 | 8 |
6 | 5,6 | 8,5 | 7 |
7 | 7,3 | 8 | 8 |
8 | 6,2 | 7 | 6 |
9 | 5,5 | 9 | 4 |
10 | 3 | 6 | 5 |
11 | 8,5 | 7 | 7 |
12 | 7 | 6,5 | 6 |
13 | 4 | 6,2 | 5 |
14 | 4,5 | 7 | 5,6 |
15 | 5,8 | 9 | 6,2 |
16 | 7,6 | 8 | 6,9 |
17 | 3,9 | 5,7 | 3,8 |
18 | 9,2 | 11 | 7,5 |
19 | 10,6 | 11,5 | 8,3 |
20 | 8,8 | 8,4 | 6,9 |
21 | 7,9 | 9 | 5,8 |
22 | 9,6 | 10 | 8,5 |
23 | 6,8 | 8,k9 | 5,9 |
24 | 4,7 | 7,2 | 5,2 |
25 | 8,6 | 9 | 8 |
26 | 13,5 | 15 | 9 |
27 | 3,5 | 6,9 | 6 |
28 | 4,29 | 6,82 | 5,76 |
29 | 8,54 | 7,89 | 7,28 |
30 | 9,08 | 8,76 | 8,45 |
31 | 10,22 | 9,56 | 8,98 |
32 | 5,63 | 7,31 | 5,82 |
33 | 6,58 | 8,02 | 7,21 |
34 | 7,91 | 7,79 | 6,88 |
35 | 8,33 | 9,01 | 8,32 |
Anexo 2.
Datos del problema 2. para diseño de
experimento.
Factor A. (Alimentos) | Factor H. (Horarios) | Valores de presión | |
Réplica 1. | Réplica 2. | ||
Sal | Mañana | 160 | 150 |
Sal | Meridano | 130 | 120 |
Sal | Noche | 150 | 140 |
Harina | Mañana | 140 | 150 |
Harina | Meridiano | 120 | 130 |
Harina | Noche | 130 | 140 |
Verduras | Mañana | 120 | 130 |
Verduras | Meridiano | 110 | 120 |
Verduras | Noche | 120 | 110 |
Anexo 3.
Datos del problema 2. para series
cronológicas.
Nr. de días. | Semana 1. | Semana 2. | Semana 3. | Semana 4. |
1 | 150 | 160 | 150 | 140 |
2 | 140 | 130 | 140 | 130 |
3 | 160 | 150 | 150 | 140 |
4 | 130 | 140 | 140 | 130 |
5 | 120 | 130 | 120 | 110 |
6 | 140 | 150 | 130 | 130 |
7 | 150 | 160 | 140 | 150 |
Resumen
El presente trabajo se ha realizado con el objetivo de
poner en práctica los conocimientos adquiridos en la
asignatura de estadística ii, en vista a seleccionar
problemas existentes en las empresas y otros que se dan en
nuestra sociedad. Para darle cumplimiento a estos objetivos hemos
utilizados los métodos y técnicas
estadísticas ya estudiados, como son: regresión
simple, regresión múltiple, método paso a
paso, análisis de varianza, diseño de experimento,
análisis de series, entre otros.
Sumary
The present work has been carried out with the objective of
putting into practice the knowledge acquired in the subject of
Statistic II, in view to select existent problems in the
companies and others that are given in our society. To give
execution to these objectives we have already used the methods
and statistical techniques studied, like they are: simple
regression, multiple regression, method step to step, variance
analysis, design of experiments, series analysis, among
others.
Autor:
Yuriel Noa Góngora
Curso 2002-2003