Agregar a favoritos      Ayuda      Português      Ingles     

Análisis de los métodos estadísticos a la solución de problemas técnico

Enviado por yuriel.laffita



 

Indice
1. Introducción
2. Desarrollo
3. Diseño de experimento
4. Series Cronológicas
5. Conclusiones
6. Bibliografía

1. Introducción

Podemos decir que en estos tiempos en el entorno empresarial cubano se hace muy poco uso y quizás nulo de las técnicas y métodos estadísticos que resultan de vital importancia en la solución de disímiles problemas que se dan a diario en nuestras empresas, mientras el mundo de la informática se desarrolla cada vez más y son muchos los programas que han surgido entre los que se encuentran varios de análisis estadísticos.
Nuestro trabajo se desarrolló con el fin de conocer la situación del peso de las gallinas pertenecientes a la Unidad Económica Básica "Frank País" de Moa en función de la cantidad de pienzo y agua que consumen, así como la influencia de los alimentos que ingerimos a diario y los distintos horarios del día en los valores de presión arterial.

2. Desarrollo

Regresión Lineal Simple Y Múltiple
Problema 1.
En la Unidad Económica Básica "Frank País" de Moa se desea conocer el peso promedio que alcanzarán las gallinas en el próximo trimestre. A final de cada trimestre estas gallinas son distribuidas a la población y se inicia nuevamente el ciclo de crecimiento.
Se conoce la cantidad de pienzo y agua consumida por estas juega un papel determinante en el peso de las mismas.
En el actual trimestre se realizó un estudio donde se obtuvieron los datos para 35 gallinas. (Ver anexo 1). (Los datos recopilados no son reales).

Análisis de la Regresión Simple.
Variables:

  • Variable dependiente: Y. Peso de las gallinas en libras (lb.).
  • Variable independiente: X. Cantidad de pienzo consumida en kilogramos (Kg.)

Dócima de la pendiente.
Planteamiento de las hipótesis:

Si se acepta H0 : la variable no es significativa.(No existe relación lineal entre Y y X ).

Si se rechaza H0 la variable es significativa (Existe relación lineal entre Y y X ).

F. variación

S.C

G.L

C.M

F

P

Regresión

153,198

1

153,198

90,58

0,0000

Residuos

55,815

33

1,69136

Total

209,013

34

 

El coeficiente de correlación = 0,856131(las variables se encuentran relacionadas linealmente en un 85,6131%).
R2 = 73,2959 (Se ha eliminado un 73,2959 % de los errores con la regresión).
El error estándar = 1,30052
Como el valor de probabilidad es 0,0000<0,05 se RH0 lo que quiere decir que el pienzo es determinante en el peso de las gallinas.

La ecuación determinada para esta estimación es:

Dócima de la falta de ajuste.

(El modelo lineal proporciona un buen ajuste).

(El modelo lineal no proporciona un buen ajuste).

 

El modelo que mejor ajusta es el Square Root-X

F. variación

S.C

G.L

C.M

F

P

F.A

36,1583

24

1,5066

0,69

0,7771

E.P

19,6567

9

2,18407

Como el valor de probabilidad 0,7771>0,10 se AH0 por lo que el modelo proporciona un buen ajuste.

Análisis de la Regresión múltiple:
Variables:

  • Variable dependiente: Y. Peso de las gallinas en libras (lb.).
  • Variable independiente: X1 .cantidad de pienzo consumida en kilogramos (Kg.).
  • Variable independiente: X2 .cantidad de agua consumida en litros (L.).

Dócima de la pendiente

F. variación

S.C

G.L

C.M

F

P

Regresión

177,586

2

88,7929

90,41

0,0000

Residuos

31,4272

32

0,982099

Total

209,013

34

R2 = 84,964 %
R2 ajustada =84,0243 %
Error estándar =0,991009
Error medio absoluto = 0,742858
Estadístico de Durbin Watson = 1,76054.
Como la probabilidad es menor que 0,05 entonces se RH0, lo que indica que algunas de estas variables son útiles para hacer estimaciones del peso de las gallinas (Y).

Método paso a paso.(paso alante )
Con este método podemos determinar cuáles variables del modelo son significativas.
Estadígrafo para entrar = 4,14911
Estadígrafo para remover = 4,14911
En el paso número cero tenemos cero variables en el modelo con 34 G.L para el error y un coeficiente de determinación de 0,00 %.
En el paso número uno adicionamos la variable X1 con un estadígrafo para entrar de 87,4949 y como este valor es mayor que 4,14911 esta variable queda en el modelo con 33 G.L para el error y un coeficiente de determinación de 72,61 %.
En el paso número dos adicionamos la variable X2 con un estadígrafo para entrar de 26,2859 y como este valor es mayor que 4,14911 esta variable queda en el modelo con 32 G.L para el error y un coeficiente de determinación de 84,96 %.
Como podemos observar, tanto el pienzo como el agua que consumen las gallinas son significativas en el peso de las mismas.

El modelo tiene la siguiente ecuación:

Verificación de supuestos:
Normalidad:
Si aproximadamente el 95 % de los residuos están en el intervalo de , entonces no hay razón para rechazar el supuesto de normalidad.

El intervalo es (-1,982018; 1,982018)
Se cumple el supuesto de normalidad ya que el 94,29 % de los errores aleatorios se encuentran dentro del intervalo indicado.

Homocedasticidad:

(Hay Homocedasticidad)

Algún difiere (No hay Homocedasticidad)

n =35
c = 3
p =3
S.C Residual G.1 = 22, 2067
S.C Residual G.2 = 24,306

F = 1, 0945345

1,0945345<2,57693

Se acepta H0 por lo que se cumple el supuesto de Homocedasticidad.
No autocorrelación:

(No hay autocorrelación).

(Hay autocorrelación)

n =35

dl =1,343
dv =1,584
RH0 AH0 RH0
0 1,343 1,584 2,416 2,657 4
d =1,76054. Se encuentra en la región de aceptación por lo que se cumple este supuesto.
No multicolinialidad:

(No hay multicolinialidad)

(Si hay multicolinialidad)

R.C:

R.C:

> 4,13927

Se RH0 por lo no se cumple el supuesto de no multicolinialidad.
Haciendo un pronóstico del peso que debería alcanzar una gallina para un consumo de pienzo de 10,6 Kg. y 9 L de agua obtuvimos un valor de 10,5669 con un error estándar 1,04204.

3. Diseño de experimento

Problema 2.
En un estudio realizado por el ministerio de salud pública se obtuvo que la mayor parte de la población cubana que padece de Hipertensión Arterial se concentra en las provincias orientales. Según criterios médicos una de las causas fundamentales de tal enfermedad es el régimen alimenticio que llevan las personas. Se pudo observar además que los alimentos que se consumen no provocan el mismo efecto en la presión para los distintos horarios del día.
Es interés de todos conocer cuáles son los alimento que podemos consumir en mayor o menor medida, los horarios en que son menores y mayores los valores de tensión arterial, así como la mejor y la peor combinación de estos factores.
Para darle respuestas a estas interrogantes se tomaron muestras de valores de presión por 6 días en diferentes horarios del día de una persona. (Ver anexo 2).

Análisis de varianza para datos tipo III

F. variación

S.C

G.L

C.M

F

P

P. Efectos

A: Factor A.

1733,33

2

866,667

39,00

0,0024

B: Factor H.

1200,0

2

600

27,00

0,0048

C: Réplic.

5,55556

1

5,55556

0,25

0,6433

Interacción

AB

266,667

4

66,6667

3,00

0,1562

AC

311,111

2

155,556

7,00

0,0494

BC

44,4444

2

22,2222

1,00

0,4444

Residuos

88,8889

4

22,2222

Total

3650,0

17

Analizando el P-value del factor A. se obtuvo que para se rechaza H0 lo que significa que hay diferencias significativas entre los alimentos que se consumen, por lo que la variable es significativa en la inestabilidad de la presión.
Haciendo el mismo análisis para el factor H. se obtuvo que para se rechaza H0 lo que significa que hay diferencias significativas entre los horarios del día en que se toma la presión, por lo que la variable es significativa en la inestabilidad de la presión.
Haciendo el análisis para las réplicas se obtuvo que para se acepta H0 lo que significa que la variable no es significativa en la inestabilidad de la presión.
En las interacciones tenemos que solo es significativa la interacción del factor A con las réplicas.
Para obtener en cuáles horarios y en cuáles alimentos están estas diferencias significativas se uso del método de Duncan obteniéndose:
Pruebas de rangos múltiples para los datos por el Factor A.

Método de Duncan con 95 %

Factor A.

Conteo

Media LS

Grupos Homogéneos

Verduras

Harina

Sal

6

6

6

118,333

135,0

141,667

X

X

X

Contraste Diferencia

Harina-sal

Harina-verduras

Sal-verduras

-6,66667

*16,6667

*23,3333

De aquí se deduce que existe homogeneidad entre los alimentos harina y sal y existen diferencias significativas entre harina-verduras y sal-verduras.

Pruebas de rangos múltiples para los datos por el Factor H.

Método de Duncan con 95 %

Factor H.

Conteo

Media LS

Grupos Homogéneos

Meridiano

Noche

mañana

6

6

6

121,667

131,667

141,667

X

X

X

Contraste Diferencia

Mañana-meridiano

Mañana-noche

Meridiano-noche

*20,0

*10,0

*-10,0

De aquí se obtiene que existen diferencias significativas entre los tres horarios.
Para el Factor A.
Chequeo de varianza.
Prueba C. de Cochran`s: 0,565217 P-value = 0,279372
Prueba de Bartlett`s: 1,15598 P-value = 0,368475
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de varianza.

Para el Factor H.
Chequeo de varianza
Prueba C. de Cochran`s: 0,442177 P-value = 0,749976
Prueba de Bartlett`s: 1,17879 P-value = 0,322074
En la prueba de Cochran`s P-value > 0,05
En la prueba de Bartlett`s P-value > 0,05
Se cumple el supuesto de igualdad de varianza.

Para el Factor Combi.
Pruebas de rangos múltiples para los datos por el Facto Combi.

Método de Duncan con 95 %

Factor Combi.

Conteo

Media

Grupos Homogéneos

8

9

7

5

2

6

3

4

1

2

2

2

2

2

2

2

2

2

115,0

115,0

125,0

125,0

125,0

135,0

145,0

145,0

155,0

X

X

XX

XX

XX

XX

XX

XX

X

Con el experimento anterior llegamos a la conclusión de que los alimentos que debemos consumir en mayor proporción son las verduras y los que menos debemos consumir son aquellos que contengan alto contenido de sal. El horario del día en que la presión alcanza menores valores es el meridiano y mayores valores por la mañana. La mejor combinación es verduras-meridiano y la peor sal-mañana.

4. Series Cronológicas

Analizando el problema anterior pero con datos correspondientes a cuatro semanas se desea analizar el comportamiento de la presión en cada semana así podría comportarse en los próximos días. (Ver anexo 3).

  1. Tt = B0
    Media: 139,6429 Varianza: 153,4439 Modelo híbrido.

  2. Serie de tendencia constante estacional con período 7.


    B0 =139,643 p = 7 n = 28
    E (1) =1,074 E (2) = 0,967 E (3) = 1,074 E (4) = 0,967
    E (5) = 0,859 E (6) = 0,985 E (7) = 1,074
    Varianza: 63,7500 Desv. Típica: 7,9844

  3. Estimación y chequeo.
  4. Diseño de pronóstico.

Horizonte (K): 2 N = 28 m = 28 n = 14
Función de pronóstico:

E (1) = 1,060 E (2) = 0,971 E (3) = 1,065 E (4) = 0,975
E (5) = 0,851 E (6) = 0,953 E (7) = 1,094

Media de los errores: - 5,361
Suma de cuadrados: 980,298 Cuadrado Medio: 75,405
Raíz del Cuadrado Medio: 8,683752

Cálculo del intervalo de confianza para un nivel de confianza de 95 %.
Pronóstico para T = 30: 132,7373
Intervalo de confianza para el pronóstico (115,09; 150,38)
Desviación Estándar (1,25 DAP):9,0026
Valor del DAP: 7,20
Coeficiente de alisamiento del DPA: 0,250

5. Conclusiones

Consideramos que en dicho trabajo hemos cumplido con los objetivos propuestos debido a que se puso en práctica los conocimientos adquiridos en clases, con la aplicación de métodos estadísticos en la resolución de problemas, con el uso de paquetes de programas profesionales. Obtuvimos como resultados que en el peso de las gallinas juega un papel importante la cantidad de pienzo y agua consumida; que los alimentos que ingerimos a diario, los diferentes horarios del día y la combinación de estos factores influyen significativamente en los valores de presión arterial.

Recomendaciones
Exhortamos que se continúen realizando estos trabajos investigativos debido a que nos permite elevar nuestros conocimientos y llevarlos a la práctica, logrando formar profesionales más integrales, los cuales en futuro pueden rescatar aquellas técnicas estadísticas que se han perdido.
Recomendamos además que la hora de seleccionar los alimentos a ingerir tengamos presentes, cuáles son aquellos más beneficiosos y los que resulten más perjudiciales; que preferentemente predominen en nuestras mesas las verduras y que en aquellos horarios tiende a alcanzar mayores valores evitemos consumir alimento que contribuyen a elevar la misma.

6. Bibliografía

  • García Francis, Ramón y Coautores: Problemas Resueltos y Propuestos de Estadística Matemática II. Editorial Pueblo y Educación. La Habana, 1986.
  • Guyon Dalmau, Luis y Coautores: Estadística Matemática II. Ediciones Avenida del Bosque Nr. 168. La Habana, 1986 (Dos tomos).
  • López Planes, Reinaldo: Diseño Estadístico de experimento.
  • Probabilidades y Estadística para Ingenieros. Segunda parte. Cuarta Edición

Anexo 1.

Datos del problema 1.

N.

Y

(Peso en lb.)

X1

(Cant. Pienzo en Kg.)

X2

(Cant. Agua en L.)

1

5

8

6

2

8

9,5

7,4

3

10

11

8,4

4

9

10

7,9

5

12

13

8

6

5,6

8,5

7

7

7,3

8

8

8

6,2

7

6

9

5,5

9

4

10

3

6

5

11

8,5

7

7

12

7

6,5

6

13

4

6,2

5

14

4,5

7

5,6

15

5,8

9

6,2

16

7,6

8

6,9

17

3,9

5,7

3,8

18

9,2

11

7,5

19

10,6

11,5

8,3

20

8,8

8,4

6,9

21

7,9

9

5,8

22

9,6

10

8,5

23

6,8

8,k9

5,9

24

4,7

7,2

5,2

25

8,6

9

8

26

13,5

15

9

27

3,5

6,9

6

28

4,29

6,82

5,76

29

8,54

7,89

7,28

30

9,08

8,76

8,45

31

10,22

9,56

8,98

32

5,63

7,31

5,82

33

6,58

8,02

7,21

34

7,91

7,79

6,88

35

8,33

9,01

8,32

Anexo 2.

Datos del problema 2. para diseño de experimento.

Factor A.

(Alimentos)

Factor H.

(Horarios)

Valores de presión máxima.

Réplica 1.

Réplica 2.

Sal

Mañana

160

150

Sal

Meridano

130

120

Sal

Noche

150

140

Harina

Mañana

140

150

Harina

Meridiano

120

130

Harina

Noche

130

140

Verduras

Mañana

120

130

Verduras

Meridiano

110

120

Verduras

Noche

120

110

Anexo 3.

Datos del problema 2. para series cronológicas.

Nr. de días.

Semana 1.

Semana 2.

Semana 3.

Semana 4.

1

150

160

150

140

2

140

130

140

130

3

160

150

150

140

4

130

140

140

130

5

120

130

120

110

6

140

150

130

130

7

150

160

140

150

 

Resumen
El presente trabajo se ha realizado con el objetivo de poner en práctica los conocimientos adquiridos en la asignatura de estadística ii, en vista a seleccionar problemas existentes en las empresas y otros que se dan en nuestra sociedad. Para darle cumplimiento a estos objetivos hemos utilizados los métodos y técnicas estadísticas ya estudiados, como son: regresión simple, regresión múltiple, método paso a paso, análisis de varianza, diseño de experimento, análisis de series, entre otros.

Sumary
The present work has been carried out with the objective of putting into practice the knowledge acquired in the subject of Statistic II, in view to select existent problems in the companies and others that are given in our society. To give execution to these objectives we have already used the methods and statistical techniques studied, like they are: simple regression, multiple regression, method step to step, variance analysis, design of experiments, series analysis, among others.

 

 

 

 

 

Autor:


Yuriel Noa Góngora

Curso 2002-2003


Comentarios


Trabajos relacionados

  • The new route: dollarization - The Argentine case

    A brief history of Argentina monetary procedures. The cost of the Seinoriage lost. Interest rates. The consumers in a do...

  • Comercio internacional

    El financiamiento y la asistencia internacional. Inversión extranjera directa. Organismos internacionales. Acuerdos come...

  • Modelo Económico

    Definición. Problemática económica que se pretende resolver. Estimación del modelo a priori. Variables, definición y mag...

Ver mas trabajos de Economia

 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.


Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Iniciar sesión

Ingrese el e-mail y contraseña con el que está registrado en Monografias.com

   
 

Regístrese gratis

¿Olvidó su contraseña?

Ayuda