Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Estadística (página 3)



Partes: 1, 2, 3, 4

Ej.

Obs.

  • el valor del
    coeficiente de variación es independiente de las
    unidades de los datos.
  • el coeficiente de variación CV > 0, luego

Ejercicios.

  1. Determine el coeficiente de variación de la población P = {12, 34, 56, 32, 67, 86,
    54}
  2. Compare los coeficientes de variación de las
    siguientes poblaciones y dé una conclusión en
    base a los resultados obtenidos.

P1 (Kg.) = {21, 87, 104, 204, 12} P2
(años) = {10, 20, 30, 40, 50, 60, 70}

P3 (mts.) = {7, 12, 456, 598, 978, 2} P4
($) = {101, 220, 130, 440, 550, 760, 708}

  • Determinación del número de elementos de
    un rango.

Ej. Si consideramos la media aritmética = 35,5 y la
desviación típica s = 14,4 de la distribución de frecuencias indicada en la
tabla siguiente:

li

ls

fi

xi

xi*fi

fi*(xi-x')^2

0

10

2

5

10,00

1863,55

11

21

5

16

80,00

1906,13

22

32

9

27

243,00

654,08

33

43

12

38

456,00

73,51

44

54

8

49

392,00

1452,61

55

65

4

60

240,00

2396,10

40

1421,00

8345,98

35,53

208,65

14,44

Determine el número de datos del rango (– s; + s).

Solución. El rango (– s; + s) = (35,5 – 14,4 ; 35,5 + 14,4) = (21,1 ;
49,9).

El número de elementos de este rango es = nº
(22 ; 32) + nº (33 ; 43) + nº (44 ; 49,9)

= 9 + 12 + x

el valor de x se calcula mediante la regla
proporcional

x = (5,9 * 8) / 10 = 4,72

Luego el total de elementos que contiene el rango
es:

9 + 12 + 4,72 = 25,72.

  • Determinación del porcentaje de elementos
    pertenecientes a un rango.

Ej. Calcular además el % del total de datos que
pertenecen a ese rango, si se consideran los datos

del ejemplo anterior.

Solución. El total de elementos pertenecientes al
rango es 25,72, que representa el:

25,72*100/40 = 64,3 % del total de frecuencias de la
población.

  • Cálculo del número y porcentaje de
    datos pertenecientes a un rango
    interfractilítico.
    • Si el rango es del tipo (Q1,
      D7) el porcentaje entre las dos medidas es 70% –
      20% = 50%.

Ej. En una población de 40 datos, al rango
anterior contiene a 50% de 40 = 20 elementos.

  • Otros rangos interfractilíticos a los cuales
    se les puede obtener sus frecuencias y % son:
  • Rango intercuartilítico.
  • Rango interpercentilítico.
  • Rango interquintilítico.
  • Rango interpercentilítico –
    cuartilíticos.

Ejercicios.

1. Considerando los datos entregados por la tabla
siguiente, determine número y % de personas que contienen
los siguientes rangos:

1.1 (Q1, P78) 1.2 (C1,
D8) 1.3 (D3, D7)

1.4 (Q1, Q6) 1.5 (C3,
P90) 1.6 (P10, P90)

sueldo

101

125

186

265

295

340

456

589

604

780

Nº de personas

14

25

34

56

45

36

28

15

12

5

  • Análisis del Sesgo.

Def. El coeficiente de SESGO determina el grado de
asimetría (alargamiento de la
distribución

hacia la izquierda o hacia la derecha). Para determinar
el sesgo de una distribución de frecuencias se utiliza el
:

  • Si el coeficiente de sesgo tiene un valor positivo se
    dice que la distribución es SESGADA a DERECHA o que
    tiene SESGO POSITIVO.
  • Si el coeficiente de sesgo tiene un valor negativo se
    dice que la distribución es SESGADA a IZQUIERDA o que
    tiene SESGO NEGATIVO.
  • Si el coeficiente de sesgo tiene un valor 0 se dice
    que la distribución es INSESGADA o que tiene SESGO
    0.


sesgo negativo sesgo positivo insesgada

Obs. Otras expresiones que se utilizan para el sesgo
son:

  • Análisis de la Curtosis

El coeficiente de CURTOSIS determina el grado de
alargamiento de la distribución hacia arriba o

hacia
abajo. Para determinar la curtosis de una distribución de
frecuencias se utiliza el:

– Si el coeficiente de curtosis es mayor que 3 se dice
que la distribución es LEPTOCÚRTICA.

– Si el coeficiente de curtosis es menor a 3 se dice que
la distribución es PLATICÚRTICA

– Si el coeficiente de curtosis es igual a 3 se dice que
la distribución es MESOCÚRTICA.


Mesocúrtica Leptocúrtica
Platicúrtica.

Ej. Sea la población P cuyos elementos (40)
están distribuidos de la manera que indica la tabla
siguiente:

Lim.Inf.

Lim.Sup.

fi

xi

fi xi

xi – x

(xi -x )2
fi

(xi – x )3
fi

(xi – x )4
fi

0

10

2

5

10

-30.5

1860.5

-56745.25

1730730.1

11

21

5

16

80

-19.5

1901.25

-37074.375

722950.31

22

32

9

27

243

-8.5

650.25

-5527.125

46980

33

43

12

38

456

2.5

75

187.5

468.7

44

54

8

49

392

13.5

1458

19683

267520.5

55

65

4

60

240

24.5

2401

58824.5

1441200.2

Totales

40

 

1421

 

8348

-20648.75

4208054.422

Entonces, para analizar sesgo y curtosis se necesitan
los siguientes datos:

  • =
    1421 / 40 = 35,5
  • v = 8346 / 40 = 208,7
  • s = 14,44
  • =
    -20648,75 / 40 = -516,21
  • =
    4208054,422 / 40 = 105201,36
  • coef. sesgo = -516,21 / 3010,93 = – 0,171 <
    0
  • coef. curtosis = 105201,36 / 43477,92 = 2,41 <
    3

Conclusión. La población P es sesgada a la
izquierda y platicúrtica.

Obs. Otra expresión que se utiliza para medir la
curtosis de una población es:

Obs. Este coeficiente para una distribución
normal es 0,263

Ejercicios.

1. La tabla dada representa los años de servicio de 52
personas de una empresa
textil:

Años de servicio

0 – 3

4 – 7

8 – 11

12 – 15

16 – 19

20 – 25

frecuencia

8

10

15

9

6

4

1.1 Construya un gráfico lineal para dicha
población.

1.2 Determine sesgo y curtosis de la
población.

1.3 Dé una interpretación a los resultados
obtenidos.

1.4 Encuentre el número de personas que
pertenecen al intervalo (mediana – d: moda +
s)

1.5 Encuentre el número de personas que
pertenecen al rango (Q1, P83)

1.6
Determine el porcentaje de personas que pertenecen al
intervalo

2. Obtenga una muestra de 10
datos de la población dada en el cuadro siguiente
aplicando el azar.

123 213 345 234 65 365 45 214
78 465

324 210 567 23 76 241 45 1287
598 587

456 43 765 34 88 854 365 65 236
685

432 54 234 65 976 458 1258 258
2541 954

2.1 Compare las medidas estadísticas de posición de la
muestra con las respectivas de la población.

2.2 Compare las medidas de dispersión de la
muestra con las respectivas de la población.

2.3 Encuentre el número de personas que
pertenecen al intervalo (mediana – s: moda + s) de la
población.

2.4 Encuentre el número de personas que
pertenecen al rango (Q1, P93) de la
población.

2.5 Determine el porcentaje de personas que pertenecen
al intervalo:

3.

3.1 Clasifique los datos dados en el item 2 en a lo
menos cinco clases.

3.2 Compare las medidas estadísticas de
dispersión de la muestra con las respectivas de la
población y las de su clasificación.

3.3 Compare las medidas estadísticas de
posición de la muestra con las respectivas de la
población y las de su clasificación.

4. En la tabla contiene los datos de un estudio
realizado sobre las edades de un grupo de
personas.

0 a 10 años

23

10 a 20 años

34

20 a 30 años

47

30 a 40 años

53

40 a 50 años

45

50 a 60 años

15

60 a 70 años

18

70 a 80 años

4

4.1 Determine las medidas de posición de dicho
estudio

4.2 Determine las medidas de dispersión de dicho
estudio

4.3 Analice sesgo y curtosis.

4.4 ¿Cree Ud. que la villa, según los
datos que obtuvo, se puede considerar "vieja"?

4.5 Encuentre el número de personas que
pertenecen al intervalo (media aritmética – s: moda +
s)

4.6 Encuentre el número de personas que
pertenecen al rango (Q1, D8)

4.7 Determine el porcentaje de personas que pertenecen
al intervalo:

5. En una empresa que
fabrica tubos de cemento se
analiza la producción mensual, en unidades de
producción, obteniéndose los siguientes
datos:

Enero

Febrero

Marzo

Abril

Mayo

Junio

Julio

Agosto

Sept.

Oct.

Nov.

Dic.

1450

1234

2345

1678

3245

1897

2087

1980

2313

1008

2056

1235

5.1 ¿Cuál es el promedio anual?

5.2 Si ese promedio anual se considera como la
producción normal de la empresa
¿en cuántos meses se produjo menos de lo normal y
en cuántos mas de lo normal?

5.3 Construya un gráfico circular de los datos
dados en la tabla indicando el % que representa cada mes con
respecto a la producción anual.

6. Indique el % que corresponde a cada clase
según los datos y el gráfico dados.

Distribuciones
Bidimensionales

Def. Una DISTRIBUCION BIDIMENSIONAL es una tabla de
doble entrada en la cual participan dos variables
simultáneamente. Cada dato obtenido verifica las dos
variables.

Ej. Si se analiza una población de reos que sean
monreros y que tengan una edad entre los 20 y 30 años,
entonces, todos aquellos reos que cumplan ambas condiciones,
pertenecen a dicho grupo o clase.

Gráfico de una distribución
bidimensional.

Tabulación de una distribución
bidimensional.

Los datos de una distribución bidimensional en
las variables X y Y se tabulan en una tabla de doble
entrada.

donde Xi son los valores (o
marcas de las
clases) de la variable X; Yi son los valores (o
marcas de las clases) de la variable Y y Fij son las
frecuencias relativas a las dos variables.

Ej. La tabla siguiente entrega los datos de un estudio
con respecto de la edad de mujeres y de hombres en matrimonios
constituidos legalmente:

La frecuencia F23 = 18 representa el
número de matrimonios donde la edad de la mujer
está entre los 19 a 22 años y la edad de los
hombres entre los 26 a 30 años.

Obs. Para determinar algunas medidas estadísticas
para distribuciones bidimensionales, con datos clasificados, se
utiliza la siguiente: Tabla de las marcas de las clases de la
distribución bidimensional.

Según los datos dados de la distribución
bidimensional del ejemplo anterior, el gráfico
correspondiente es:

Distribuciones Marginales

Def. La distribución que contiene sólo las
frecuencias de la variable X, se le llama
distribución

MARGINAL de X con respecto a Y. Análogamente, si
se consideran sólo las frecuencias de la

variable Y se le llama distribución MARGINAL de Y
con respecto a X..

Ej. Tabla marginal de las edades de las
mujeres. Tabla marginal de las edades de los hombres

Total 200

Distribuciones Condicionales

A la distribución de las frecuencias de la
variable X ( ó Y) con algún intervalo de la
distribución de las frecuencias de la variable Y (
ó X ) se le llama DISTRIBUCION CONDICIONAL.

Ej. Los datos ennegrecidos del gráfico,
corresponden al total de matrimonios cuyas mujeres tienen una
edad entre los 19 años y los 32 años y cuyos
hombres tienen una edad entre los 21años y los 30
años. En total serían 14 + 18 + 8 + 20 + 5 + 9 =
74.

Medidas en una distribución
bidimensional.


Covarianza.

Correlación.

Def. La CORRELACIÓN de una relación entre dos
variables, nos indica el grado de relación existente entre
ellas. Uno de los instrumentos que se utilizan para determinar la
correlación es el Coeficiente de Correlación, cuyo
valor se determina mediante la expresión:

Ej. Consideremos la distribución bidimensional de los
200 matrimonios dados en la tabla anterior.

Determine la correlación entre las edades de las
mujeres y la de los hombres.

 

Marcas

hombresè

  

Marcas mujeres ê

17,5 años

23 años

28 años

33 años

16,5 años

13

12

15

4

20,5 años

6

14

18

10

24,5 años

3

8

20

14

29,5 años

2

5

9

23

34 años

1

2

3

18

17,5

23

28

33

16,5

3754

4554

6930

2178

20,5

2153

6601

10332

6765

24,5

1286

4508

13720

11319

29,5

1033

3393

7434

22391

34

595

1564

2856

20196

XI

YI

FI

GI

Xi*Fi

Yi*Gi

(xi-x)^2*fi

(yi-y)^2*gi

17,5

16,5

25

44

437,5

726

2444,066406

2406,1851

23

20,5

41

48

943

984

789,2564063

553,2492

28

24,5

65

45

1820

1102,5

24,38515625

16,471125

33

29,5

69

39

2277

1150,5

2173,510781

1225,224975

0

34

0

24

0

816

0

2450,6646

5477,5

4779

5431,21875

6651,795

x

y

media aritmética

27,39

23,90

varianza

desviación típica

27,1560

5,21

33,2589

5,77

covarianza

13,376

correlación

0,4451

Conclusión: como el coeficiente de
correlación es positivo (0,4451) se concluye que cuando la
edad de la mujer aumenta la
edad del hombre
también aumenta.

Ejercicios.

Determine la correlación de la tabla
bidimensional que relaciona los años de servicio con los
sueldos, en miles de $, de una institución fiscal.

Años de servicioê

Sueldos è

70 a 99

100 a 129,99

130 a 159,99

160 a 189,99

190 a 220

0 a 2,99

12

4

5

3

2

3 a 5,99

10

8

9

6

3

6 a 8,99

6

5

12

8

6

9 a 11,99

3

4

9

12

12

12 a 14,99

2

2

4

8

7

15 a 18

2

1

3

4

3

1.1 Determine sesgo y curtosis de las dos distribuciones
marginales de item 1.

1.2 Determine sesgo y curtosis de las distribuciones
condicionales siguientes:

1.2.1 Años de servicio con los sueldos desde 130
a 190 mil pesos

1.2.2 Sueldos con los años de servicio desde los
6 a 15 años

1.3 Determine la correlación entre las
variables.

2. El gráfico siguiente representa un estudio
entre los años de edad de los fallecidos en los cuatro
trimestres de un año cualesquiera.

2.1 Construya una tabla bidimensional de dicho
gráfico

2.2 Construya la tabla marginal de los trimestres con
respecto a los años de los fallecidos

2.3 Determine cuantos fallecidos hubo entre el segundo y
tercer trimestre de personas que tenían entre 20 y 40
años

  1. El siguiente cuadro contiene los datos de la
    relación peso (en Kgs.) y altura (en mts.) de personas
    pertenecientes a una población X.

  1. Determine la correlación de las variables
    peso – altura.
  2. Analice su resultado.
  1. El siguiente cuadro representa los datos de la
    relación de la variable años de trabajo (en
    años) y de la variable sueldo (en miles de $) de
    empleados de una empresa X.

  1. Determine la correlación de las variables
    años de servicio – sueldo.
  2. Analice su resultado.
  3. ¿ Cuántas personas tienen entre 11 y
    20 años de servicio y ganan un sueldo mayor de 200 y
    menor 801 mil pesos?.

Curvas de
ajuste

En la relación entre dos variables X y Y, por
ejemplo, entre costo y venta de una
determinada empresa, muchas veces no se advierte una tendencia
clara de dicha relación. En algunos períodos esta
venta es creciente, en otras decrecientes, o bien, es
estable.

Para determinar alguna tendencia que pueda proyectarse
en el tiempo, la
estadística hace uso de funciones
matemáticas, como la línea recta, la
parábola, y en general, funciones polinomiales,
logarítmicas, exponenciales, trigonométricas
reales. A estas funciones se les denominan

CURVAS DE AJUSTE.

Curva de Ajuste Lineal.

Sean los n datos o puntos (x1 , y1
), (x2 , y2 ),….., (xn ,
yn ), de la relación entre las variables X y Y,
que se muestran en la tabla siguiente:

Variable X

x1

x2

x3

….

……

xn

Variable Y

y1

y2

y3

……

yn

Método libre.

Para determinar la ecuación de una línea
recta de ajuste, por el método
libre, se seleccionan dos puntos cualesquiera de los n datos.
Reemplazando los datos elegidos, A(x1, y1)
y B(x2, y2), en la
ecuación:

se obtiene la ecuación de la Curva de ajuste
lineal.

Ej. La producción quincenal de cobre se
presenta en la siguiente tabla:

Quincena

Producción en ton.

2

6

4

8

5

9

Consideremos los puntos A(1, 2) y B(6, 9). La curva de
ajuste lineal libre tiene por ecuación la
expresión:

Según la curva de ajuste resultante, según
cuadro y gráfico, se puede apreciar que la tendencia de
producción sería creciente en las próximas
quincenas.

Quincena

10ª

11ª

12ª

Producción en ton.

10,4

11,8

13,2

14,6

16

17,4

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter