¯
DM =
DM =
DM =
¯
MEDIDAS DE DISPERSIÓN CON EXCEL
DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO
La desviación media o desviación promedio es la media aritmética de los valores absolutos de las
desviaciones respecto a la media aritmética.
a) Para Datos No Agrupados
Se emplea la fórmula:
?|x – x|
DM =
n
Ejemplo ilustrativo: Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución: Se calcula la media aritmética.
??¯ =
? ???? 3 + 8 + 8 + 8 + 9 + 9 + 9 + 18
=
?? 8
=9
Se calcula la desviación media.
?|x – x|
n
|3 – 9| + |8 – 9| + |8 – 9| + |8 – 9| + |9 – 9| + |9 – 9| + |9 – 9| + |18 – 9|
8
6 + 1 + 1 + 1 + 0 + 0 + 0 + 9 18
= = 2,25
8 8
Empleando Excel:
b) Para Datos Agrupados en Tablas de Frecuencia
Se emplea la fórmula:
???? =
? ??|?? – ??¯ |
??
??
Ejemplo ilustrativo: Calcular la desviación media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificación Cantidad de asignaturas
Solución:
Se calcula la media aritmética.
6
7
8
9
10
Total
4
2
3
2
1
12
??¯ =
? ???? 4 · 6 + 2 · 7 + 3 · 8 + 2 · 9 + 1 · 10 24 + 14 + 24 + 18 + 10 90
= = =
?? 12 12 12
= 7,5
Se llena la siguiente tabla:
?? |?? – ??¯ | ??|?? – ??¯ |
6
7
8
9
10
4
2
3
2
1
1,5
0,5
0,5
1,5
2,5
6
1
1,5
3
2,5
Total 12
Se emplea la ecuación de la desviación media.
14
???? =
? ??|?? – ??¯ | 14
=
?? 12
= 1,167
c) Para Datos Agrupados en Intervalos
Se emplea la fórmula:
Donde ???? es la marca de clase.
???? =
? ??|???? – ??¯ |
??
Ejemplo ilustrativo: Calcular la desviación media de un curso de 40 estudiantes en la asignatura de
Estadística en base a la siguiente tabla:
Calificación Cantidad de estudiantes
2-4
4-6
6-8
8-10
Total
6
8
16
10
40
Solución: Para calcular la media aritmética se llena la siguiente tabla:
Intervalo ?? ???? ?? · ????
2-4
4-6
6
8
3
5
18
40
6-8
8-10
Total
16 7
10 9
40
112
90
260
??
1- 2 =1- =
2
2
¯
¯
¯
Calculando la media aritmética se obtiene:
??¯ =
? ?? · ?? ?? 260
=
?? 40
= 6,5
Para calcular la desviación media se llena la siguiente tabla:
Intervalo ?? ???? |???? – ??¯ |
??|???? – ??¯ |
???? =
66
40
= 1,65
2-4
4-6
6-8
8-10
Total
6 3
8 5
16 7
10 9
40
3,5
2,5
0,5
2,5
21
12
8
25
66
VARIANZA Y DESVIACIÓN ESTÁNDAR
El teorema de Chebyshev, de autoría del matemático ruso Pafnuty Lvovich Chebyshev, establece que
para todo conjunto de datos, por lo menos 1 – 1/??2 de las observaciones están dentro de k desviaciones
estándar de la media, en donde k es cualquier número mayor que 1. Este teorema se expresa de la
siguiente manera:
1
1- 2
Así por ejemplo, si se forma una distribución de datos con k =3 desviaciones estándar por debajo de la
media hasta 3 desviaciones estándar por encima de la media, entonces por lo menos
1 1 9-1 8
= = 0,8889 = 88,89%
3 9 9 9
Interpretación: El 88,89% de todas las observaciones estarán dentro ± 3 desviaciones de la media.
a) Para Datos No Agrupados
La varianza para una población se calcula con:
s =
?(xi – µ)2
N
Donde:
???? = ?????????????????????????? ???????????????????????? ???? ???? ??????????????ó??
µ = media aritmética poblacional
?? = ??ú???????? ???? ?????????????????????????? ???? ???? ??????????????ó??
La desviación estándar poblacional se calcula con:
?? = v?? 2 = v
La varianza de la muestra se calcula con:
?(xi – µ)2
N
Donde:
s =
?(xi – x)2
n-1
???? = ?????????????????????????? ???????????????????????? ???? ???? ??????????????
x = ?????????? ??????????é???????? ???? ???? ??????????????
?? = ??ú???????? ???? ???????????????????????? ???? ???? ??????????????
La desviación estándar de una muestra se calculó con:
?? = v??2 = v
?(xi – x)2
n-1
s2 =
s2 =
s =
2
= = 0,75 = 75%
??
2
4
4
4
Ejemplo ilustrativo: Considere que los siguientes datos corresponden al sueldo de una población: $350,
$400, $500, $700 y $1000
1) Calcular la desviación estándar.
2) ¿Cuál es el intervalo que está dentro de k = 2 desviaciones estándar de la media?. ¿Qué porcentaje de
las observaciones se encuentran dentro de ese intervalo?
Solución:
1) Para la calcular la desviación estándar se sigue los siguientes pasos:
a) Se calcula la media aritmética.
µ=
? xi 350 + 400 + 500 + 700 + 1000 2950
= =
N 5 5
= $ 590
b) Se aplica la respectiva fórmula para calcular la varianza
?(xi – µ)2
N
(350 – 590)2 + (400 – 590)2 + (500 – 590)2 + (700 – 590)2 + (1000 – 590)2
5
57600 + 36100 + 8100 + 12100 + 168100 282000
= = $2 56400
5 5
c) Se calcula la desviación estándar.
?? = v?? 2 = v$2 56400 = $237,4868
En Excel:
2) Cálculo del intervalo de k = 2 desviaciones estándar de la media.
Se transportan 2 desviaciones estándar (2 x $ 237,4868) = $ 474,97 por encima y por debajo de la media
?? = $590
Por lo tanto se tiene un intervalo desde $ 590 – $474,97 = $ 115,03 hasta $ 590 + $474,97 = $ 1064,97
Aplicando el Teorema de Chebyshev
1 1 1 4-1 3
1- 2 =1- 2 =1- =
Interpretación: Se puede afirmar de que por lo menos el 75% los sueldos están entre $ 115,03 y
$ 1064,97
2
? ??(???? – ??¯ )2
??
b) Para Datos Agrupados en Tablas de Frecuencia
La varianza para una población se calcula con:
Donde:
?? =
? ??(???? – ??)2
??
f = frecuencia absoluta.
La desviación estándar poblacional se calcula con:
?? = v?? 2 = v
La varianza de la muestra se calcula con:
? ??(???? – ??)2
??
??2 =
? ??(???? – ??¯ )2
?? – 1
La desviación estándar de una muestra se calcula con:
?? = v??2 = v
?? – 1
Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos correspondientes a una
muestra.
Calificaciones ??
Solución: Se llena la siguiente tabla:
4
5
6
7
8
10
Total
3
6
4
13
7
6
39
Se calcula la media aritmética.
Calificaciones
4
5
6
7
8
10
Total
??
3
6
4
13
7
6
39
????
12
30
24
91
56
60
273
??¯ =
? ?? · ???? 273
=
?? 39
=7
Se llena la siguiente tabla:
Calificaciones
??????
???? – ??¯
(???? – ??¯ )2
??(???? – ??¯ )2
4
5
6
7
8
10
Total
3
6
4
13
7
6
39
12
30
24
91
56
60
273
-3
-2
-1
0
1
3
9
4
1
0
1
9
27
24
4
0
7
54
116
v?? 2 = v
2
Se calcula la desviación estándar
116
?? = v
39 – 1
=v
116
38
= v3,0526 = 1,747
c) Para Datos Agrupados en Intervalos
La varianza para una población se calcula con:
?? 2 =
? ??(?????? – ??)2
??
Donde:
?? = ???????????????????? ???????????????? ; ???? = ?????????? ???? ??????????
La desviación estándar poblacional se calcula con:
?? =
La varianza de la muestra se calcula con:
? ??(?????? – ??)2
??
?? =
? ??(?????? – ??¯ )2
?? – 1
La desviación estándar de una muestra se calcula con:
?? = v??2 = v
? ??(?????? – ??¯ )2
?? – 1
Ejemplo ilustrativo: Calcular la desviación estándar de los siguientes datos correspondientes a una
muestra.
Intervalo ??
60-65
65-70
70-75
80-85
85-90
5
20
40
27
8
Total 100
Solución:Se llena la siguiente tabla:
Intervalo
60-65
65-70
70-75
80-85
85-90
Total
??
5
20
40
27
8
100
????
62,5
67,5
72,5
82,5
87,5
?? · ????
312,5
1350
2900
2227,5
700
7490
Se calcula la media aritmética.
??¯ =
? ?? · ???? 7490
=
?? 100
= 74,9
Se llena la siguiente tabla:
Intervalo ??
????
?? · ????
?????? – ??¯
(?????? – ??¯ )2
f(?????? – ??¯ )2
60-65
65-70
70-75
80-85
85-90
5
20
40
27
8
62,5
67,5
72,5
82,5
87,5
312,5
1350
2900
2227,5
700
-12,4
-7,4
-2,4
7,6
12,6
153,76
54,76
5,76
57,76
158,76
768,8
1095,2
230,4
1559,52
1270,08
Total
100
7490
4924
Se calcula la desviación estándar.
4924
?? = v
100 – 1
4924
=v
99
= v49,737 = 7,052
OTRAS MEDIDAS DE DISPERSIÓN
a) RANGO, AMPLITUD TOTAL O RECORRIDO
Dada una serie de valores ??1 , ??2 ,
. ???? , su recorrido es la diferencia aritmética entre el máximo y el
mínimo de estos valores.
???? = ????á?? – ????í??
Ejemplo ilustrativo: Calcula el rango de las siguientes distribuciones:
1) 4, 6, 8, 10, 12, 14, 16
2) 5, 10, 13, 13, 14, 15, 17
Solución:
????1 = 16 – 4 = 12 ; ????2 = 17 – 5 = 12
En Excel:
Ambas series tienen rango 12, pero están desigualmente distribuidas, pues mientras la primera se
distribuye uniformemente a lo largo de todo el recorrido, la segunda tiene una mayor concentración en
el centro.
La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio
las siguientes desventajas:
– En su cálculo sólo intervienen dos elementos del conjunto.
– Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad. Puesto que la
amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la
variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño.
Nota: Cuando los datos están agrupados en intervalos se calcula la amplitud sacando la diferencia entre
la marca de clase mayor y la marca de clase menor.
b) AMPLITUD INTERCUARTÍLICA
La amplitud intercuartílica es la distancia entre el tercer cuartil ??3 y el primer cuartil ??1.
Amplitud intercuartílica = tercer cuartil – primer cuartil = ??3 – ??1
c) RANGO SEMI-INTERCUARTIL O DESVIACIÓN CUARTÍLICA
La desviación cuartílica es la mitad de la distancia entre el tercer cuartil y el primero
??3 – ??1
???? =
2
Ejemplo ilustrativo: Si el tercer cuartil = 24 y el primer cuartil = 10. ¿Cuál es la desviación cuartílica?
Solución: La amplitud intercuartílica es 24 – 10 = 14. Por lo tanto, la desviación cuartílica es:
???? =
14
2
d) RANGO PERCENTIL O AMPLITUD CUARTÍLICA
Cada conjunto de datos tiene 99 percentiles, que dividen el conjunto en 100 partes iguales.
La amplitud cuartílica es la distancia entre dos percentiles establecidos.
?????????? ?????????????????? = ??90 – ??10
DISPERSIÓN RELATIVA O COEFICIENTE DE VARIACIÓN
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se
obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa
generalmente en términos porcentuales. Para una población se emplea la siguiente fórmula:
??
???? = · 100%
??
Donde:
???? = ?????????????????????? ???? ??????????????ó??; ?? = ????????????????ó?? ??????á???????? ???? ???? ??????????????ó??
?? = ?????????? ??????????é???????? ???? ???? ??????????????ó??
Para una muestra se emplea la siguiente fórmula:
??
???? = · 100%
??¯
Donde:
???? = ?????????????????????? ???? ??????????????ó??; ?? = ????????????????ó?? ??????á???????? ???? ???? ??????????????
??¯ = ?????????? ??????????é???????? ???? ???? ??????????????
Ejemplo ilustrativo: Mathías, un estudiante universitario, tiene las siguientes calificaciones en las 10
asignaturas que recibe en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10. Emily, una compañero de Mathías,
tiene las siguientes calificaciones: 8, 9, 8, 7, 8, 9, 10, 7, 8 y 10. ¿Cuál estudiante tiene menor variabilidad
en sus calificaciones?
Solución: Como se está tomando en cuenta todas las asignaturas, se debe calcular el coeficiente de
variación poblacional.
En Excel:
Agrupando los datos en tablas de frecuencias:
Para Mathías se obtiene:
En Excel:
Para Emily se obtiene:
En Excel:
Interpretación: Por lo tanto, Emily tiene menor variabilidad en sus calificaciones
Fuente:
Suárez, Mario. & Tapia, Fausto. (2014). Interaprendizaje de Estadística Básica. Ibarra, Ecuador:
Universidad Técnica de Norte
Suárez, Mario. (2014). Probabilidades y Estadística empleando las TIC. Ibarra, Ecuador: Imprenta
GRAFICOLOR
Libros y artículos del Mgs. Mario Suárez sobre Aritmética, Álgebra, Geometría, Trigonometría, Lógica
Matemática, Probabilidades, Estadística Descriptiva, Estadística Inferencial, Cálculo Diferencial, Cálculo
Integral, y Planificaciones Didácticas se encuentran publicados en:
http://es.scribd.com/mariosuarezibujes
http://repositorio.utn.edu.ec/handle/123456789/760
http://www.docentesinnovadores.net/Usuarios/Ver/29591