Ubicado en el Centro Comercial Regina (CCR) –Puerto La Cruz.
Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de maderas y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
En nuestros días, la estadística se ha convertido en un método efectivo para descubrir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para analizar y relacionar dichos datos.
La estadística se puede definir como un conjunto de métodos para manejar la recolección, presentación y agrupación de los datos, así como del análisis, interpretación, proyección e inferencia de ellos, y ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.
En este trabajo se realizará un análisis estadístico de las edades de las personas que asisten a Cines Unidos, ubicado en el Centro Comercial Regina (CCR) – Puerto La Cruz, para el desarrollo de este análisis se utilizará un conjunto de mediciones estadísticas que hemos venido estudiando a lo largo de toda la materia y que ayudaran en el análisis de estos datos. Estas mediciones serán:
Estadística:
Se define como el conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. Es la recopilación, presentación y caracterización de la información en fin de que se auxilie tanto en el análisis de datos como en el proceso de la toma de decisiones.
Probabilística:
Es aquella que proporciona una base racional para tratar de resolver situaciones influidas por factores aleatorios.
Población:
Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de elementos con características comunes, que pueden ser finitos o infinitos.
Muestra:
Es un conjunto de medidas, observaciones tomadas a partir de una población dada.
Frecuencia:
Es el número de veces que se repite un valor, dato o término dentro de una serie en estudio.
Tipos de frecuencias estadísticas:
Variable:
Es la característica de interés sobre cada elemento de una población o muestra y puede tomar diferentes valores.
Variables estadísticas:
Datos:
Son números o medidas que han sido recopilados como resultado de observaciones. Los datos pueden provenir de recuentos tales como el número de personas que laboran en una empresa o de mediciones como el peso de una persona.
Tipos de datos estadísticos:
Las clases constan de un límite inferior (
) y de un limite superior (
).
Tablas estadísticas:
Son aquellas que están formadas por la columna matriz y el cuerpo esta compuesto por más de una columna y se dividen en simples y complejas.
Gráficos estadísticos:
Son datos cuantitativos que vienen representados por dibujos geométricos donde la longitud o el área de una parte de la figura es proporcional a la cantidad o magnitud representada.
Escala:
Es la asociación de cosas distintas pero de la misma especie. Es el tamaño o proporción con el que se desarrolla un plan de ideas.
Tipos de escala:
Es el conjunto de valores que puede presentar una variable junto con sus frecuencias, estas se pueden clasificar de acuerdo a sus tipos.
Según la naturaleza de la variable estudiada las distribuciones de frecuencia pueden ser:
Fila de datos:
Sirve para ordenar en forma creciente los datos de acuerdo a su frecuencia. Se agrupan a partir del número más pequeño de la muestra hasta el número mayor.
n = número total de datos
Rango:
Resulta de la diferencia entre el límite superior y el límite inferior, existe en los datos no agrupados, se expresa con la siguiente ecuación:
![]()
Número de clases:
Se expresa por la siguiente ecuación:
n° de clases = ![]()
Intervalo de clases:
Es el cociente que resulta de dividir el rango entre el número de clases.
![]()
Punto medio (
):
Es el valor promedio de cada intervalo de clase.
![]()
Límites reales:
Es el resultado de restar 0,5 al límite inferior de clases y luego sumar esa misma cantidad al límite superior de clases.
Histograma de frecuencia:
Son segmentos de geometría rectangular graficado con el intervalo de clases o los límites reales de clase.
En el caso que se utilice la frecuencia simple se graficaran histogramas simples y en el caso de que se utilicen frecuencias acumuladas se graficaran histogramas acumulados.
Polígonos de frecuencia:
Se obtienen de la unión de puntos obtenidos con los puntos medios de cada clase y su frecuencia simple o acumulada dependiendo del tipo que se quiere graficar.
Es un valor, que es típico o representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud.
Se pueden definir varios tipos de medidas de tendencia central, las más comunes son la media aritmética o brevemente media, la mediana y la moda.
Media aritmética (
):
La media aritmética o media de un conjunto de N números se representa por
y se define como:
Para datos no agrupados
Donde:
xi = cada uno de los datos.
n = número total de datos.
Para datos agrupados
![]()
Donde:
xi = punto medio.
fi = frecuencia simple relativa.
n = número total de datos.
Mediana (
):
La mediana de una colección de datos ordenados en orden de magnitud es el valor medio o la media aritmética de los dos valores medios.
Para datos no agrupados
![]()
Para datos agrupados
![]()
Donde:
LI = frontera inferior de clase.
Linf fi = límite inferior de la franja modal
fa = frecuencia acumulada anterior a la clase total.
fi = frecuencia modal.
n = número total de datos.
Moda o modo (
):
La moda de una serie de números es aquel valor que se presenta con la mayor frecuencia, es decir, es el valor más común.
Para datos no agrupados
Es el valor que mas se repite dentro de la muestra de datos.
Para datos agrupados
![]()
Donde:
LI = frontera inferior de clases.
A1 = fi – fi ant
fi ant = frecuencia modal anterior
fi post = frecuencia modal posterior.
Ic = intervalo de clases.
A2 = fi – fi post
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ".
Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se describen las medidas de posición más comunes utilizadas en estadística, como lo son:
Cuartiles (Q1, Q2, Q3)
a) Primer cuartil (Q1):
Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante.
Formula de Q1 para series de Datos Agrupados en Clase.

Donde:
: posición de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.
Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posición correspondiente.
b) Segundo cuartil (Q2):
Coincide, es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.
c) Tercer cuartil (Q3):
Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.
Formula de Q3 para series de Datos Agrupados en Clase.

Donde:
: posición de Q3, todo idéntico al calculo de la Mediana.
Deciles (D1, D2, … D9)
Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9).
El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante).



El D9 (noveno decil) supera al 90% y es superado por el 10% restante.
Percentiles (P1, P2, … P99)
Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).
El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restantes.
Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.



El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante.
Para determinar estas medidas se aplicara el principio de la mediana; así, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tecer cuartil se encuentra el 75 por ciento; el 80 decil será el valor por encima del cual estará el 20 por ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25° percentil, el tercer cuartil el 75° percentil, el cuarto decil el 40° percentil, etc.
Datos no agrupados:
Se hace difícil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente:
Si tenemos una serie de valores X1, X2, X3 … Xn, se localiza el primer cuartil como el valor
cuando n es par, y
cuando n es impar. Para el tercer cuartil será
(n par);
(n impar).
En caso de los textiles será
o
donde A representa el número del textil.
Para los deciles será
o
siendo A el número del decil; y para los percentiles
o
.
Ejemplo:
En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.
![]()
![]()
![]()
Esto significa que el 4° textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino numero 25° y 26° ; y el 95° percentil entre la posición 30° y 31° .
Calculo para una distribución de frecuencia
Para el cálculo de esta medida en datos agrupados en una distribución de frecuencia, se utiliza el mismo procedimiento estudiado para el cálculo de la Mediana, el cual es:
![]()
Donde:
1i: limite inferior de la clase que lo contiene.
P: valor que representa la posición de la medida.
fi: la frecuencia de la clase que contiene la medida solicitada.
fa-1: frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic: intervalo de clase.
Ejemplo:
Determinación del primer cuartil, el cuartil textil, el séptimo decil y el 30° percentil.
|
Salarios (I. de Clases) |
N° de empleados (fi) |
fa |
|
200 – 299 |
85 |
85 |
|
300 – 399 |
90 |
175 |
|
400 – 499 |
120 |
295 |
|
500 – 599 |
70 |
365 |
|
600 – 699 |
62 |
427 |
|
700 – 800 |
36 |
463 |
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
Estos resultados nos indican que el 25 por ciento de los empleados ganan salarios por debajo de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento de los empleados; que bajo 541,57 gana el 57 por ciento de los empleados y sobre Bs. 359,88 gana el 70 por ciento de los empleados.
Muchas veces necesitamos conocer el porcentaje de valores que esta por debajo o por encima de un valor dado; lo que representa un problema contrario al anterior, esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento de valores inferiores y superiores al valor dado. Operación que se resuelve utilizando la siguiente formula general:
![]()
Donde:
P: lugar percentil que se busca.
P: valor reconocido en la escala X.
fa-1: frecuencia acumulada de la clase anterior a la clase en que esta incluida P.
fi: frecuencia de la clase que contiene a p.
Li: limite inferior de la clase que contiene a P.
Ic: intervalo de clase.
N: frecuencia total.
Ejemplo:
Utilizando la distribución anterior, determinar que porcentaje de personas ganan salarios inferiores a Bs. 450,00
![]()
El 50,75 por ciento de las personas ganan salarios inferiores a Bs. 450.
Método gráfico para fraccionar la distribución
Se pueden obtener en forma gráfica, a través de la curva de la frecuencia acumulada (ojiva).
Para ello basta después de trazar la ojiva, llevar el orden de posición de la medida que se quiere sobre la ordenada, trazar por ese punto una perpendicular toca a la ojiva, baja una paralela a la ordenada hasta tocar la abscisa; en el punto donde toque a dicho eje, se encontrará el valor buscado.
Obtención gráfica de las medidas de posición
Similar o idéntico a la distribución grafica de la Mediana con la sola excepción de que se llevaría al eje vertical (frecuencias acumuladas) las especificas posiciones de cada indicador de posición en particular.
Ejemplo:
Forma de obtener los indicadores de posición (cuartiles, deciles y percentiles) para series de datos agrupados en clases:
Supongamos la siguiente distribución de frecuencias referidas a las estaturas que representaban 40 alumnos de un curso.
|
(I. de Clases) |
Estaturas (mts) |
N° alumnos (fi) |
fa |
|
1,60 |
1,639 |
5 |
5 |
|
1,64 |
1,679 |
8 |
13 |
|
** 1,68 |
1,719 |
15 |
** 28 |
|
* 1,72 |
1,759 |
10 |
38 * |
|
1,76 |
1,80 |
2 |
40 |
![]()
Q3=?

![]()
La cual se ubica en la primera fa que la contenga
![]()
![]()
Esta estatura de Q3 = 1,73 mts. Supera en la distribución de frecuencia al 75% de los alumnos del curso y es superada por el 25% de los mismos
D8 = ?

![]()
![]()
![]()
supera esta estatura de 1,736 mts a 8/10 partes de curso y es superado por las 2/10 partes restantes.
P55 = ?

![]()
![]()
![]()
Esta estatura supera al 55% de los alumnos del curso y es superada por el 45% restante.
Una medida del grado de variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable. Lo mas frecuente, sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de tendencia central. Para las variables cuantitativas, las medidas de dispersión mas utilizadas son la desviación media y la desviación típica.
Desviación media (DM):
Se conoce también como promedio de desviación. Es igual a la media aritmética de las desviaciones de una serie de valores respecto de su media aritmética. Para una serie de N valores: X1, X2, X3,… Xn, se define a través de la siguiente expresión:
![]()
Desviación típica (S):
Se define como la raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos con respecto a la medida aritmética y se considera como el indicador de variación o dispersión más importante.

Varianza (S2):
La varianza se define como el cuadrado de la desviación típica. Su mayor utilidad se presenta en la estadística inductiva. Se puede determinar como una medida de variación promedio y se obtiene dividiendo la variación total por el número de medidas.
![]()
Coeficiente de variación (CV):
Se define como el cociente que resulta de dividir la desviación típica entre la medida aritmética
de la serie de datos, multiplicado luego por cien para que su resultado venga expresado en porcentaje.
![]()
Coeficiente de Shepeard (CS):
Se define como el cociente que resulta de dividir el intervalo de clases al cuadrado entre doce para luego restarlo con la varianza para ser utilizado en las distribuciones cuando ya se debe haber hecho un examen completo de la situación.
![]()
Análisis Estadístico de las Edades de las Personas que Asisten a Cines Unidos Ubicado en el Centro Comercial Regina (CCR) – Puerto La Cruz
Muestra de datos
31 33 40 32 22 23 32 21 20 16 22
24 18 20 15 18 20 10 21 39 17 15
13 16 54 18 11 37 45 19 37 15 40
19 27 37 19 51 21 30 34 11 34 46
14 23 36 42 43 26 41 26 42 14 30
15 16 26 35 33 23 17 46 17 35 29
Fila de datos
10 = 1 16 = 3 22 = 2 28 = 0
11 = 2 17 = 3 23 = 3 29 = 1
12 = 0 18 = 3 24 = 1 30 = 2
13 = 1 10 19 = 3 18 25 = 0 10 31 = 1 8
14 = 2 20 = 3 26 = 3 32 = 2
15 = 4 21 = 3 27 = 1 33 = 2
34 = 2 40 = 2 46 = 2 52 = 0
35 = 2 41 = 1 47 = 0 53 = 0 1
36 = 1 42 = 2 48 = 0 54 = 1
37 = 3 9 43 = 1 7 49 = 0 3
38 = 0 44 = 0 50 = 0 n = 66
39 = 1 45 = 1 51 = 1![]()
n° de clases = ![]()
=
n° de clases = 7,04
![]()
Þ ![]()
Tabla de Distribución de Frecuencias.
|
I. de clase |
fi |
fa |
xi |
fir |
far |
fir% |
far% |
Limites reales |
|
10 – 15 |
10 |
10 |
12,5 |
|
|
0,15 |
0,15 |
9,5 – 15,5 |
|
16 – 21 |
18 |
28 |
18,5 |
|
|
0,27 |
0,42 |
15,5 – 21,5 |
|
22 – 27 |
10 |
38 |
24,5 |
|
|
0,15 |
0,57 |
21,5 – 27,5 |
|
28 – 33 |
8 |
46 |
30,5 |
|
|
0,12 |
0,69 |
27,5 – 33,5 |
|
34 – 39 |
9 |
55 |
36,5 |
|
|
0,13 |
0,83 |
33,5 – 39,5 |
|
40 – 45 |
7 |
62 |
42,5 |
|
|
0,10 |
0,93 |
39,5 – 45,5 |
|
46 – 51 |
3 |
65 |
48,5 |
|
|
0,04 |
0,08 |
45,5 – 51,5 |
|
52 - 57 |
1 |
66 |
54,5 |
|
|
0,01 |
1 |
51,5 – 57,5 |
Polígono e Histograma de Frecuencia Acumulada

Polígono e Histograma de Frecuencia Simple

Medidas de Tendencia Central
Medidas de Tendencia Central.
Para datos no agrupados
![]()
Þ ![]()
Para datos agrupados
|
I. de clase |
fi |
fa |
xi |
xi × fi |
|
10 – 15 |
10 |
10 |
12,5 |
125 |
|
16 – 21 |
18 |
28 |
18,5 |
333 |
|
22 – 27 |
10 |
38 |
24,5 |
245 |
|
28 – 33 |
8 |
46 |
30,5 |
244 |
|
34 – 39 |
9 |
55 |
36,5 |
328,5 |
|
40 – 45 |
7 |
62 |
42,5 |
297,5 |
|
46 – 51 |
3 |
65 |
48,5 |
145,5 |
|
52 – 57 |
1 |
66 |
54,5 |
54,5 |
![]()
![]()
![]()
Þ ![]()
Þ ![]()
Þ
Þ ![]()
![]()
![]()
Þ ![]()
![]()
![]()
![]()
Þ ![]()
Datos agrupados
|
I. de clases |
fi |
fa |
|
10 – 15 |
10 |
10 |
|
16 – 21 |
18 |
28 |
|
22 – 27 |
10 |
38 |
|
28 – 33 |
8 |
46 |
|
34 – 39 |
9 |
55 |
|
40 – 45 |
7 |
62 |
|
46 – 51 |
3 |
65 |
|
52 – 57 |
1 |
66 |
n = 66
Cuartiles:

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()
Deciles:

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()
Percentiles:

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()

Þ ![]()
Þ ![]()
|
I. de clases |
fi |
xi |
|
|
|
|
|
10 – 15 |
10 |
12,5 |
125 |
14,36 |
143,6 |
2062,096 |
|
16 – 21 |
18 |
18,5 |
333 |
8,36 |
150,48 |
1258,012 |
|
22 – 27 |
10 |
24,5 |
245 |
2,36 |
23,6 |
55,696 |
|
28 – 33 |
8 |
30,5 |
244 |
3,64 |
29,12 |
105,996 |
|
34 – 39 |
9 |
36,5 |
328,5 |
9,64 |
86,76 |
836,366 |
|
40 – 45 |
7 |
42,5 |
297,5 |
15,64 |
109,48 |
1712,267 |
|
46 – 51 |
3 |
48,5 |
145,5 |
21,64 |
64,92 |
1404,868 |
|
52 – 57 |
1 |
54,5 |
54,5 |
27,64 |
27,64 |
763,969 |
![]()
![]()
![]()
Þ
Þ ![]()
Þ
Þ ![]()
Þ
Þ ![]()
Þ
Þ ![]()
Þ
Þ ![]()
Una ordenación tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias. Los datos ordenados y resumidos, se suelen llamar datos agrupados. Aunque en el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos.
Para realizar una distribución de frecuencias se deben seguir los siguientes procedimientos:
Los histogramas y polígonos de frecuencia son dos representaciones gráficas de las distribuciones de frecuencias. Un histograma de frecuencia consiste en una serie de rectángulos que tienen sus bases sobre un eje horizontal (el eje x) con longitud igual al tamaño de los intervalos de clase. Un polígono de frecuencia es un gráfico de línea trazado uniendo los puntos medios de los techos de los rectángulos en el histograma.
Un promedio es un valor, que es típico a representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados según su magnitud, los promedios se conocen también como medidas de tendencia central. Se pueden definir varios tipos de medidas de tendencia central las mas comunes son la media aritmética, la mediana y la moda.
Las medidas de posición se usan para describir la posición que tiene un valor de datos específicos en relación con el resto de los datos. Las medidas de posición más conocidas son los cuartiles, los percentiles y los deciles. Un percentil es el valor sobre la escala de medida, debajo del cual cae un porcentaje dado de los datos en la distribución. Cuartiles son los valores de las variables que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil Q1, es un número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. EL segundo cuartil es la media. El tercer cuartil Q3, es un número tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q1. Deciles son valores de un conjunto de datos que dividen el total de observaciones en diez partes y no en cuatro, como los cuartiles, o en 100, como los percentiles. Así entre los deciles se encuentra el quinto decil (intervalo), que es otro nombre para la mediana. De todas las medidas de dispersión las más empleadas son los percentiles y los cuartiles.
Una medida del grado de variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable. Lo más frecuente, sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de tendencia central. Las medidas de dispersión más utilizadas son la desviación media, la desviación típica, la varianza, el coeficiente de variación y el coeficiente de Shepeard.
Armando, Soto Negrin. Principios de Estadística. Editorial Panapo. 1999. Pág.: 71-81.
Ernesto, Rivas González. Estadística General. Ediciones de la Biblioteca. Caracas. 2000. Pág.: 164-169.
www.elrincondelvago.com
Rojas, Carlos.
Belda, María
marialucilab[arroba]hotmail.com
PUERTO LA CRUZ
Trabajos relacionados
Ver mas trabajos de Matematicas |
|
Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.