Trabajo integrador probabilidad y
estadística
Resumen:
El siguiente informe trata, acerca la
distribución de probabilidad discreta, ya en casos
aplicados, donde se analizaran los resultados del estudio
planteado en el muestreo del integrador anterior.
Abstract:
The following report is, on the descriptive
statistics, and in real cases, where the results of the present
case were analyzed.
Objetivos
1. Aplicar los conocimientos aprendidos acerca
de la distribución en diferentes casos, mediante los
datos obtenidos en las encuestas del trabajo integrador con
respecto al primer interciclo, para verificar su utilidad en
la estadística y la oportunidad de inferir
resultados.
2. Emitir conclusiones y comparar resultados,
de los valores hallados con los posiblemente discernidos,
poniendo en práctica las distribuciones.
Introducción
Continuando con el estudio de la probabilidad y
estadística, ahora estudiaremos las distribuciones de
probabilidad, las cuales son aplicadas en muchas ramas de la
ingeniería en general.
Para este trabajo vamos a realzar un ajuste de datos a
una de las distribuciones de probabilidad estudiadas,
basándonos en los datos obtenidos en el primer trabajo de
estadística descriptiva, en cual vamos a obtener
más información acerca del uso de los SMS. Como
pueden ser los porcentajes o probabilidades acerca del uso de SMS
en la universidad, las personas que utilizan este servicio, las
que poseen un plan de datos activo, etc.
Tenemos que realizar un análisis del los tipos de
datos obtenidos en este trabajo y escoger, ya sea una o varias
distribuciones de probabilidad para realizar la
aplicación, y obtener las información
requerida.
Marco
teorico
Distribuciones de variable
discreta
Figura 1. Distribución
normal
[Se denomina distribución de variable
discreta a aquella cuya función de probabilidad
sólo toma valores positivos en un conjunto de valores
de finito o infinito numerable.
A dicha función se le llama función de masa de
probabilidad. En este caso la distribución de probabilidad
es la suma de la función de masa, por lo que tenemos
entonces que:] [1]
1)
Y, tal como corresponde a la definición de
distribución de probabilidad, esta expresión
representa la suma de todas las probabilidades
desde hasta el
valor
Distribuciones de variable discreta más
importantes
Las distribuciones de variable discreta más
importantes son las siguientes:
Distribución binomial
Distribución binomial
negativaDistribución
PoissonDistribución
geométricaDistribución
hipergeométricaDistribución de
BernoulliDistribución Rademacher, que toma el
valor 1 con probabilidad ½ y el valor -1 con
probabilidad ½.Distribución uniforme discreta, donde
todos los elementos de un conjunto finito son
equiprobables.
En esta parte daremos una breve
descripción de un grupo de las distribuciones que fueron
las utilizadas en este trabajo.
Distribución Binomial
[En estadística,
la distribución binomial es
una distribución de probabilidad discreta
que cuenta el número de éxitos en una secuencia
de n ensayos de Bernoulli independientes
entre sí, con una probabilidad fija p de
ocurrencia del éxito entre los ensayos. Un experimento de
Bernoulli se caracteriza por ser dicotómico, esto es,
sólo son posibles dos resultados. A uno de estos se
denomina éxito y tiene una probabilidad de
ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribución
binomial el anterior experimento se repite n veces, de
forma independiente, y se trata de calcular la probabilidad de un
determinado número de éxitos. Para n = 1,
la binomial se convierte, de hecho, en
una distribución de Bernoulli.][1]
Para representar que una variable
aleatoria X sigue una distribución binomial de
parámetros n y p, se escribe:
1)
Caracteristicas Analiticas:
Su función de
probabilidad es
1)
donde
siendo (1)
las combinaciones de en ( elementos tomados
de en
Distribución Binomial
Negativa
[En estadística la distribución
binomial negativa es una distribución
de
probabilidad discreta que incluye a ladistribución de
Pascal.
El número de experimentos de
Bernoulli de parámetro independientes
realizados hasta la consecución del k-ésimo
éxitoes una variable aleatoria que tiene una
distribución binomial negativa con
parámetros k y
La distribución
geométrica es el caso concreto de la binomial
negativa cuando k = 1.]1]
Propiedades:
Su función de probabilidad es
Para enteros x mayores o iguales
que k, donde
1)
Su media es
1)
si se piensa en el número de
fracasos únicamente y
1)
si se cuentan también los k-1
éxitos.
Su varianza es
1)
En ambos casos.
Distribución
Geométrica
[En teoría de
probabilidad y estadística,
la distribución geométrica es cualquiera
de las dos distribuciones de
probabilidad discretas siguientes:
la distribución de probabilidad del
número X del ensayo de
Bernoulli necesaria para obtener un éxito,
contenido en el conjunto { 1, 2, 3,…} ola distribución de probabilidad del
número Y = X - 1 de fallos
antes del primer éxito, contenido en el conjunto { 0,
1, 2, 3,… }.
Cuál de éstas es la que uno llama "la"
distribución geométrica, es una cuestión de
convención y conveniencia.] [1]
Propiedades:
[Si la probabilidad de éxito en cada ensayo
es p, entonces la probabilidad de que x ensayos
sean necesarios para obtener un éxito es
1)
Para x = 1, 2, 3,…. Equivalentemente, la
probabilidad de que haya x fallos antes del primer
éxito es
1)
Para x = 0, 1, 2, 3,….
En ambos casos, la secuencia de probabilidades es
una progresión geométrica.
El valor esperado de
una variable aleatoria X distribuida
geométricamente es
1)
y dado que Y = X-1,
1)
En ambos casos, la varianza es
1)
Las funciones generatrices de
probabilidad de X y la de Y son,
respectivamente,
Como su análoga continua,
la distribución exponencial, la
distribución geométrica carece de memoria. Esto
significa que si intentamos repetir el experimento hasta el
primer éxito, entonces, dado que el primer éxito
todavía no ha ocurrido, la distribución de
probabilidad condicional del número de ensayos adicionales
no depende de cuantos fallos se hayan observado. El dado o la
moneda que uno lanza no tiene "memoria" de estos fallos. La
distribución geométrica es de hecho la única
distribución discreta sin memoria.] [1]
[De todas estas distribuciones de probabilidad
contenidas en {1, 2, 3,… } con un valor esperado dado µ,
la distribución geométrica X con
parámetro p = 1/µ es la de mayor
entropía.] [1]
[La distribución geométrica del
número y de fallos antes del primer éxito
es infinitamente divisible, esto es, para cualquier
entero positivo n, existen variables aleatorias
independientes Y 1,…, Yn distribuidas
idénticamente la suma de las cuales tiene la misma
distribución que tiene Y. Estas no serán
geométricamente distribuidas a menos que n = 1.]
[1]
Distribución
Hipergeométrica
[En teoría de la
probabilidad la distribución
hipergeométrica es
una distribución discreta relacionada
con muestreos aleatorios y sin reemplazo.
Supóngase que se tiene una población
de N elementos de los cuales, pertenecen a la
categoría A y N-d a la B. La
distribución hipergeométrica mide la probabilidad
de obtener x () elementos de la
categoría A en una muestra sin reemplazo
de n elementos de la población original.]
[1]
Propiedades:
[La función de probabilidad de
una variable aleatoria con distribución
hipergeométrica puede deducirse a través de
razonamientos combinatorios y es igual
a
1)
donde es el tamaño de
población,
es el tamaño de la muestra
extraída, es el número de elementos en la
población original que pertenecen a la categoría
deseada y es
el número de elementos en la muestra que pertenecen a
dicha categoría. La notación hace referencia
al coeficient binomial, es decir, el número de
combinaciones posibles al seleccionar elementos de un
total [1]
[El valor esperado de
una variable aleatoria X que sigue la
distribución hipergeométrica es
1)
y su varianza,
1)
En la fórmula anterior,
definiendo
1)
y
1)
se obtiene
1)
La distribución hipergeométrica es
aplicable a muestreos sin reemplazo y
la binomial a muestreos con reemplazo. En
situaciones en las que el número esperado de repeticiones
en el muestreo es presumiblemente bajo, puede aproximarse la
primera por la segunda. Esto es así cuando N es
grande y el tamaño relativo de la muestra
extraída, n/N, es pequeño.]
[1]
Por nombrar las más resaltadas y convenientes
para este trabajo.
Materiales y
herramientas
Desarrollo
Hemos decidido para cada pregunta de nuestra encuentra
encuesta aplicar una distribución, ya que denominaremos
aciertos y fracasos según queramos los resultados a
obtener.
1. Con la creación de nuevas
tecnologías y la factibilidad hoy en día del
internet, ¿usted cree que el servicio de SMS
tradicional debería desaparecer de nuestro
medio?- SI NO
Como vemos en esta pregunta las opciones son dos,
fácilmente, "SI" y "NO" pero está dirigida a 100
estudiantes dentro de nuestro campus universitario, lo que nos
dejaría claro la distribución aplicada, donde la
más opcionada sería la distribución
binomial. Posteriormente
Pasaremos analizar a partir de las 50 primeras
encuestas, cuál sería la probabilidad que digan
"SI" 30 estudiantes del campus universitario a la
desaparición del servicio SMS.
(Número de intentos a partir de la
primera mitad)
Número de éxitos que deseo
obtener)
(Probabilidad de acierto que sería 0.5
al haber un acierto y un fracaso)
(Probabilidad de desacierto)
Tenemos como respuesta de probabilidad de obtener 30
"SI" en 50 encuestados.
Como vemos la probabilidad es muy pequeña debido
a las pocas opciones y el número grande de intentos, pero
sería de mucha utilidad, para determinar tendencias a
ocurrir.
2. ¿Usted es un consumidor del
servicio de SMS tradicional (de solo texto)?, si lo es, por
favor indicar con qué frecuencia mediante un
porcentaje lo hace dentro de un período
mensual.
Valor real en porcentaje: ___________
Parámetros de Consumo
1. 80% – 100% Adictivo
2. 60% – 79% Frecuente
3. 40% – 59% Regular
4. 20% – 39% Ocasional
5. menos del 20% Casi Nunca
Media | 16.8 | |
Mediana | 9 | |
Varianza | 49.7 | |
Desviación | 7.0498227 |
Tabla 1. Medidas de
distribución
Tenemos los datos obtenidos desde las encuestas, y las
medidas de distribución: media, mediana, varianza y
distribución estándar, ahora, vamos a suponer que
necesitamos hallar la probabilidad que un estuante dentro de los
100 encuestados se encuentre dentro de los parámetro de
consumo Regular que es de 40% a 59%.
Donde:
Valores hallados de la curva normal.
Hemos hallado la probabilidad de que un encuestado este
dentro de los parámetros de consumidor Regular, por medio
del método de aplicación normal a la binomial. Como
podemos observar la probabilidad es considerable, lo que nos da
la pauta de decir que esta es una de las opciones que más
seleccionaran los encuestados a simple vista.
1. IPhone
2. Android
3. BlackBerry
4. Otros
Tenemos en este caso 3 tipos de celulares Smartphones de
4 opciones que existen, y plantearemos que de todos los
encuestados, queremos la probabilidad de que elijan solo lo
Smartphones, si se quiere evaluar a 5 encuestados al
azar.
Para esta pregunta hemos decidido utilizar la
distribución híper geométrica como vemos, y
como respuesta tenemos que la probabilidad es bajísima al
solo querer que de 5 encuestados 3 al menos tengan celulares
Smartphones.
4. ¿Usted posee un plan de datos
actualmente?- SI NO
Como vemos en la pregunta, las respuestas pueden ser dos
lo que nos da 3 clases de distribución a utilizar que son:
Binomial, binomial negativa y distribución
geométrica. Para este caso empezaremos por generarnos un
análisis, y elegiremos la distribución
geométrica.
Las encuestas la realizamos de 5 y queremos saber la
probabilidad de que a al 7mo grupo de encuestados se obtengan 3
de respuesta "NO" por primera vez.
Podemos ver que la probabilidad es demasiado baja, que
al 7 grupo de encuestados existan 3 respuestas negativas por
primera vez, lo que resultaría lógico ya que la
probabilidad no es fija para cada grupo, lo que nos deja claro
que pueden existir más formas de predecir resultados si se
quiere hallar para tal número de intentos nuestro
éxito por primera vez.
5. Si usted no dispone de un plan de datos,
entonces ¿dejaría de utilizar un sistema
tradicional de mensajería instantánea como el
SMS, por un sistema de plan de datos instalado en su
teléfono celular, ya sea Blackberry, Android o
actualmente Iphone; y estar dispuesto a pagar el valor
mensual del plan?
SI NO
Para esta última pregunta utilizaremos
distribución binomial negativa, por solo haber dos
resultados posibles:
Calcularemos:
Para una compañía de celulares es de
interés saber, las respuestas "SI" al menos 10 de 37 que
es el total de encuestados que llegaron a esta pregunta, para
enviar un personal a ofrecer el servicio de plan de datos a
estudiantes dentro del campus de la UPS. Sabemos que la
probabilidad es 0.5 de que ambos opciones, "SI" y "NO", sean
seleccionadas.
¿Cuál es la probabilidad que la respuesta
"SI" se repita 20 veces?
Hemos hallado esta probabilidad, que deja en duda la
participación de la compañía que desee
ofrecer este servicio ya que el interés de parte de los
estudiantes es bajísimo.
Conclusiones
Los estudiantes universitarios usan todo tipo de
celulares que les brindan diferentes servicios y utilidades
pero al querer nuestra probabilidad que cada uno tenga un
Smartphone y dentro de esas utilidades, esta probabilidad
generada nos dio bastante pequeña, que
denotaría muchas razones, en las que se encuentran
como destacadas: la economía y accesibilidad, porque
los estudiantes dentro de un grupo pequeño de muestra
se deciden por uno en la categoría de
Otros.Como mencionamos en el análisis de cada
preguntas, para los estudiantes resulta muy complicado
adquirir un celular de gama alta, como uno "Android",
"IPhone" y "BlackBerry" por lo que se deciden por uno
diferente dentro nuestra categoría de "Otros", de
cualquier marca o diferente sistema operativo. Luego
aún más remoto es que posean un plan de datos
que pagar e incluso luego querer adquirir uno. Todo esto
debido a la facilidad de comunicarse gracias a la
tecnología que nos rodea, y la accesibilidad de las
telefonías al brindar el servicio de plan de datos
diarios, lo que deja el servicio de SMS muy por debajo de
toda la tecnología, no por ser un mal servicio, lento
o poco práctico, sino porque los diferente servicios
que brinda la tecnología, ya que son más
completos a la hora de comunicarse, pero no obstante la
probabilidad en la primera pregunta es bajisima con respecto
a "SI" que se refiere a eliminar el servicio de SMS, porque
aunque no lo utilicen de manera frecuente, ellos lo ven como
un servicio aún importante a utilizar, con respecto a
la comunicación.Los estudiantes que frecuentan el campus
universitario con partidarios de utilizar el internet, ademas
son muy afines al avance de la tecnología.
Bibliografía
[1] wikipedia, «es.wikipedia.org,» Wikimedia
Commons , 24 07 14. [En línea]. Available:
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad.
[Último acceso: 03 08 14].
Universidad Politécnica Salesiana.
Autor:
Mirabá Bruno,
Molina Héctor,
Bustamante Cristina
bmiraba[arroba]est.ups.edu.ec,
hmolinav[arroba]est.ups.edu.ec,
Kbustamantec[arroba]est.ups.edu.ec.