Bernoulli y las distribuciones discretas

Daniel Jimenez

Distribución de Bernulli

Desarrollo del modelo

Jacobo Bernulli (1654) posee una historia telurica, de origen Sueco, estudio Teología en la universidad, más su pasión secreta eran la física y las matemáticas.

Gracias a distintas charlas con su hermano y el estudio de la mecánica clásico invento o genero los Cálculos de variaciones y de ahí salio las teorias de las probabilidades.

Su trabajo fue influido por la geometria de Descartes y los aportes teoricos de Van Schooten.

Su texto El arte de la conjetura destaca lo que sería más adelante conocido como la distribución binomial, que hace parte de las distribuciones discretas, que son aquellas que toman un valor finito o enumerable entre sus posibilidades.

La función de densidad de la distribución discreta es

\[ f(x) = Pr(X=x)=\frac{1}{N}{I(1,2,3,...N)}(x)\]

Donde se describe un experimento aleatorio que puede tomar un número finito de resultados y por lo tanto su probabilidad de ocurrencia es la misma para cada evento dado.

Este tipo de experimentos tiene dos tipos de resultado \({(0;1)}\) o \({(Exito ;Fracaso)}\)

En el contexto del desarrollo teorico de la teoria de la conjetura la posibilidad en el azar de exito o fracaso, teniendo en cuenta que estos casos son ocultos sus resultados y se desarrollan de la siguiente manera \[(r+s) # Casos posibles\] \[r #número de casos favorables ocultos\]

La capacidad de ocurrencia de cada evento se desarrolla en experimentos p, donde r y s son números naturales

\[p=\frac{r}{(r+s)}\] donde

\[n # es el número de exeprimentos \] \[S_n # es el número de éxitos\] \[\hat{p}_n=\frac{S_n}{n}\] #es la frecuencia relativa \[\varepsilon=\frac{1}{(r+s)}\]

Los resultados principales se dan de la siguiente manera \(Dado X>0\), se entiende que \(N\ge\) 1 tal que \[P_r(|\hat{p_N}-p|\le\varepsilon)>cP_r(|\hat{p_N}-p|\ge\varepsilon)\]

Entiendiendo que \(c>0\) se entiende que \(N\ge 1\) , tal que

\[P_r(|\hat{p_N}-p|\le \frac{1}{(s+r)})>cP_r(|\hat{p_N}-p|>\frac{1}{(s+r)})\]

Apuntes de Bernulli sobre la distribución binomial

Si se poseen mayor cantidad de datos que construyan la frecuencia relativa, entonces se estara más cerca a la verdad de las observaciones y eventos.

El intento es predecir el futuro, entendiendo que hay resultados o circustancias ocultas

*Se debe cuantificar la incertidumbre en una metrica entendible.

*Lo anterior da pie a el estudio de los modelos estocasticos, que se definen como la ciencia que intena medir de manera precisa que las decisiones se pueden regir por una de las mejores alternativas.

*Solo se encontro un problema para el desarrollo de los modelos estocasticos, el tamaño de la muestra.

Se proponen dos metodos para calular la muestra.

Desconociendo el tamaño de la población

\[n=\frac{Z_a^2*p*q}{d^2}\] Donde:

Z es el nivel de confiaza p es la probabilidad de exito q es la probabilidad de fracaso d Error maximo permitido.

Conociendo el tamaño de la población

\[n=\frac{N*Z^2_a*p*q}{d^2*(N-1)+Z^2_a*p*q}\] Donde

N es el tamaño de la muestra Z es el nivel de confianza p es la probabilidad de exito q es la probabilidad de fracaso *d es el margen de error permitido.

Condiciones para el desarrollo de distribución Binomial

Si \(f(x)\ge 0\) para cada valor dentro de su dominio, entonces \(\sum f(x)= 1\), donde la sumatoria explica y pasa por todos los valores del dominio.

En el caso de la distribución acumulativa se da \[ F(x)=(PX\le x)= \sum_{t\le x} f(t) \forall -\infty \le x \le \infty\]

teniendo en cuenta la esperanza matemática como:

\[\mu=E(x)=\sum_{x}xf(x) \] Este es el valor en promedio que pueden tomar todas los valores dentro de una variable. Es una medida de centralidad.

La varianza por su parte es la medida de las distancia de los datos al cuadrado, con respecto a su promedio. Por lo tanto su \(f(x)\) es una función de distribución con promedio \(\mu\) , la varianza se calcula de la siguiente manera:

\[\sigma^2=E[(X-\mu)^2]=\sum_x (x-\mu)^2 f(x)\]

La desviación estandar por su parte, es la medida de disperción de la varianza , pero sometida a la raiz cuadrada para obtener valores positivos de las distancias sobre el promedio, por ello se calcula de la siguiente manera:

\[\sigma=\sqrt {\sum_x (x-\mu)^2 f(x)}\]

Construyendo el modelo de distribución

Si la variable aleatoria de \(X\) toma valores \([{x_1,x_2,...x_n}]\) con probabilidades iguales , entonces la distribución adquiere la siguiente forma:

\(f(x;k)=\frac{1}{k}\) donde x adquiere la forma \(x=x_1,x_2,..x_n\) y su media se calcula de la manera

\[\mu =\frac {\sum_{i=1}^k f(x_i)}{k}\]

y su varianza

\[ \sigma^2 =\frac {\sum_{i=1}^k (f(x_i)-\mu)}{k}\]

Definición de la distribución aplicada de Bernulli

Se realizan experimentos en los cuales solo existen dos posibilidades en sus resultados

\[ Exp(n) = \left \{ \begin{matrix} Exito & \mbox{donde } Exito\mbox{ es p} \\ Fracaso & \mbox{si } Fracaso\mbox{ es 1-p}\end{matrix}\right. \]

Entendiendo que la probabilidad de exito p está dada por la forma de probabilidad *{0 “En la vida practica, se presetan muchos ensayos del tipo Bernulli, por ejemplo: El éxito o fracaso de un correo electrónico ofreciendo algún servicio o producto. En la teoria del muestreo la pertenencia de un elemento de la población en la muestra también tiene distribución Bernulli”[^1] Hanwen & Gutierrez; “Teoria Estadistica, sus aplicaciones y sus metodos”; 2010; Editorial Usta

Función de densidad

La función de densidad del tipo Bernulli se defince como Una variable aleatoria X tiene distribución del tipo Bernulli con parametros p (0,1) si su función de densidad esta dada por

\[f_X(x)=p^x(1-p)^{1-x}I_{(0,1)}(X)\] Se denota como \(X \sim Ber (p)\)

Propiedades de la distribución

Si \(X\) es una variable aleatoria con \(X \sim Ber (p)\) y posee el parámetro p entonces:

  1. \(E(X)= p.\)

  2. \(Var(X)=p(1-p)\)

  3. \(m_x(t)=pe^t+1-p\)

Filosofía de la distribución de Bernulli

En la realidad no se aplica un solo tipo de ensayo tipo Bernulli, sino una serie de ellos, por ejemplo cuando se hace una encuesta sobre la percepción de la gestión de un Alcalde se le pregunta a \(n>1\) de personas , para entender así la calificación p{Exito, Fracaso} de la gestión.

Lo anterior indica que lo que nos interesa es el número de exitos en n ensayos del tipo Bernulli , A esto se le conoce como distribución Binomial

Distribución Binomial

*Una variable aleatoria de X tiene distribución binomial con los parámetros $ n $ y \(p \varepsilon (0,1)\) si su función de densidad está dada por:

\[ f_X(x)=Pr(X=x)= \begin{pmatrix} n \\ x \end{pmatrix} p^x(1-p)^{n-x}I_{(0,1,...n)}(x) \] Está distribucuón se denota \(X \sim Ber (n,p)\)

Si se tiene en cuenta , que en el número de ensayos las repeticiones son independientes, en un mismo experimento del tipo Bernulli, y su probabilidad de exito se denota p, entonces el número de exitos obtenidos durante las repeticiones poseen la distribución $ Bin (n,p)$

En una introducción al código sería

rbinom(10,30,0.35) # Quiere decir que de 10 experimentos exitosos observados en 30 repeticiones que tienen una probabilidad del 35%
##  [1]  5 10 13 15 12  9 12 10 13  5
plot(rbinom(10,30,0.35), type = "h", col=0:10)

Propiedades de la distribución binomial

  1. \(E(X)=np\) #Donde n es el número de observaciones y p es el vector de probabilidades

2.\(Var(X)= np(1-p)\)

3.\(m_X(t)=(pe^t+1-p)^n\)

Ejemplo: De cada 200 correos que se envien,la probabilidad de ser vistos es del 5%, entonce aproximadamente 10 personas vieron el correo.

Para poder generar observaciones del tipo binomial se recurre al código rbinom, este nos permite simular el número de valores provenientes de una distribución.

x<-rbinom(100,8,0.25)
hist(x)

Entendiendo su uso

Un tipico ejemplo de dados: tirar el dado siete veces , ¿Cúal es la probabilidad de obtener 3 cincos?

*Se calcula la probabilidad que caiga cualquier número (Independencia marcada en la teoria de Bernulli)

Un dado tiene seis caras, por cada tirada su probabilidad está dada por

\[ Pr(dado)=\frac{1}{6}=0,16666..\bar{7}\]

\[Per(Dado)= \frac{7!}{3!4!}=35 \] Es el número de combinaciones que tiene para caer el dado

Explicaciones de las permutaciones

Las permutaciones se definen como: Es la cantidad de variaciones de orden que tienen los sucesos, en la cual no se repite los elementos.

Ejemplo: ¿Cuántas veces se puede ordenar los números {1,2,3}? R  Se pueden ordenar de seis maneras = “1,2,3”, “1,3,2”, “2,1,3”, “2,3,1”, “3,1,2” y “3,2,1”.

De donde se tomo el valor seis?, el número más alto es 3 ( contiene al resto de caracteres del vector), por lo tanto se multiplica por cada uno de sus componentes

\[3!= 3*2*1=6\]

En el ejemplo del dado la permutación se calcula de cuantas maneras se pueden dar estás posibilidades, o de cuantas maneras se pueden ordenar los éxitos y fracasos.

Por lo tanto

\[ Per(dado)=\frac{n!}{p!(1-p)!}\] Donde * n es el número de experimentos independientes * p es el número de exitos * (1-p) es el número de fracasos

Entonces la permutación de los dados según el enunciado se da de la siguiente manera

\[ Per(dados)=\frac{7!}{3!4!}\]

Expandiendo una parte de la operación

\[ Per(dados)=\frac{7*6*5*4*3*2*1}{3!4!}\]

Se puede ver que se puede eliminar el factorial de cuatro

\[Per(dados)=\frac{7*6*5*\not4*\not3*\not2*\not1}{3!*\not4*\not3*\not2*\not1}\]

Por lo tanto la operación queda

\[Per(dados)=\frac{7*6*5}{3*2*1}= \frac{210}{6}= 35\]

\[ Exito(Dados)=\frac{1}{6}\]

\[Fracaso(dados)=1-\frac{1}{6}=\frac{5}{6}\]

\[p(Dados)=35·\frac{1}{6}·\frac{1}{6}·\frac{1}{6}·\frac{5}{6}·\frac{5}{6}·\frac{5}{6}·\frac{5}{6}\]

Entonces

\[p(Dados)=0.078\]

Forma moderna de hacerlo

Se plantea el problema de la siguiente manera \(Bin(7,\frac{1}{6})\) donde se busca \(P(X=3)\)

Entonces se plantea la función de densidad que en r esta dada por dbinom(x, size, prob, log = F) donde

La función de densidad se plantea de la siguiente manera dbinom(3,7,1/6) se deja asi, ya que por defecto se toma el log como false y entonces

dbinom(3,7,1/6)
## [1] 0.07814286

El resultado es que la probabilidad de tener 3 tiradas con valor 5 del 7.8%

Si se quiere condicionar la probabilidad recurrimos a los siguientes parametros

Probabilidad condicionada

Suponga que ahora se desea saber cual es la probabilidad de obtener valores menores o iguales en 4 jugadas de 5 , dentro de las siete tiradas. Entonces procedemos a definir nuevamente el espacio muestral como $ = {1,2,3,4,5,6}$. Paso seguido se establece la función de densidad como dbinom(c(4,3,2,1,0),7,1/6) que daría por resultado

dbinom(c(4,3,2,1,0),7,1/6) 
## [1] 0.01562857 0.07814286 0.23442858 0.39071431 0.27908165

El resultado que nos dio, fue que la probabilidad de sacar 4 cincos es del 1.5%, la de 3 es del 7.8% la de obtener al menos dos es del 23.44% , la de obtener al menos un cinco es del 39% y la de ninguno es del 27.9%

Notece que el valor máximo es del 39.07% con una tirada, esto ayuda a la toma de decisiones.

Si queremos saber la probabilidad total , en vez de la individual hacemos lo siguiente

sum(dbinom(c(4,3,2,1,0),7,1/6))
## [1] 0.997996

La probabilidad total de las alternativas para el valor cinco es del 99.79%

Probabilidad condicionada

Otra manera de calcular esto es a tráves de la función de probabilidad que en código es pbinom, que devuelve los valores de la distribución en su forma acumulada

pbinom(c(4),size = 7,prob = 1/6)
## [1] 0.997996

Ahora si se quiere saber cuales son los valores de X aleatoria que cumplen con la probabilidad dada, procedemos a usar la función qbinom(), la cual arroja los valores de exito de la variable estudiada de la función

qbinom(c(0.9979),size = 7,prob = 1/6)
## [1] 4

En su forma no acumulativa se puede saber a tráves de la probabilidad, los valores resultantes

qbinom(c(0.27908165),size = 7,prob = 1/6)
## [1] 1

Este es el resultado de al menos tener un cinco.

Probabilidad Condicionada

Ahora para saber un valor en intervalos se usara la función pbinom() donde se especificara \(P[X>x]\) de la siguiente manera

Ejemplo: ¿Cuál es la probabilidad de obtener más de 3 cuatros en 9 tiradas? pbinom(c(3), size=9, prob=1/6, lower.tail=F) es la función de probabilidad acumulada

pbinom(c(3), size=9, prob=1/6, lower.tail=F)
## [1] 0.04802149

El resultado es que para obtener mayores o iguales resultados a cuatro en 9 tiradas es del 4.8% de probabilidad

Ejemplos

*Se realiza un Examen de 30 preguntas, cada pregunta tiene cinco respuestas, de las cuales solo una es la correcta, si el estudiante responde al azar se desea saber + ¿La probabilidad de que responda 5 correctas? + ¿Cuál es la probabilidad de acertar máximo a 10 respuestas correctas? + ¿Cuál es el conjunto de posibles aciertos , con probabilidad del 80%?

Para responder la primer inquietud se establece la probabilidad de éxito de cada una de las alternativas de las respuestas como \(Exito=\frac{1}{5}\) , ahora procedemos al código

Tabladeprobabilidad5exitos<-data.frame(pr=dbinom(0:30,size = 30,prob = 1/5))
row.names(Tabladeprobabilidad5exitos)<-0:30
Tabladeprobabilidad5exitos
##              pr
## 0  1.237940e-03
## 1  9.284550e-03
## 2  3.365649e-02
## 3  7.853182e-02
## 4  1.325224e-01
## 5  1.722792e-01
## 6  1.794575e-01
## 7  1.538207e-01
## 8  1.105586e-01
## 9  6.756361e-02
## 10 3.547089e-02
## 11 1.612313e-02
## 12 6.382074e-03
## 13 2.209179e-03
## 14 6.706437e-04
## 15 1.788383e-04
## 16 4.191523e-05
## 17 8.629607e-06
## 18 1.558123e-06
## 19 2.460195e-07
## 20 3.382768e-08
## 21 4.027105e-09
## 22 4.118630e-10
## 23 3.581417e-11
## 24 2.611450e-12
## 25 1.566870e-13
## 26 7.533029e-15
## 27 2.790011e-16
## 28 7.473243e-18
## 29 1.288490e-19
## 30 1.073742e-21

Ahora que se tiene en lista la probabilidad de cada una del nivel de acertividad de cada una de las respuestas se calcula la función de distribución

dbinom(5,size = 30,prob = 1/5)
## [1] 0.1722792

La probabilidad de acertar al menos 5 respuestas correctas es del 17.22%

Ahora para calcular la probabilidad máxima de acertar 10 respuestas se calcula de la siguiente manera

pbinom(c(10),size =30 ,prob =1/5 ,lower.tail = F)
## [1] 0.02561626

La probabilidad de que máximo responda 10 preguntas correctamente al azar es del 2.5%

Ahora para la última pregunta, el conjunto de menores aciertos necesarios al 80% se calcula de la siguiente manera

qbinom(c(0.80),size =30 ,prob =1/5 ,lower.tail = F)
## [1] 4

Ahora se sabe que dada la probabilidad del 80%, se espera que se respondan al azar bien máximo 4 respuestas.

Bibliografía

  1. Gutierrez & Hanwen (2010); “Teoria Estadistica”; Publicaciones Usta.

Webgrafia

Gracias