Daniel Jimenez
Jacobo Bernulli (1654) posee una historia telurica, de origen Sueco, estudio Teología en la universidad, más su pasión secreta eran la física y las matemáticas.
Gracias a distintas charlas con su hermano y el estudio de la mecánica clásico invento o genero los Cálculos de variaciones y de ahí salio las teorias de las probabilidades.
Su trabajo fue influido por la geometria de Descartes y los aportes teoricos de Van Schooten.
Su texto El arte de la conjetura destaca lo que sería más adelante conocido como la distribución binomial, que hace parte de las distribuciones discretas, que son aquellas que toman un valor finito o enumerable entre sus posibilidades.
La función de densidad de la distribución discreta es
\[ f(x) = Pr(X=x)=\frac{1}{N}{I(1,2,3,...N)}(x)\]
Donde se describe un experimento aleatorio que puede tomar un número finito de resultados y por lo tanto su probabilidad de ocurrencia es la misma para cada evento dado.
Este tipo de experimentos tiene dos tipos de resultado \({(0;1)}\) o \({(Exito ;Fracaso)}\)
En el contexto del desarrollo teorico de la teoria de la conjetura la posibilidad en el azar de exito o fracaso, teniendo en cuenta que estos casos son ocultos sus resultados y se desarrollan de la siguiente manera \[(r+s) # Casos posibles\] \[r #número de casos favorables ocultos\]
La capacidad de ocurrencia de cada evento se desarrolla en experimentos p, donde r y s son números naturales
\[p=\frac{r}{(r+s)}\] donde
\[n # es el número de exeprimentos \] \[S_n # es el número de éxitos\] \[\hat{p}_n=\frac{S_n}{n}\] #es la frecuencia relativa \[\varepsilon=\frac{1}{(r+s)}\]
Los resultados principales se dan de la siguiente manera \(Dado X>0\), se entiende que \(N\ge\) 1 tal que \[P_r(|\hat{p_N}-p|\le\varepsilon)>cP_r(|\hat{p_N}-p|\ge\varepsilon)\]
Entiendiendo que \(c>0\) se entiende que \(N\ge 1\) , tal que
\[P_r(|\hat{p_N}-p|\le \frac{1}{(s+r)})>cP_r(|\hat{p_N}-p|>\frac{1}{(s+r)})\]
Si se poseen mayor cantidad de datos que construyan la frecuencia relativa, entonces se estara más cerca a la verdad de las observaciones y eventos.
El intento es predecir el futuro, entendiendo que hay resultados o circustancias ocultas
*Se debe cuantificar la incertidumbre en una metrica entendible.
La probabilidad es el grado de certidumbre de un evento, pero esta misma posee un margen de error o aleatoriedad
Postulo: Un evento es más probable si su nivel de certeza excede el 50% , aunque si se dan niveles de certezas bajos, hay que tenerlos en cuenta, solo para predicciones futuras.
Lo anterior sirvio para desarrollar la teoria de las decisiones, teniendo en cuenta la cliometria de los datos.
Predecir un suceso es medir su probabilidad
*Lo anterior da pie a el estudio de los modelos estocasticos, que se definen como la ciencia que intena medir de manera precisa que las decisiones se pueden regir por una de las mejores alternativas.
*Solo se encontro un problema para el desarrollo de los modelos estocasticos, el tamaño de la muestra.
Se proponen dos metodos para calular la muestra.
\[n=\frac{Z_a^2*p*q}{d^2}\] Donde:
Z es el nivel de confiaza p es la probabilidad de exito q es la probabilidad de fracaso d Error maximo permitido.
\[n=\frac{N*Z^2_a*p*q}{d^2*(N-1)+Z^2_a*p*q}\] Donde
N es el tamaño de la muestra Z es el nivel de confianza p es la probabilidad de exito q es la probabilidad de fracaso *d es el margen de error permitido.
Si \(f(x)\ge 0\) para cada valor dentro de su dominio, entonces \(\sum f(x)= 1\), donde la sumatoria explica y pasa por todos los valores del dominio.
En el caso de la distribución acumulativa se da \[ F(x)=(PX\le x)= \sum_{t\le x} f(t) \forall -\infty \le x \le \infty\]
teniendo en cuenta la esperanza matemática como:
\[\mu=E(x)=\sum_{x}xf(x) \] Este es el valor en promedio que pueden tomar todas los valores dentro de una variable. Es una medida de centralidad.
La varianza por su parte es la medida de las distancia de los datos al cuadrado, con respecto a su promedio. Por lo tanto su \(f(x)\) es una función de distribución con promedio \(\mu\) , la varianza se calcula de la siguiente manera:
\[\sigma^2=E[(X-\mu)^2]=\sum_x (x-\mu)^2 f(x)\]
La desviación estandar por su parte, es la medida de disperción de la varianza , pero sometida a la raiz cuadrada para obtener valores positivos de las distancias sobre el promedio, por ello se calcula de la siguiente manera:
\[\sigma=\sqrt {\sum_x (x-\mu)^2 f(x)}\]
Si la variable aleatoria de \(X\) toma valores \([{x_1,x_2,...x_n}]\) con probabilidades iguales , entonces la distribución adquiere la siguiente forma:
\(f(x;k)=\frac{1}{k}\) donde x adquiere la forma \(x=x_1,x_2,..x_n\) y su media se calcula de la manera
\[\mu =\frac {\sum_{i=1}^k f(x_i)}{k}\]
y su varianza
\[ \sigma^2 =\frac {\sum_{i=1}^k (f(x_i)-\mu)}{k}\]
Se realizan experimentos en los cuales solo existen dos posibilidades en sus resultados
\[ Exp(n) = \left \{ \begin{matrix} Exito & \mbox{donde } Exito\mbox{ es p} \\ Fracaso & \mbox{si } Fracaso\mbox{ es 1-p}\end{matrix}\right. \]
Entendiendo que la probabilidad de exito p está dada por la forma de probabilidad *{0
“En la vida practica, se presetan muchos ensayos del tipo Bernulli, por ejemplo: El éxito o fracaso de un correo electrónico ofreciendo algún servicio o producto. En la teoria del muestreo la pertenencia de un elemento de la población en la muestra también tiene distribución Bernulli”[^1] Hanwen & Gutierrez; “Teoria Estadistica, sus aplicaciones y sus metodos”; 2010; Editorial Usta
La función de densidad del tipo Bernulli se defince como Una variable aleatoria X tiene distribución del tipo Bernulli con parametros p (0,1) si su función de densidad esta dada por
\[f_X(x)=p^x(1-p)^{1-x}I_{(0,1)}(X)\] Se denota como \(X \sim Ber (p)\)
Si \(X\) es una variable aleatoria con \(X \sim Ber (p)\) y posee el parámetro p entonces:
\(E(X)= p.\)
\(Var(X)=p(1-p)\)
\(m_x(t)=pe^t+1-p\)
En la realidad no se aplica un solo tipo de ensayo tipo Bernulli, sino una serie de ellos, por ejemplo cuando se hace una encuesta sobre la percepción de la gestión de un Alcalde se le pregunta a \(n>1\) de personas , para entender así la calificación p{Exito, Fracaso} de la gestión.
Lo anterior indica que lo que nos interesa es el número de exitos en n ensayos del tipo Bernulli , A esto se le conoce como distribución Binomial
*Una variable aleatoria de X tiene distribución binomial con los parámetros $ n $ y \(p \varepsilon (0,1)\) si su función de densidad está dada por:
\[ f_X(x)=Pr(X=x)= \begin{pmatrix} n \\ x \end{pmatrix} p^x(1-p)^{n-x}I_{(0,1,...n)}(x) \] Está distribucuón se denota \(X \sim Ber (n,p)\)
Si se tiene en cuenta , que en el número de ensayos las repeticiones son independientes, en un mismo experimento del tipo Bernulli, y su probabilidad de exito se denota p, entonces el número de exitos obtenidos durante las repeticiones poseen la distribución $ Bin (n,p)$
Los valores que toma X son enteros entre los intervalos \({0,n}\)
Donde se le denota 0 a todos los ensayos que fracasaron y n a todos los éxitos.
En una introducción al código sería
rbinom(10,30,0.35) # Quiere decir que de 10 experimentos exitosos observados en 30 repeticiones que tienen una probabilidad del 35%## [1] 5 10 13 15 12 9 12 10 13 5
plot(rbinom(10,30,0.35), type = "h", col=0:10)2.\(Var(X)= np(1-p)\)
3.\(m_X(t)=(pe^t+1-p)^n\)
Ejemplo: De cada 200 correos que se envien,la probabilidad de ser vistos es del 5%, entonce aproximadamente 10 personas vieron el correo.
Para poder generar observaciones del tipo binomial se recurre al código rbinom, este nos permite simular el número de valores provenientes de una distribución.
x<-rbinom(100,8,0.25)
hist(x)Un tipico ejemplo de dados: tirar el dado siete veces , ¿Cúal es la probabilidad de obtener 3 cincos?
*Se calcula la probabilidad que caiga cualquier número (Independencia marcada en la teoria de Bernulli)
Un dado tiene seis caras, por cada tirada su probabilidad está dada por
\[ Pr(dado)=\frac{1}{6}=0,16666..\bar{7}\]
\[Per(Dado)= \frac{7!}{3!4!}=35 \] Es el número de combinaciones que tiene para caer el dado
Las permutaciones se definen como: Es la cantidad de variaciones de orden que tienen los sucesos, en la cual no se repite los elementos.
Ejemplo: ¿Cuántas veces se puede ordenar los números {1,2,3}? R Se pueden ordenar de seis maneras = “1,2,3”, “1,3,2”, “2,1,3”, “2,3,1”, “3,1,2” y “3,2,1”.
De donde se tomo el valor seis?, el número más alto es 3 ( contiene al resto de caracteres del vector), por lo tanto se multiplica por cada uno de sus componentes
\[3!= 3*2*1=6\]
En el ejemplo del dado la permutación se calcula de cuantas maneras se pueden dar estás posibilidades, o de cuantas maneras se pueden ordenar los éxitos y fracasos.
Por lo tanto
\[ Per(dado)=\frac{n!}{p!(1-p)!}\] Donde * n es el número de experimentos independientes * p es el número de exitos * (1-p) es el número de fracasos
Entonces la permutación de los dados según el enunciado se da de la siguiente manera
\[ Per(dados)=\frac{7!}{3!4!}\]
Expandiendo una parte de la operación
\[ Per(dados)=\frac{7*6*5*4*3*2*1}{3!4!}\]
Se puede ver que se puede eliminar el factorial de cuatro
\[Per(dados)=\frac{7*6*5*\not4*\not3*\not2*\not1}{3!*\not4*\not3*\not2*\not1}\]
Por lo tanto la operación queda
\[Per(dados)=\frac{7*6*5}{3*2*1}= \frac{210}{6}= 35\]
\[ Exito(Dados)=\frac{1}{6}\]
\[Fracaso(dados)=1-\frac{1}{6}=\frac{5}{6}\]
\[p(Dados)=35·\frac{1}{6}·\frac{1}{6}·\frac{1}{6}·\frac{5}{6}·\frac{5}{6}·\frac{5}{6}·\frac{5}{6}\]
Entonces
\[p(Dados)=0.078\]
Se plantea el problema de la siguiente manera \(Bin(7,\frac{1}{6})\) donde se busca \(P(X=3)\)
Entonces se plantea la función de densidad que en r esta dada por dbinom(x, size, prob, log = F) donde
La función de densidad se plantea de la siguiente manera dbinom(3,7,1/6) se deja asi, ya que por defecto se toma el log como false y entonces
dbinom(3,7,1/6)## [1] 0.07814286
El resultado es que la probabilidad de tener 3 tiradas con valor 5 del 7.8%
Si se quiere condicionar la probabilidad recurrimos a los siguientes parametros
Suponga que ahora se desea saber cual es la probabilidad de obtener valores menores o iguales en 4 jugadas de 5 , dentro de las siete tiradas. Entonces procedemos a definir nuevamente el espacio muestral como $ = {1,2,3,4,5,6}$. Paso seguido se establece la función de densidad como dbinom(c(4,3,2,1,0),7,1/6) que daría por resultado
dbinom(c(4,3,2,1,0),7,1/6) ## [1] 0.01562857 0.07814286 0.23442858 0.39071431 0.27908165
El resultado que nos dio, fue que la probabilidad de sacar 4 cincos es del 1.5%, la de 3 es del 7.8% la de obtener al menos dos es del 23.44% , la de obtener al menos un cinco es del 39% y la de ninguno es del 27.9%
Notece que el valor máximo es del 39.07% con una tirada, esto ayuda a la toma de decisiones.
Si queremos saber la probabilidad total , en vez de la individual hacemos lo siguiente
sum(dbinom(c(4,3,2,1,0),7,1/6))## [1] 0.997996
La probabilidad total de las alternativas para el valor cinco es del 99.79%
Otra manera de calcular esto es a tráves de la función de probabilidad que en código es pbinom, que devuelve los valores de la distribución en su forma acumulada
pbinom(c(4),size = 7,prob = 1/6)## [1] 0.997996
Ahora si se quiere saber cuales son los valores de X aleatoria que cumplen con la probabilidad dada, procedemos a usar la función qbinom(), la cual arroja los valores de exito de la variable estudiada de la función
qbinom(c(0.9979),size = 7,prob = 1/6)## [1] 4
En su forma no acumulativa se puede saber a tráves de la probabilidad, los valores resultantes
qbinom(c(0.27908165),size = 7,prob = 1/6)## [1] 1
Este es el resultado de al menos tener un cinco.
Ahora para saber un valor en intervalos se usara la función pbinom() donde se especificara \(P[X>x]\) de la siguiente manera
Ejemplo: ¿Cuál es la probabilidad de obtener más de 3 cuatros en 9 tiradas? pbinom(c(3), size=9, prob=1/6, lower.tail=F) es la función de probabilidad acumulada
pbinom(c(3), size=9, prob=1/6, lower.tail=F)## [1] 0.04802149
El resultado es que para obtener mayores o iguales resultados a cuatro en 9 tiradas es del 4.8% de probabilidad
*Se realiza un Examen de 30 preguntas, cada pregunta tiene cinco respuestas, de las cuales solo una es la correcta, si el estudiante responde al azar se desea saber + ¿La probabilidad de que responda 5 correctas? + ¿Cuál es la probabilidad de acertar máximo a 10 respuestas correctas? + ¿Cuál es el conjunto de posibles aciertos , con probabilidad del 80%?
Para responder la primer inquietud se establece la probabilidad de éxito de cada una de las alternativas de las respuestas como \(Exito=\frac{1}{5}\) , ahora procedemos al código
Tabladeprobabilidad5exitos<-data.frame(pr=dbinom(0:30,size = 30,prob = 1/5))
row.names(Tabladeprobabilidad5exitos)<-0:30
Tabladeprobabilidad5exitos## pr
## 0 1.237940e-03
## 1 9.284550e-03
## 2 3.365649e-02
## 3 7.853182e-02
## 4 1.325224e-01
## 5 1.722792e-01
## 6 1.794575e-01
## 7 1.538207e-01
## 8 1.105586e-01
## 9 6.756361e-02
## 10 3.547089e-02
## 11 1.612313e-02
## 12 6.382074e-03
## 13 2.209179e-03
## 14 6.706437e-04
## 15 1.788383e-04
## 16 4.191523e-05
## 17 8.629607e-06
## 18 1.558123e-06
## 19 2.460195e-07
## 20 3.382768e-08
## 21 4.027105e-09
## 22 4.118630e-10
## 23 3.581417e-11
## 24 2.611450e-12
## 25 1.566870e-13
## 26 7.533029e-15
## 27 2.790011e-16
## 28 7.473243e-18
## 29 1.288490e-19
## 30 1.073742e-21
Ahora que se tiene en lista la probabilidad de cada una del nivel de acertividad de cada una de las respuestas se calcula la función de distribución
dbinom(5,size = 30,prob = 1/5)## [1] 0.1722792
La probabilidad de acertar al menos 5 respuestas correctas es del 17.22%
Ahora para calcular la probabilidad máxima de acertar 10 respuestas se calcula de la siguiente manera
pbinom(c(10),size =30 ,prob =1/5 ,lower.tail = F)## [1] 0.02561626
La probabilidad de que máximo responda 10 preguntas correctamente al azar es del 2.5%
Ahora para la última pregunta, el conjunto de menores aciertos necesarios al 80% se calcula de la siguiente manera
qbinom(c(0.80),size =30 ,prob =1/5 ,lower.tail = F)## [1] 4
Ahora se sabe que dada la probabilidad del 80%, se espera que se respondan al azar bien máximo 4 respuestas.