U1A5

Andrea Felix

16/2/2021

Introduccion a la probabilidad

“Probabilidad es el lenguaje matemático para cuantificar incertidumbre.” -Wasserman

  1. Terminología de probabilidad: espacio de resultados, eventos, funciones de probabilidad, etc.

  2. Interpretación frecuentista de probabilidad.

  3. Probabilidad condicional y su relación con independencia.

  4. La regla de Bayes.

Espacio de resultados y eventos

El espacio de resultados \(\Omega\) es el conjunto de posibles resultados de un experimento aleatorio.

Ejemplo: Si lanzamos una moneda dos veces entonces:

\[ \Omega = \{AA, AS, SA, SS \} \] Escribe el espacio muestral de los siguientes experimentos aleatorios:

  • El número de lanzamientos de un dado hasta que obtienes un 6.
  • Tu calificación final en el curso.
  • El tiempo en minutos hasta tu próximo estornudo.
  • El peso de una lata de Coca-Cola (incluyendo el líquido).

Un evento es un subconjunto del espacio muestral, los eventos usualmente se denotan por letras mayúsculas.

El evento: que el primer lanzamiento resulte águila es

\[ A = \{AA, AS\} \]

Eventos Equiprobables

La probabilidad se puede ver como una extensión de la idea de proporción, o cociente de una parte con respecto a un todo. Si en la carrera de química tenemos:

  • 300 estudiantes hombres
  • 700 estudiantes mujeres

la proporción de hombres es:

\[ \frac{300}{700+300}=0.3\ \]

Ahora, supongamos que elegimos un estudiante al azar, la probabilidad de elegir una mujer es 0.7.

En el ejemplo hay un supuesto implícito en elegir al azar (o aleatoria mente), en este caso estamos suponiendo que todos los estudiantes tienen la misma probabilidad de ser elegidos, que nos lleva al siguiente concepto:

Eventos equiprobables. Si todos los elementos en el espacio de resultados tienen la misma oportunidad de ser elegidos entonces la probabilidad del evento A es el número de resultados en A dividido entre el número total de posibles resultados:

\[ P(A)=\frac{\#(A)}{\#(\Omega)} \]

Ejemplo: combinaciones

Un comité de 5 personas será seleccionado de un grupo de 6 hombres y 9 mujeres. Si la selección es aleatoria, ¿cuál es la probabilidad de que el comité este conformado por 3 hombres y 2 mujeres?

Hay \(\dbinom{15}{5}\) posibles comités, cada uno tiene la misma posibilidad de ser seleccionado.

Por otra parte hay \(\dbinom{6}{3} \dbinom{9}{2}\) posibles comités que incluyen 3 hombres y 2 mujeres, por lo tanto, la probabilidad que buscamos es:

\[ \frac{\dbinom{6}{3} \dbinom{9}{2}}{\dbinom{15}{5}} \]

La función para calcular las combinaciones en R (random) es choose(n, r)

choose (6, 3) * choose(9, 2) / choose (15, 5)
## [1] 0.2397602

Interpretación frecuentista de probabilidad

Las probabilidades se entienden como una aproximación matemática de frecuencias relativas cuando la frecuencia total tiende a infinito.

Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.

Supongamos que lanzamos una moneda 10 veces y obtenemos:

lanzamientos_10 <- sample(c("A", "S"),10, replace = TRUE )
lanzamientos_10
##  [1] "A" "A" "A" "S" "A" "S" "S" "S" "S" "A"

Podemos calcular la secuencia de frecuencias relativas de águilas:

cumsum(lanzamientos_10 == "A") # Suma acumulada de aguilas
##  [1] 1 2 3 3 4 4 4 4 4 5

Dividiendo

round(cumsum(lanzamientos_10 == "A") / 1:10, 2)
##  [1] 1.00 1.00 1.00 0.75 0.80 0.67 0.57 0.50 0.44 0.50

Distribucion de probabilidad

Funciones en R

En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

  • Distribucion Alias
  • Distribucion binomial binom
  • Distribucion de Poisson pois
  • Distribucion normal norm
  • Distribucion exponencial exp
  • Distribucion t de Student t
  • Distribución Chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribucion exponencial

curve(dexp(x), from=0, to=10)

Distribucion binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 1 0 1 1 1 0 1 0 1 0 1 0 1 1 0 1 1 1 0

#Genera 20 observaciones con distribución B(1,0.5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
##  7 13

e.g. Distribucion normal

Si \(x\) es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447

*Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que:

qnorm(0.7)
## [1] 0.5244005

*Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5

qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964

*Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean=10, sd=1 )
x
##   [1]  9.243618 10.037121  9.507964 11.128411  9.910753  8.124162 10.517965
##   [8] 12.330604 10.358555  9.792823 10.852305 12.152497  9.151246 10.141712
##  [15]  9.094494 11.996842 10.026503 10.730031 10.292724 11.449689  9.855841
##  [22] 10.058455 10.427673  9.820249 11.251635  9.841635  8.278460  8.862161
##  [29] 10.273211  8.446387  9.557407  9.579650  9.633608  8.537419  8.810709
##  [36]  9.718699 10.279275 10.007070  8.426697 10.339001 10.461477  9.240610
##  [43] 11.889390 10.729843  9.015250 11.083907 11.129432 11.317930 11.185538
##  [50]  8.816911 11.348830 11.880794  9.253782 11.778056  8.968729 10.209439
##  [57]  8.911560 10.391996  8.957303 10.371161  8.468000  8.396076  9.842913
##  [64] 10.722005 10.498441 11.187695  9.641884 10.640098 10.578672 10.660415
##  [71] 10.111984  9.330948  8.451030 10.558988  9.744426 11.530208 10.846721
##  [78]  9.706251 11.038536  9.294460  9.051711 10.391537 12.075045  8.894795
##  [85] 10.789362  7.725236  8.877436 10.088243  9.706436  9.592889  9.670479
##  [92] 10.140153 10.950264 10.078842  9.797742 10.223325 11.343908 10.328055
##  [99]  9.161323  9.429350

*Para estimar el promedio de x

mean(x)
## [1] 10.05353

*Histograma de frecuencias

hist(x)

*Gráfico de cajas y bigote

boxplot(x)

*Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:

hist(x, freq=FALSE)
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si Z es una variable con distribución normal estándar, calcula P(−2.34<Z<4.78).
pnorm(4.78,sd = 1) - pnorm(-2.34, sd = 1)
## [1] 0.9903573
  1. Calcula el rango intercuartílico de una población normal estándar.

  2. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

x <- rnorm(10)
x
##  [1]  1.1410469 -0.3123466  0.6235964 -1.0971817 -0.5581714  0.9223970
##  [7] -0.7145742  0.3996316  1.3860108 -1.0159789
  • La primera vez el max fue: 2.2381 y min fue: -1.7569
  • La segunda vez el max fue: 1.8335 y min fue: -1.3476
  • La tercera vez el max fue: 0.6503 y min fue: -1.5937

Media

mean(x)
## [1] 0.077443
  1. Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
x <- rpois(1000,1)
x
##    [1] 1 1 2 2 4 1 4 0 0 2 2 1 1 3 0 2 0 0 3 2 0 1 2 2 0 1 0 2 2 0 1 2 0 2 1 0 1
##   [38] 0 1 1 0 0 3 2 1 1 1 0 3 0 0 1 1 5 1 0 1 1 1 1 0 2 0 3 0 0 1 1 2 0 1 1 0 1
##   [75] 0 3 1 2 1 3 1 0 2 2 4 1 1 3 1 1 1 2 1 0 1 1 1 0 1 0 0 1 0 1 3 0 0 2 0 1 0
##  [112] 1 1 1 1 2 0 0 1 2 0 0 3 1 4 0 0 1 1 1 0 0 3 0 1 0 0 2 1 0 0 1 1 0 3 1 1 1
##  [149] 1 1 0 1 1 1 0 0 1 2 0 1 1 1 0 0 1 0 1 1 0 1 3 0 0 2 2 0 0 1 1 0 0 0 1 1 0
##  [186] 0 1 4 2 3 3 2 0 1 1 0 3 1 0 0 2 0 2 1 0 1 2 1 1 3 0 0 1 1 1 1 1 2 3 0 0 0
##  [223] 1 0 1 0 2 0 0 2 1 1 2 1 0 2 0 2 1 0 0 0 2 5 0 1 0 2 1 1 2 0 0 0 0 0 1 1 2
##  [260] 1 0 1 1 2 2 1 0 1 2 0 1 0 1 0 3 2 1 0 1 2 2 1 0 1 2 0 2 0 0 0 0 2 1 0 1 1
##  [297] 0 1 1 0 0 0 0 0 1 0 2 2 0 0 1 1 0 0 1 1 2 0 1 3 5 1 2 2 1 2 1 0 1 1 2 1 1
##  [334] 2 3 2 0 2 0 0 0 0 0 2 1 3 3 1 0 1 3 0 4 1 0 0 0 1 1 1 0 0 0 0 3 1 0 1 1 2
##  [371] 1 2 1 2 0 2 0 1 1 0 3 0 1 1 0 0 1 2 1 4 0 0 2 0 1 0 1 0 1 1 2 1 0 2 1 1 0
##  [408] 1 2 0 1 0 1 0 2 0 1 1 1 1 1 2 0 0 2 0 1 3 2 0 0 0 0 0 0 0 1 0 0 1 1 0 1 2
##  [445] 1 1 1 0 2 1 1 1 2 1 4 2 1 1 0 0 2 1 1 1 3 0 4 0 1 1 0 1 0 2 5 0 1 1 1 0 1
##  [482] 0 0 1 1 1 1 0 0 1 1 1 1 0 1 1 0 1 0 0 1 2 3 2 1 1 0 0 2 0 1 1 3 2 0 1 1 1
##  [519] 0 1 1 0 1 1 3 1 2 1 2 1 1 0 0 0 1 0 0 4 2 0 1 2 3 2 1 0 2 1 1 0 0 1 1 1 0
##  [556] 1 2 3 1 1 2 1 2 1 1 2 0 1 1 2 1 1 1 1 0 2 0 1 0 0 1 1 0 1 1 1 0 0 1 3 1 0
##  [593] 1 0 1 3 1 3 0 1 0 0 0 0 0 2 1 1 0 1 1 2 2 0 0 1 0 1 2 0 0 3 1 1 1 2 1 2 3
##  [630] 1 1 1 1 0 2 1 2 1 1 0 0 1 0 0 2 1 0 0 0 2 2 0 1 0 1 0 0 0 1 0 1 0 2 0 3 3
##  [667] 0 1 0 1 1 2 0 2 0 1 0 0 0 0 2 2 2 0 1 1 2 0 1 2 0 1 0 2 3 2 0 0 0 1 0 2 2
##  [704] 1 1 1 3 0 1 1 0 1 2 0 0 0 1 1 3 0 0 0 1 2 0 0 1 3 0 1 2 0 1 2 0 0 2 0 2 0
##  [741] 0 1 3 1 2 1 2 1 0 0 2 0 1 1 1 0 3 0 3 1 1 0 2 1 0 1 0 2 1 0 0 1 0 2 0 1 1
##  [778] 1 2 0 2 0 1 1 1 1 0 0 1 1 1 0 4 0 1 1 0 1 0 3 1 1 2 0 1 0 0 3 2 2 0 2 1 0
##  [815] 1 1 0 1 0 1 0 3 0 0 1 0 1 1 0 1 0 2 1 1 2 1 2 2 2 1 0 1 0 0 2 0 0 2 1 1 0
##  [852] 2 2 1 1 1 0 0 1 3 2 1 0 0 1 1 0 1 0 1 1 3 1 3 1 2 0 2 0 2 2 0 1 0 0 2 2 1
##  [889] 1 1 0 0 1 1 0 1 0 0 1 1 1 0 1 0 1 2 1 1 2 0 0 2 3 3 0 2 1 2 0 0 1 0 0 0 0
##  [926] 1 1 2 1 0 0 0 2 1 1 2 2 0 0 2 4 1 0 1 0 2 1 5 1 1 1 1 2 0 1 1 0 0 1 0 0 2
##  [963] 0 1 0 1 0 0 2 0 0 1 4 1 2 1 2 2 0 1 2 1 5 1 1 1 2 0 0 2 0 1 1 0 3 1 1 1 0
## [1000] 2

Media

mean(x)
## [1] 0.99

Varianza

var(x)
## [1] 0.9708709
  1. Calcula con R los Siguientes valores: t3,α, χ23,α, para α=0.05 y α=0.01. compara los valores obtenidos con los que aparecen en las correspondientes

*0.05

qt(0.05, df = 3)
## [1] -2.353363

*0.01

qt(0.01, df = 3)
## [1] -4.540703

Conclusion

En esta practica se vio todo acerca de la distribucion de la probabilidad, donde se encuentran todos los valores posibles de un ejercicio en si. Se vio como hacer los distintos tipos de distribuciones, como exponencial, binomial, normal, entre otras, asi como su representacion grafica.