U2A6 Introduccion a la probabilidad frecuentista

La probabilidad frecuencial o frecuentista hace referencia a la definición de probabilidad entendida como el cociente entre el número de casos favorables y el número de casos posibles, cuando el número de casos tiende a infinito.

Se entiende por probabilidad frecuentista a la frecuencia relativa de un evento esperada en el largo plazo o luego de una secuencia de ensayos.

Cuantas más veces se repita el experimento, al final las posibilidades de que ocurra cada uno de los sucesos será regular. Aunque cualquier comportamiento sea aleatorio, por proceso empírico llegaremos a una regularidad. Es cuando se lanza un dado y suponiendo cuantas veces cae el número que se seleccionó.

La estadística que estamos acostumbrados a utilizar es la estadística frecuentista, que es la que se desarrolla a partir de los conceptos de probabilidad y que se centra en el cálculo de probabilidades y los contrastes de hipótesis.

Interpretacion frecuentista de la probabilidad

Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.

  • Veamos el ejemplo del lanzamiento de una moneda
lanzamientos_10 <- sample( c("A","S"),10, replace = TRUE    )
lanzamientos_10 
##  [1] "A" "S" "A" "S" "S" "A" "A" "S" "A" "S"

Ahora calcularemos la secuencia de frecuencias relativas del aguila

cumsum(lanzamientos_10 == "A")
##  [1] 1 1 2 2 2 3 4 4 5 5

Dividiendo

round(cumsum(lanzamientos_10 == "A") /1:10, 2)
##  [1] 1.00 0.50 0.67 0.50 0.40 0.50 0.57 0.50 0.56 0.50

Distribuciones en R:

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

  • Funciones en # para la distribuciones de frecuencia de probabilidad

Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f

Distribucion normal

Si X es una variable aleatoria con distribucion normal de media 3, y su desviacion estandar es de 0.5

  • La probabilidad de que X sea menor de 3.5 se calcula de la siguiente forma:
pnorm(3.5, mean = 3, sd=0.5)
## [1] 0.8413447
  • Ahora generemos numeros aleatorios con distribucion normal

vamos a generar 100 numeros con media 10 y desviacion estandar de 1

x <- rnorm(100, mean = 10, sd=1)
x
##   [1]  7.443657  9.638004 10.274244  7.792480  9.013700 10.386851 10.266814
##   [8]  8.540818 11.755363  9.899185 10.392759  8.387616  8.981392 10.620311
##  [15] 10.802465  9.828957 10.471261 10.339357 11.513970  9.494633 11.175243
##  [22] 10.647134  9.933582  9.316206  7.523413  9.232428 11.154425 10.091791
##  [29]  8.710600 10.457436 10.802458  7.784212  8.815781 10.458879 10.994532
##  [36]  8.041256 10.248104 10.926475 10.415695  9.319237 10.829548 10.982724
##  [43]  8.972979  9.925782  9.849025  8.818710  9.632847  9.859092 10.884005
##  [50] 10.359945 11.004286 10.961343 11.113214 10.826239  9.911820  9.375374
##  [57]  9.117476 11.103066 10.711003  9.287293  9.812423 11.425928 10.870032
##  [64] 10.275323 10.032270  7.667487  8.604296 10.741483  9.019874 10.372969
##  [71]  9.366496  9.813838  9.133948  9.543703  9.594867  9.427142  9.506105
##  [78]  9.209199 10.015463 10.389381 11.368667 10.205005  8.754671  9.634519
##  [85]  9.842449 10.551122  9.553419  9.646279 10.077234 10.170065 10.031828
##  [92] 10.028510  9.104968 10.656801 10.550377  9.740780  9.931080  9.688781
##  [99]  9.776862 10.262875

Ahora calculamos el promedio de estos numeros

promedio <- mean(x)
promedio
## [1] 9.89817

histograma de frecuencias absolutas

hist(x)

grafico de caja y bigote

boxplot(x)

Histograma de frecuencias con la curva normalizada

hist(x, freq = FALSE)
curve(dnorm(x, mean = 10, sd=1), from = 7, to =13, add=TRUE    )

Distribucion binomial

Generando 20 valores de exitos (1) versus fracasos (0) con una probabilidad de 0.5

x <- rbinom(20,1,0.5)
x
##  [1] 1 1 0 0 0 1 0 1 0 1 0 1 0 1 1 1 1 1 0 0

Contemos exitos versus fracasos

table(x)
## x
##  0  1 
##  9 11

Probabilidad binomial de obtener un 1

P <- 13/20
P
## [1] 0.65

Ejercicio distribucion binomial

Hay 12 preguntas de seleccion multiple en un examen

Cada pregunta tiene 5 alternativas y solo 1 es correcta

  • Calcule la probabilidad de obtener al menos 4 respuestas correctas si contestamos enteramente al azar
dbinom(0, size = 12, prob = 0.2) + 
dbinom(1, size = 12, prob = 0.2) +
dbinom(2, size = 12, prob = 0.2) +
dbinom(3, size = 12, prob = 0.2) +
dbinom(4, size = 12, prob = 0.2) 
## [1] 0.9274445

Tarea:

1.- Calcular la probabibilidad de obtener un valor menor a 9 si tenemos media de 8 y desviacion estandar de 2, usando la distribucion normal

2.- Generar 150 numeros aleatorios de media 5 y desviacion de 0.5 usando la distribucion normal

3.- Obtener media, media, mediana, moda de los datos generados (150) y grafico de caja y bigote

4.- De los datos generados obtener histograma de frecuencias absolutas e histograma con curva de distribucion normal superpuesta

5.- Genere un conteo y calculo de probabilidad de 30 numeros de forma binomial