Introduccion a la probabilidad frecuentista

La probabilidad frecuencial o frecuentista hace referencia a la definición de probabilidad entendida como el cociente entre el número de casos favorables y el número de casos posibles, cuando el número de casos tiende a infinito.

Se entiende por probabilidad frecuentista a la frecuencia relativa de un evento esperada en el largo plazo o luego de una secuencia de ensayos.

Cuantas más veces se repita el experimento, al final las posibilidades de que ocurra cada uno de los sucesos será regular. Aunque cualquier comportamiento sea aleatorio, por proceso empírico llegaremos a una regularidad. Es cuando se lanza un dado y suponiendo cuantas veces cae el número que se seleccionó.

La estadística que estamos acostumbrados a utilizar es la estadística frecuentista, que es la que se desarrolla a partir de los conceptos de probabilidad y que se centra en el cálculo de probabilidades y los contrastes de hipótesis.

Distribuciones en R:

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

Funciones en # para la distribuciones de frecuencia de probabilidad

Distribución binomial binom

Distribución de Poisson pois

Distribución normal norm

Distribución exponencial exp

Distribución t de Student t

Distribución Chi2 chisq

Distribución F f

Tarea

  1. Calcular la probabibilidad de obtener un valor menor a 9 si tenemos media de 8 y desviacion estandar de 2, usando la distribucion normal.
pnorm(9, mean = 8, sd=2)
## [1] 0.6914625
  1. Generar 150 numeros aletorios de media 5 y desviacion de 0.5.
x <- rnorm(150, mean = 5, sd=0.5)
x
##   [1] 5.287774 4.592335 4.893442 5.808995 5.220617 3.587975 5.695939 5.583526
##   [9] 4.600099 4.419116 5.216878 4.929849 5.606185 5.666490 4.712332 5.633431
##  [17] 5.399848 5.409604 4.942935 4.502828 5.819966 4.939683 5.105118 5.191863
##  [25] 4.273873 4.630566 5.166022 4.865424 5.311176 5.877387 5.330351 5.967952
##  [33] 4.610133 5.181568 5.285283 4.676027 5.525087 5.394973 5.153933 4.834163
##  [41] 5.068361 4.219289 6.000918 5.073385 5.072113 5.253385 5.257920 3.720985
##  [49] 4.602633 5.038010 5.133643 4.306503 5.053272 4.934886 4.172565 4.317016
##  [57] 5.249478 5.069481 4.566829 5.284661 4.858261 5.169458 5.390644 5.213355
##  [65] 4.661156 5.059011 4.318491 6.000883 5.171624 5.713055 4.194390 5.010131
##  [73] 4.774815 4.903443 4.621471 6.142409 5.830292 4.913567 4.950262 5.323896
##  [81] 4.999328 3.773900 5.012502 5.156234 4.026658 5.129758 4.566090 4.644807
##  [89] 5.412769 4.401630 4.679286 5.756084 4.531366 5.482116 5.364202 5.458581
##  [97] 6.340902 5.393641 4.122794 5.361050 5.866490 5.111937 5.009337 5.226232
## [105] 4.190592 4.755291 5.074419 5.109972 5.033319 5.309306 5.520605 5.487508
## [113] 5.018341 4.922413 5.506134 5.817343 5.787311 4.482400 4.553537 4.881845
## [121] 4.542284 4.632033 4.365440 4.435674 4.455856 5.725962 4.694979 5.259595
## [129] 5.183696 4.942895 4.837629 4.567323 4.726858 4.954784 5.208529 5.255373
## [137] 4.934759 4.429774 5.326852 5.027220 5.303868 4.523932 4.328061 5.192505
## [145] 5.107810 4.967979 5.482584 4.798115 4.385618 5.929292
  1. Obtener media, mediana, moda de los datos generados y grafico de caja y bigote
mean(x)
## [1] 5.02848
median(x)
## [1] 5.063686
library(modeest)
mfv(x)
##   [1] 3.587975 3.720985 3.773900 4.026658 4.122794 4.172565 4.190592 4.194390
##   [9] 4.219289 4.273873 4.306503 4.317016 4.318491 4.328061 4.365440 4.385618
##  [17] 4.401630 4.419116 4.429774 4.435674 4.455856 4.482400 4.502828 4.523932
##  [25] 4.531366 4.542284 4.553537 4.566090 4.566829 4.567323 4.592335 4.600099
##  [33] 4.602633 4.610133 4.621471 4.630566 4.632033 4.644807 4.661156 4.676027
##  [41] 4.679286 4.694979 4.712332 4.726858 4.755291 4.774815 4.798115 4.834163
##  [49] 4.837629 4.858261 4.865424 4.881845 4.893442 4.903443 4.913567 4.922413
##  [57] 4.929849 4.934759 4.934886 4.939683 4.942895 4.942935 4.950262 4.954784
##  [65] 4.967979 4.999328 5.009337 5.010131 5.012502 5.018341 5.027220 5.033319
##  [73] 5.038010 5.053272 5.059011 5.068361 5.069481 5.072113 5.073385 5.074419
##  [81] 5.105118 5.107810 5.109972 5.111937 5.129758 5.133643 5.153933 5.156234
##  [89] 5.166022 5.169458 5.171624 5.181568 5.183696 5.191863 5.192505 5.208529
##  [97] 5.213355 5.216878 5.220617 5.226232 5.249478 5.253385 5.255373 5.257920
## [105] 5.259595 5.284661 5.285283 5.287774 5.303868 5.309306 5.311176 5.323896
## [113] 5.326852 5.330351 5.361050 5.364202 5.390644 5.393641 5.394973 5.399848
## [121] 5.409604 5.412769 5.458581 5.482116 5.482584 5.487508 5.506134 5.520605
## [129] 5.525087 5.583526 5.606185 5.633431 5.666490 5.695939 5.713055 5.725962
## [137] 5.756084 5.787311 5.808995 5.817343 5.819966 5.830292 5.866490 5.877387
## [145] 5.929292 5.967952 6.000883 6.000918 6.142409 6.340902
boxplot(x)

  1. De los datos generados obtener histograma de frecuencia absolutas e histograma con curva de distribuccion normal superpuesta.
hist(x, freq = FALSE)
curve(dnorm (x, mean = 5, sd=0.5), from = 1.5, to =6.5, add=TRUE)

  1. Genere un conteo y calculo de probabilidad de 30 numeros de forma binomial
x <- rbinom(30,5,0.5)
x 
##  [1] 1 1 3 2 2 3 4 1 4 2 1 2 3 2 3 3 3 4 2 1 3 3 3 1 2 2 1 2 2 2
table(x)
## x
##  1  2  3  4 
##  7 11  9  3
A <- 1/30
A
## [1] 0.03333333