La probabilidad frecuencial o frecuentista hace referencia a la definición de probabilidad entendida como el cociente entre el número de casos favorables y el número de casos posibles, cuando el número de casos tiende a infinito.
Se entiende por probabilidad frecuentista a la frecuencia relativa de un evento esperada en el largo plazo o luego de una secuencia de ensayos.
Cuantas más veces se repita el experimento, al final las posibilidades de que ocurra cada uno de los sucesos será regular. Aunque cualquier comportamiento sea aleatorio, por proceso empírico llegaremos a una regularidad. Es cuando se lanza un dado y suponiendo cuantas veces cae el número que se seleccionó.
La estadística que estamos acostumbrados a utilizar es la estadística frecuentista, que es la que se desarrolla a partir de los conceptos de probabilidad y que se centra en el cálculo de probabilidades y los contrastes de hipótesis.
Una frecuencia relativa es una proporción que mide que tan seguido, o frecuente, ocurre una u otra cosa en una sucesión de observaciones.
Veamos el ejemplo del lanzamiento de una moneda
lanzamientos_10 <- sample( c("A","S"),10, replace = TRUE )
lanzamientos_10
## [1] "A" "A" "A" "S" "S" "A" "A" "A" "S" "S"
Ahora calcularemos la secuencia de frecuencias relativas del aguila
cumsum(lanzamientos_10 == "A")
## [1] 1 2 3 3 3 4 5 6 6 6
Dividiendo
round(cumsum(lanzamientos_10 =="A") /1:10,2)
## [1] 1.00 1.00 1.00 0.75 0.60 0.67 0.71 0.75 0.67 0.60
$$
Funciones en # para la distribuciones de frecuencia de probabilidad
Distribución binomial binom
Distribución de Poisson pois
Distribución normal norm
Distribución exponencial exp
Distribución t de Student t
Distribución Chi2 chisq
Distribución F f
Si X es una variable aleatoria con distribucion normal de media 3, y su desviacion estandar es de 0.5
La probabilidad de que X sea menor de 3.5 se calcula de la siguiente forma:
pnorm(3.5, mean = 3, sd=0.5)
## [1] 0.8413447
Ahora generemos numeros aleatorios con distribucion normal, vamos a generar 100 numeros con media 10 y desviacion estandar de 1
x <- rnorm(100, mean = 10, sd=1)
x
## [1] 10.801532 10.803727 10.220265 10.004460 10.822935 11.208701 10.132948
## [8] 9.551166 9.309044 11.330007 10.416632 11.468576 8.737121 9.798252
## [15] 11.345587 10.475059 11.612989 8.266714 10.083905 9.467845 9.845668
## [22] 8.107984 9.070136 10.448707 8.980961 8.650786 11.306951 9.711553
## [29] 11.327337 11.070731 12.032024 11.275513 10.933558 9.285782 9.592860
## [36] 10.181541 10.275071 9.052705 11.212945 11.279467 9.168130 11.188454
## [43] 10.429066 11.215871 8.263291 10.483992 10.802571 10.422819 10.821653
## [50] 9.660096 11.587962 9.713754 11.602509 11.425506 10.540644 9.710461
## [57] 11.449647 10.531660 10.955076 9.848042 8.989054 11.946419 11.527962
## [64] 10.091930 10.587388 9.975039 10.409318 9.291258 10.230209 11.160359
## [71] 8.441536 10.384214 11.609425 11.047350 9.788084 8.341352 10.069708
## [78] 9.844138 10.308232 10.012933 8.573291 9.374565 9.859427 8.417312
## [85] 10.344674 10.480244 8.987534 11.412828 11.638370 11.195751 9.472550
## [92] 11.123537 9.792239 9.215060 11.170124 10.208905 9.943429 9.850311
## [99] 10.145615 9.755612
Ahora calculamos el promedio de estos numeros
promedio <- mean (x)
promedio
## [1] 10.24338
hist(x)
boxplot(x)
hist(x, freq =FALSE)
curve(dnorm(x, mean =10, sd=1), from =7, to =13, add=TRUE)
Generando 20 valores de exitos (1) versus fracasos (0) con una probabilidad de 0.5
x <- rbinom(20,1,0.5)
x
## [1] 0 0 0 1 1 0 0 0 1 0 1 1 1 1 1 0 1 0 1 0
Contemos exitos versus fracasos
table(x)
## x
## 0 1
## 10 10
Probabilidad binomial de obtener un 1
P <- 13/20
P
## [1] 0.65
Hay 12 preguntas de seleccion multiple en un examen
Cada pregunta tiene 5 alternativas y solo 1 es correcta
Calcule la probabilidad de obtener al menos 4 respuestas correctas si contestamos enteramente al azar
dbinom(0, size = 12, prob = 0.2) +
dbinom(1, size = 12, prob = 0.2) +
dbinom(2, size = 12, prob = 0.2) +
dbinom(3, size = 12, prob = 0.2) +
dbinom(4, size = 12, prob = 0.2)
## [1] 0.9274445
Calcular la probabibilidad de obtener un valor menor a 9 si tenemos media de 8 y desviacion estandar de 2, usando la distribucion normal
pnorm(9, mean = 8, sd=2)
## [1] 0.6914625
Generar 150 numeros aleatorios de media 5 y desviacion de 0.5 usando la distribucion normal
x <- rnorm(150, mean =5, sd=0.5)
x
## [1] 5.003263 5.019282 4.901922 5.607714 4.551609 5.008033 4.479123 4.248276
## [9] 6.025297 5.560082 5.511335 5.130669 5.196994 5.428974 4.954005 3.818399
## [17] 5.409065 4.898559 4.394150 5.723985 5.969838 5.271145 5.581803 5.002679
## [25] 4.748989 4.250265 4.632387 4.923172 5.025233 5.528950 4.173165 4.615440
## [33] 4.391507 5.039629 4.886370 4.308758 5.544080 5.194576 4.839025 6.079803
## [41] 5.552931 4.654935 5.043678 4.709585 5.443985 5.462685 4.991971 5.564529
## [49] 5.042630 4.952600 5.422579 4.662980 5.157430 4.370546 4.863838 5.682193
## [57] 5.188963 4.492941 5.162403 4.573969 3.996824 4.644668 4.524737 5.725519
## [65] 4.076144 4.810770 5.342696 4.636095 5.057648 4.316808 5.012870 4.885782
## [73] 6.038457 4.803783 5.105612 5.727653 5.522871 5.585284 4.926244 5.452437
## [81] 4.604446 4.525015 4.340230 6.265141 3.808564 4.659720 5.692705 5.410085
## [89] 4.952328 4.077442 5.228459 4.493375 5.083455 4.712301 4.724987 5.337519
## [97] 4.507534 5.672431 5.138491 5.097020 5.592253 5.393138 4.732190 4.976500
## [105] 5.485711 4.787057 4.227386 4.993007 4.815843 5.012370 5.023966 4.430229
## [113] 4.540905 5.063325 5.208059 5.332574 5.129316 4.856078 4.551183 5.112716
## [121] 4.441703 4.590646 5.343476 4.674025 4.126992 4.840733 4.836506 5.698716
## [129] 4.339160 5.254922 5.442912 4.867670 5.555970 5.002462 4.774006 4.391530
## [137] 5.483239 4.846513 5.193202 5.453060 6.224928 4.478517 5.195172 4.832117
## [145] 5.128731 5.419279 5.051855 5.675017 4.482401 5.981405
Obtener media, media, mediana, moda de los datos generados (150) y grafico de caja y bigote
media <- mean(x)
media
## [1] 5.008598
mediana <- median(x)
mediana
## [1] 5.005648
library(modeest)
mlv(x, method = "mfv")
## [1] 3.808564 3.818399 3.996824 4.076144 4.077442 4.126992 4.173165 4.227386
## [9] 4.248276 4.250265 4.308758 4.316808 4.339160 4.340230 4.370546 4.391507
## [17] 4.391530 4.394150 4.430229 4.441703 4.478517 4.479123 4.482401 4.492941
## [25] 4.493375 4.507534 4.524737 4.525015 4.540905 4.551183 4.551609 4.573969
## [33] 4.590646 4.604446 4.615440 4.632387 4.636095 4.644668 4.654935 4.659720
## [41] 4.662980 4.674025 4.709585 4.712301 4.724987 4.732190 4.748989 4.774006
## [49] 4.787057 4.803783 4.810770 4.815843 4.832117 4.836506 4.839025 4.840733
## [57] 4.846513 4.856078 4.863838 4.867670 4.885782 4.886370 4.898559 4.901922
## [65] 4.923172 4.926244 4.952328 4.952600 4.954005 4.976500 4.991971 4.993007
## [73] 5.002462 5.002679 5.003263 5.008033 5.012370 5.012870 5.019282 5.023966
## [81] 5.025233 5.039629 5.042630 5.043678 5.051855 5.057648 5.063325 5.083455
## [89] 5.097020 5.105612 5.112716 5.128731 5.129316 5.130669 5.138491 5.157430
## [97] 5.162403 5.188963 5.193202 5.194576 5.195172 5.196994 5.208059 5.228459
## [105] 5.254922 5.271145 5.332574 5.337519 5.342696 5.343476 5.393138 5.409065
## [113] 5.410085 5.419279 5.422579 5.428974 5.442912 5.443985 5.452437 5.453060
## [121] 5.462685 5.483239 5.485711 5.511335 5.522871 5.528950 5.544080 5.552931
## [129] 5.555970 5.560082 5.564529 5.581803 5.585284 5.592253 5.607714 5.672431
## [137] 5.675017 5.682193 5.692705 5.698716 5.723985 5.725519 5.727653 5.969838
## [145] 5.981405 6.025297 6.038457 6.079803 6.224928 6.265141
boxplot(x)
hist(x)
hist(x, freq = FALSE)
curve(dnorm(x, mean = 8, sd=0.5), from = 3.5, to =6.5, add=TRUE )
Genere un conteo y calculo de probabilidad de 30 numeros de forma binomial
x <- rbinom(30,5,0.40)
x
## [1] 1 1 3 3 4 1 2 0 0 4 3 3 1 2 2 1 1 2 1 2 2 0 0 2 2 3 3 4 0 4
table(x)
## x
## 0 1 2 3 4
## 5 7 8 6 4
A <- 1/30
A
## [1] 0.03333333