library(prettydoc)

probabilidad

Distribuciones de probabilidad

** Funciones en R

En R , cada distribución de probabilidad se nombra mediante una palabra clave o alias . Las palabras claves para las distribuciones más importantes son:

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

distribucion de probabilidad

distribucion exponencial

curve(dexp(x),  from=0, to=10)

distribucion binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 0 1 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 1 0

conteo de exitos vs fracasos

table(x)
## x
##  0  1 
## 14  6

e.g. Distribucion normal

si \(x\) es una variable aleatoria, con distribucion normal de media 3, y su desviacion tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(1.5, mean=3, sd=0.5)
## [1] 0.001349898

*para calcular el cuantil 0.7 de una v.a. normal estandar z, es decir, un valor x tal que

qnorm(0.7)
## [1] 0.5244005

*para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5

qnorm(0.7, sd=0.5)
## [1] 0.2622003

el valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contraste se obtiene con el comando qnorm(1-alpha). ejemp:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  9.839725 10.667596 10.621200  9.961966 11.910115 10.223410  8.986245
##   [8]  9.375273 11.251891  9.054995  8.498693 10.102882  9.403644 11.070240
##  [15]  9.862789  9.578712 10.310644 10.242010  9.846641 11.659451 10.216215
##  [22] 12.144067 11.673953  9.923421 10.436769  9.543941 10.077751 10.505400
##  [29] 10.061277 10.000176 10.783594 10.245701  9.583588  8.921191  9.357518
##  [36]  7.767112 10.113273  9.950560 12.677405 10.130799 12.589602 11.770527
##  [43] 10.383578  9.947040  7.321817  9.815561 10.655255 10.728427  8.710121
##  [50]  8.387487 10.093092 11.667325  8.653900  8.663278 10.823715  9.094729
##  [57] 11.087277 11.896795  9.563550 10.056373 10.690376  9.942394  9.887368
##  [64] 10.930500 11.269625  8.532211  9.223082  9.258169  9.808236  9.261698
##  [71] 10.844033  9.878633  9.830368 10.144725 11.944945  9.630092 10.052582
##  [78] 11.433445 10.080240 10.083344  9.646961 10.294840  9.464317  8.658112
##  [85]  9.768783  8.921450 11.396222 10.178241  9.453532  9.593628 10.709853
##  [92] 10.230944 10.389496  9.235608 10.668568  6.989260  8.563168  9.491461
##  [99]  9.833285 10.424366

*para estimar el promedio de x

mean(x)
## [1] 10.05129

*histograma de frecuencia

hist(x) 

*grafico de cajas y bigotes

boxplot(x) 

hist(x, freq=FALSE) #FREQ=FALSE , para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si \(Z\) es una variable con distribución normal estandar , calcula \(\mathbb{P}(-2.34 < z < 4.78)\)

  2. Calcula el rango intercuantilico de una población normal estandar

  3. Genera una muestra de tamaño 10 de una población normal estandar. ¿Cuál es la diferencia entre la media muestral y la poblacional?, Repite el ejercicio 3 y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parametro \(\lambda = 1\). Representa el gráfico de barras de los números obtenidos . Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los valores que se muestran a continuación: \(t_{3,\alpha}\), \(\chi^2_{3, \ alpha}\) , para \(\alpha = 0.5\) y \(\alpha = 0.1\). Compara los valores obtenidos con los que se parecen en las correspondientes tabla.

conclusion: se llevaron a cabo una serie de calculos de probabilidad mediante el software Rstudio para determinar diferentes tipos de distribucion(normal, binomial, exponencial.), ademas utilizamos la funcion cuantil para diferentes variables aleatorias.