Distribuciones de Probabilidad

Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f
$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles(percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso conituno}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$

Distribucion Exponencial

curve(dexp(x), from=0, to=10)

#Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribucion Binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 0 0 0 1 0 1 1 1 1 1 1 0 1 1 1 0 0 1 0
#Genera 20 observaciones con distribucion B(1, 0.5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
##  9 11

e.g Distribucion Normal

si \(x\) es una variable aleatoria, con distribucion normal de media 3, y su desviacion tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variable aleatoria normal estandar \(Z\), es decir, un valor de x tal que:
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil, pero para una variable aleatoria normal de media 0 y DT 0.5
qnorm(0.7, sd = 0.5)
## [1] 0.2622003

El valor de \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para gener una muestra de tamaño 100 de una poblacion normal de media 10 y desviacion tipica 1 (y guardarla en un vector x):
x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 11.580431  9.296736  8.923602 11.432730  9.201028  9.286772 10.422133
##   [8]  8.761571 11.614644  9.907333  7.302459 10.283186 12.213908  8.014340
##  [15]  9.431765 10.049777 11.470426  8.776353  9.677414  9.374936  9.907967
##  [22] 10.475229  8.008613  9.190618  9.390154 10.011079  8.045841  7.590582
##  [29]  9.824911  9.764231  9.720353  8.967583  9.524105 11.456335  8.943124
##  [36] 10.267999 10.260249  8.797110 10.728285 11.119104 10.596446  9.564819
##  [43] 10.431801 10.962077 10.409828  9.899489 10.120664  9.543646  9.477936
##  [50]  8.993829  9.344080  9.928317 10.093847 11.250466 10.614712 10.017019
##  [57] 11.075667  9.602942 11.094314 11.031164  9.704961 11.038639  9.778928
##  [64] 10.829943  9.301946 10.511414 10.433504 10.119381  9.156135 12.174429
##  [71] 11.190713  8.964256  9.904319  9.857407  9.840062 10.062185 11.092520
##  [78]  9.935151 10.491924 10.152056 11.001477  8.483488 10.855681 10.723090
##  [85] 11.870599 10.246565  8.809245 10.260455 10.512948 11.129321  9.701351
##  [92] 10.340954 10.168095 10.076947  9.019207 11.164235 11.080722  8.471989
##  [99] 10.651303 11.305256
  • Para estimar el promedio de x
mean(x)
## [1] 10.03481
  • Histograma de frecuencias
hist(x)

  • Grafico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sea 1) junto con la densidad de poblacion:
hist(x, freq = FALSE) # Freq = FALSE, para que el area del histograma sea 1(Normalizando)
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)

#Conclusion: En esta actividad vimos las definiciones e interacciones de las distribuciones bionmiales, normal y exponencial, tambien se vio como interactua la grafica al poner un intervalo y tambien como se comporta al implementar una desviacion tipica al igual de como añadir una curva al histograma.