Distribuciones de Probabilidad

Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f
$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles(percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso conituno}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$

Distribucion Exponencial

curve(dexp(x), from=0, to=10)

#Representa la densidad de una exponencial de media 1 entre 0 y 10

Distribucion Binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 1 1 0 1 0 0 1 1 0 1 1 0 1 0 1 0 1 1 0
#Genera 20 observaciones con distribucion B(1, 0.5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
##  8 12

e.g Distribucion Normal

si \(x\) es una variable aleatoria, con distribucion normal de media 3, y su desviacion tipica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variable aleatoria normal estandar \(Z\), es decir, un valor de x tal que:
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil, pero para una variable aleatoria normal de media 0 y DT 0.5
qnorm(0.7, sd = 0.5)
## [1] 0.2622003

El valor de \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para gener una muestra de tamaño 100 de una poblacion normal de media 10 y desviacion tipica 1 (y guardarla en un vector x):
x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 10.618467 10.324665 10.773308  9.721542  8.653372  8.763639 10.379443
##   [8]  9.925131  9.418870  9.092396  8.717772 10.463922  9.614934  9.050776
##  [15]  9.921404 10.667433 10.730724 10.766077 11.720021 10.430290  9.426685
##  [22]  9.948123 10.223076  9.485831 11.046496  9.900121 11.377078 10.762072
##  [29] 10.551348  8.616081  8.767001  8.975480 10.806858  9.593001  9.792754
##  [36]  6.869110 10.393343  9.801331  9.889823 11.484435 10.115160 10.144975
##  [43] 12.305834  8.949329 11.255134  9.805410  9.546165 10.470635  9.346533
##  [50]  9.275443 10.042128  8.489209  9.668401  8.682294 10.518820 10.731380
##  [57]  9.665984 10.811618 10.078357  9.286625  7.922985  6.757041 11.218301
##  [64] 10.032210  9.482876 10.866658  9.902800 10.009010  8.686458 11.160251
##  [71] 11.181609  9.058898 10.967042 10.837241 10.592313 10.255519 11.889638
##  [78]  9.750545 10.329447  8.360160  8.980772  9.866222 10.144211  9.648259
##  [85] 10.555195  9.804272  9.729784  9.474149 11.187622  9.172437  9.768192
##  [92] 10.123008 11.932344  9.580436  8.745523 10.475567 10.295816 11.583008
##  [99] 10.392244 10.805495
  • Para estimar el promedio de x
mean(x)
## [1] 9.981792
  • Histograma de frecuencias
hist(x)

  • Grafico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sea 1) junto con la densidad de poblacion:
hist(x, freq = FALSE) # Freq = FALSE, para que el area del histograma sea 1(Normalizando)
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)

#Conclusion: vimos las definiciones e interacciones de las distribuciones exponenciales, normales y bionmiales, tambien que pasa con la grafica al poner un intervalo y tambien como se comporta al implementar una desviacion.