library(prettydoc)

Probabilidad

Distribuciones de probabilidad

curve(dexp(x), from = 0, to = 10)

## Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 0 1 0 0 1 0 0 0 1 1 0 0 0 0 0 0 1

Conteo de éxtiso vs fracasos

table(x)
## x
##  0  1 
## 13  7
  • igual número de 0 y de 1 (50/50)

Funciones en R

En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

\[ \begin{array}{l|l|l|c} \text{Función} & \text{significado} & \text{uso}& \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial

curve(dexp(x), from=0, to=10 )

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribción binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 0 0 0 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 0
#Genera 20 observaciones con distribución b(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
##  9 11

e.g. Dsitribución normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  7.990333 12.429692 10.161657 10.733946  9.307237  9.081407 10.811684
##   [8] 10.687205  9.452471  9.301708 10.693129  9.966722  8.787769 11.403761
##  [15]  9.758299  9.052303  8.254618 11.227672  9.178588 10.368825 10.836180
##  [22] 11.886156  7.168252 11.455009  7.416074  8.721095  8.547641 10.312580
##  [29] 10.552876 10.356155 11.133918  8.548245  8.955559  8.762474  9.028034
##  [36]  9.568793 10.378414 10.804110  9.583125  8.112474  8.946781  8.109598
##  [43] 11.655305  9.616891 11.850823  9.506480 10.097044  9.855796  9.587151
##  [50]  9.525966 10.314195  8.899629 10.309571  9.063882  9.228000 10.240919
##  [57] 10.611387 10.529932  9.587415 10.342097 11.087795 11.879915 12.041285
##  [64]  8.904437  9.520923  9.484938  9.865196 12.000862  9.379932 10.890503
##  [71] 10.629401 10.822416 11.392748  9.878405  9.660084  9.888785  9.180734
##  [78] 10.633831  9.537533 11.174931  8.084012 10.454631  8.781580  9.989882
##  [85]  8.768364 10.094548  9.998971 11.479948 10.420843  9.399085  9.443324
##  [92]  8.898079 12.680140 10.624841  9.894845  9.745863  9.842313 10.002156
##  [99] 11.129848 10.113292
mean(x)
## [1] 9.963563
hist(x)

* Gráfico de cajas y bigote

boxplot(x)

hist(x, freq = FALSE) #freq=FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add = TRUE)