Probabilidad
Distribuciones de probabilidad
## Distribución binomial
## [1] 0 1 1 0 1 0 0 1 0 0 0 1 1 0 0 0 0 0 0 1
Funciones en R
En R, cada distribución de probabilidad se nombre mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución Chi2 chisq
- Distribución F f
\[ \begin{array}{l|l|l|c} \text{Función} & \text{significado} & \text{uso}& \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial
Distribción binomial
## [1] 1 0 0 0 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 0
Contando éxitos vs fracasos
## x
## 0 1
## 9 11
e.g. Dsitribución normal
si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una v.a. normal estándar z, es decir, un valor x tal que
## [1] 0.5244005
- Para calcular el cuantil, pero para una v.a. normal de media 0 y DT(desviación tipica) 0.5
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 7.990333 12.429692 10.161657 10.733946 9.307237 9.081407 10.811684
## [8] 10.687205 9.452471 9.301708 10.693129 9.966722 8.787769 11.403761
## [15] 9.758299 9.052303 8.254618 11.227672 9.178588 10.368825 10.836180
## [22] 11.886156 7.168252 11.455009 7.416074 8.721095 8.547641 10.312580
## [29] 10.552876 10.356155 11.133918 8.548245 8.955559 8.762474 9.028034
## [36] 9.568793 10.378414 10.804110 9.583125 8.112474 8.946781 8.109598
## [43] 11.655305 9.616891 11.850823 9.506480 10.097044 9.855796 9.587151
## [50] 9.525966 10.314195 8.899629 10.309571 9.063882 9.228000 10.240919
## [57] 10.611387 10.529932 9.587415 10.342097 11.087795 11.879915 12.041285
## [64] 8.904437 9.520923 9.484938 9.865196 12.000862 9.379932 10.890503
## [71] 10.629401 10.822416 11.392748 9.878405 9.660084 9.888785 9.180734
## [78] 10.633831 9.537533 11.174931 8.084012 10.454631 8.781580 9.989882
## [85] 8.768364 10.094548 9.998971 11.479948 10.420843 9.399085 9.443324
## [92] 8.898079 12.680140 10.624841 9.894845 9.745863 9.842313 10.002156
## [99] 11.129848 10.113292
- Para estimar el promedio de x
## [1] 9.963563
- Histograma de frecuencias
* Gráfico de cajas y bigote
- Histograma de la muestra (normalizado para que la suma de las áreas de los rectangulos sea 1) junto con la densidad de la población:
hist(x, freq = FALSE) #freq=FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add = TRUE)