Probabilidad
Distribuciones de probabilidad
- Funciones en R
En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución Choi2 chisq
- Distribución F f
\[ \begin{array}{1|1|1|c|} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ p & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
Distribución Exponencial
Distribución binomial
## [1] 0 1 0 0 1 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0
Conteo de éxitos vs fracasos
## x
## 0 1
## 13 7
e.g. Distribución normal si \(X\) es una variable aleatoría con distribución normal de media 3, y su desviacion típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma
## [1] 0.8413447
- Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir un valor X tal que
## [1] 0.5244005
- Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
## [1] 0.2622003
El valor \(( z_\alpha )\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 10.920679 9.885778 9.333377 11.026331 11.375398 7.451371 9.768637
## [8] 9.159742 9.665828 11.230862 8.619670 8.266582 10.270760 10.493877
## [15] 9.846969 10.643501 10.666912 9.286689 9.611217 10.600732 7.975668
## [22] 9.567140 10.837973 10.737527 8.986842 9.594459 11.211396 8.833686
## [29] 9.315507 11.114384 11.428509 9.456688 10.680937 10.358643 8.140901
## [36] 8.634584 10.385569 9.841278 10.007440 10.578128 9.747346 9.663764
## [43] 9.075253 10.856060 9.464554 8.364075 11.265980 9.169251 11.998880
## [50] 9.091944 8.547106 11.585567 8.800849 10.619038 10.003478 10.131955
## [57] 12.437104 11.014392 9.927238 10.450946 10.570462 8.806478 9.490719
## [64] 8.977704 10.534955 9.415954 11.070003 9.338656 8.974230 8.758960
## [71] 9.736498 8.834583 9.308823 11.082233 8.943509 9.114513 9.405841
## [78] 11.363788 10.642439 11.078005 9.283898 11.875177 8.312684 9.670938
## [85] 10.084993 9.139486 10.663942 10.951586 9.032899 9.724708 9.836330
## [92] 9.032112 9.914982 10.368588 12.283265 9.815464 11.496028 7.909381
## [99] 9.362042 12.677420
- Para estimar el promedio de x
## [1] 9.949112
- Histograma de frecuencias
- Gráfico de cajas y bigote
*Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la poblacion
hist(x, fre=FALSE)
#Freq=FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add =TRUE)