DISTRIBUCIONES DE PROBABILIDAD
Tipos de variables
1.- Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.
2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores en y son principalmente del conteo realizado.
3.- Variable aleatoria continua: Este tipo de variables generalmente son resultado de una medición y pueden tomar cualquier valor dento de un intervalo.
Distribución Normal
Es una distribución muy utilizada y funciona generalmente para variables continuas. Se usa para entender fenomenos naturales, sociales, artificiales.
- Ejemplo: Calcular la probabilidad de que \(X\) sea menor a 48, es decir
\[ P < 48 \]
Tomando en cuenta que la media es 50 y la varianza es 25
Para esto usaremos la función de distribución de probabilidad
pnorm(48, mean=50, sd = sqrt(25), lower.tail = TRUE)## [1] 0.3445783
Entonces es 34% probable que tengamos un valor menor a 48
Ahora, cual es la probabilidad de que obtengamos un valor Mayor a 48
pnorm(48, mean=50, sd = sqrt(25), lower.tail = FALSE )## [1] 0.6554217
La probabilidad de que obtengamos un valor MAYOR a 48 es de 65.5%
Distribuciones de probabilidad
**Funciones en R:
En R, cada distribución de probabilidad se nombra mediante la palabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución chi2 chisq
- Distribución F f
\[ \begin{array}{1[1]} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & text {---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{genera datos aleatorios según una distribución especifica} & \text{---}\\ \hline \end{array} \]
Distribucion Exponencial
curve(dexp(x), from=0, to=10)#representa la densidad de una exponencial de media 1 entre 0 y 10Distribución binomial
x <- rbinom (20, 1, 0.5)
x## [1] 1 0 1 1 0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 0
#Genera 20 observaciones con distribución B(1, 0.5)Contando exitos vs fracasos
table(x)## x
## 0 1
## 8 12
e.g. Distribución normal
Si \(x\) es uan variable aleatoria, con distribucion normal de media 3, y de desviacion tipica es de 0.5, la probabilidad de que x sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)## [1] 0.8413447
*Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor x tal que
qnorm(0.7)## [1] 0.5244005
*Para calcular el mismo cuantil, pero para con v.a. normal de media 0 y DT 0.5
qnorm(0.7, sd=0.5)## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y constrastes se obtiene con el comado qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)## [1] 1.959964
*Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación tipica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1)
x## [1] 9.770271 9.617256 8.987576 11.360174 11.102322 11.175032 8.556832
## [8] 10.493547 6.526647 9.053190 10.100268 10.201243 10.266670 8.731773
## [15] 10.429592 9.495155 10.304722 9.822416 9.819695 10.871863 7.782343
## [22] 9.751953 10.059312 10.164392 10.151704 10.516848 8.426850 11.028834
## [29] 10.337189 9.478061 8.734370 10.512085 8.265832 9.374520 9.022286
## [36] 11.324427 10.897449 8.572756 9.353447 9.022806 9.952773 10.062733
## [43] 8.658422 10.035508 9.593391 10.394863 10.967886 9.454985 9.906136
## [50] 12.501173 9.242420 8.370314 10.058767 11.371608 10.310440 10.443312
## [57] 9.076519 9.551749 8.318916 12.466655 11.994718 9.260859 10.886765
## [64] 9.140877 11.585078 12.719455 9.463787 10.511439 10.641184 10.160488
## [71] 9.053235 8.886782 10.117964 11.646527 11.564217 10.042780 9.646722
## [78] 10.218103 10.449479 10.421225 10.825095 7.935710 11.026255 11.589946
## [85] 9.650071 9.533592 10.577516 11.965858 11.068793 9.721683 8.948310
## [92] 8.513798 10.869294 10.423530 10.618370 8.756618 9.968489 11.089589
## [99] 10.446924 8.887182
*Para estimar el promedio de x
mean(x)## [1] 10.01031
*Histograma de frecuencias
hist(x)*Grafico de cajas y bigote
boxplot(x)- Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sea 1) junto con la densidad de la población.
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add= TRUE)