Distribuicione de probabilidad
** Funciones en R
En R, cada distribución de probabilidad se nombra mediante una plabra clave o alias. Las palabras clave para las distribuciones más importantes son:
- Distribucion Alias
- Distribucion binomial bino
- Distribucion de Posisson pois
- Distribucion nomal norm
- Distribucion exponencial exp
- Distribucion t de Student t
- Distribucion chi2 chisq
- Distribución F f
\[ \begin{array}{l|l|l|c} \text{Funcion} & \text{Significado} &\text{Uso} & \text{Observación}\\ \hline p & \text{Probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{Quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{Density} & \text{Calcula probabilidadades puntuales} & \text{solo uso gráfico en el caso continuo}\\ r & \text{Random} & \text{Genera datos aleatorios según una distribución espesifica } &\text{---}\\ \hline \end{array} \]
Distribución exponencial
Distribución binomial
## [1] 0 1 1 0 0 1 1 0 0 0 0 0 1 0 1 1 0 1 0 0
- conteo de exitos (1) VS fracasos (0)
## x
## 0 1
## 12 8
Distribucción normal
Si \(x\) es una variable aleatoria, con distribucion normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:
## [1] 0.8413447
- para calcular el cuantil 0.7 de una variavle aleatoria normal estandar z, es decir un valor x tal que
## [1] 0.5244005
- para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas fórmulas para intervalos y contrastes se obtiene con elcomando qnorm (1-alfa). algunos ejemplos:
## [1] 1.959964
- Para generar una muestra de tamaño 100 de una publicaciión normal de media 10 y desviación típica 1 (y guardarla en un vector x):
## [1] 10.182202 10.213295 11.520979 8.856767 10.121176 10.802857 10.044910
## [8] 10.399265 9.316279 10.820189 10.848704 10.059371 8.551802 10.914746
## [15] 11.573273 11.490281 8.472158 8.815484 10.148814 8.533019 11.098363
## [22] 8.905764 10.015410 10.310668 11.046658 10.078353 9.291590 10.418922
## [29] 10.289282 9.501835 9.639076 9.012093 10.522630 10.236437 8.450544
## [36] 10.681705 11.631325 9.004311 9.782607 9.750732 9.649832 10.534849
## [43] 10.196178 10.412433 10.220671 8.942929 9.692438 10.833935 8.120571
## [50] 8.360937 9.209539 10.357118 12.539160 10.073271 10.765194 8.957511
## [57] 9.851035 11.459813 9.821260 10.358701 11.144626 7.765362 8.146218
## [64] 12.540821 11.100227 9.730074 9.750682 8.965468 11.552978 9.929769
## [71] 11.462941 11.381810 9.088766 11.166966 7.961045 8.868467 10.351606
## [78] 9.062106 10.177884 11.219145 12.130109 10.551069 10.552916 10.679140
## [85] 11.111720 9.745347 10.368062 8.372828 9.933849 10.422972 8.572520
## [92] 10.767050 8.815310 7.058470 8.066818 10.827543 9.539971 11.248783
## [99] 8.081821 10.333371
- Para estimar el promedio de x
## [1] 10.00258
- Histograma de frecuencias
- Gráfico de cajas y bigote
- Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sean 1) junto con la densidad de poblacion:
hist(x,freq =FALSE) #FREAQ= FALSE,PARA QUE EL AREA DEL HISTOGRAMA SEA 1
curve(dnorm(x, mean=10, sd=1), form= 7, to =13, add = TRUE)## Warning in plot.xy(xy.coords(x, y), type = type, ...): "form" is not a graphical
## parameter
Ejercicios 1. si \(Z\) es una variavle con distribución normal estándar, calcula \(\mathbb{P}(-2.34 < z < 4.78)\).
Calcula el rango de inrercuartílico de una población normal estandar.
Genera una mestra de tamaño 10 de una población normal estándar. ¿Cúal es la diferencia entre la medida muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.
Genera 1000 numeros con distribucion de Poisson de parámetro \(\lambda = 1)\). Representa el gráfico de barras de los números obtenidps. Calcula la media y la varianzade los números obtenidos. ¿Se parecen a los valores teóricos?
Calcula con R los siguentes calores: \(t_{3,\alpha}\), \(chi^2_{3,\alpha}\), para \(\alpha = 0.05\), y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.