U1A5

Jose Ibarra

9/11/2020

library(prettydoc)

Distribuciones de probabilidad

Funcione en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Funcion} & \text{Sifnificado} \text/{Uso} \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array} \]

Distribución Exponencial

curve(dexp(x), from = 0, to = 10)

#repesenta la dencidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 0 1 1 0 0 0 0 1 1 0 1 0 0 1 1 0 1
#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 10 10

e.g. Distribución normal

si \(X\) es una variable aletoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1)
x
##   [1]  9.301677  9.465890 12.199664 10.021568  9.082681  8.358171 11.142374
##   [8] 10.191342  9.634733 10.552411 10.427978 11.660110  9.982916 10.834430
##  [15]  9.778259 10.287720 11.364168 11.204036  8.915333  9.537177 11.123489
##  [22]  9.627420  9.636263 11.433964  9.482156 11.143520 11.053536  9.546699
##  [29]  9.381738  8.376229 10.575851  9.314840 10.575744  9.523544  8.320482
##  [36] 11.660608 10.642949 10.106446 11.030194  8.393533  8.968951 11.303510
##  [43] 10.070717 10.590935  9.283766 10.797192  9.861537  8.830964  9.917048
##  [50]  9.030291  7.812698  9.719318  8.999915  8.995679  8.057968 12.744087
##  [57]  9.503438  9.406959  8.948747  9.162251  9.926527  8.649372  8.987136
##  [64]  8.948845  9.420191 10.450434  9.394720  9.134605  9.655753  9.245172
##  [71] 11.021580 10.407611  9.860631 10.485663  9.221311 10.419565  9.467450
##  [78]  9.587952 11.308433 11.050725  9.153234 11.589113  9.616885 10.458568
##  [85] 11.418822 10.438865  9.876354  8.383197 10.901852 11.108166  9.704529
##  [92]  9.914716  9.273646  8.614826 10.018059  8.706617 10.147247 10.738499
##  [99] 11.761986 10.136180
  • Para estimar el promedio de x
mean(x)
## [1] 9.955029
  • Histograma de frecuencias
hist(x)

  • Gráfico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(−2.34<Z<4.78)\).

  2. Calcula el rango intercuartílico de una población normal estándar.

  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parámetro λ=1. Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguentes calores: \(t_{,3,\alpha}\), \(chi^2_{3,\alpha}\), para α=0.05, y α=0.01. Compara los valores obtenidos con los que aparecen en las correspondientes tablas.