U1A5

Marijose González

11/Sep/2020

Distribución normal

Distribuciones de probabilidad

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q &\text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] ## Distribución exponencial

curve(dexp(x), from=0, to=10)

#Representa la densidad de una exponencial media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 0 0 1 0 0 0 0 1 0 1 0 0 1 1 0 0 0
#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 13  7

Distribución normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una v.a. normal estándar z, es decir, un valor X tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil, pero para una v.a. normal media 0 y DT 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1)
x
##   [1] 11.489502 10.320304  8.818733  8.314753 10.250566 10.994764  7.298993
##   [8] 11.211187 11.556806 10.153870  9.909394  7.882148  9.778901 11.320078
##  [15]  9.086410  9.610061 10.186949 10.495631  9.205731 10.520401 10.693053
##  [22]  8.550179  9.939713  8.929017 10.779386  9.448998  8.228037 10.445972
##  [29] 11.727299 10.413534  8.528636 10.586549  9.469681 11.360192 11.151655
##  [36]  9.502213  8.602161  8.579958  8.785912 10.866739  9.335695 10.962427
##  [43] 10.166887 10.135154 11.054233 11.424908  9.527045 11.737693 10.819112
##  [50] 11.895443  9.399516 11.053859  8.374401 11.324891  9.736074  9.332189
##  [57]  8.802261  9.444938  8.544107 10.758197 10.301724 12.775387 10.701548
##  [64]  9.810855  9.220869  9.298896  9.474593 10.469239 12.087266  8.835563
##  [71] 10.446552  9.649173  9.143528 11.343651  9.972759  9.885294  9.473473
##  [78]  8.129823 10.480944 11.380319  7.706579 10.861724 10.457734 10.574076
##  [85] 10.626083 10.459584 10.395517  9.461561  9.197937  8.240919 11.476214
##  [92]  9.802849 10.501964  8.447880  8.442419 10.912613 11.045766 10.243071
##  [99]  9.894440 10.717350
  • Para estimar el promedio de x
mean(x)
## [1] 10.01171
  • Histograma de frecuencias
hist(x)

  • Gráfico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Ejercicios

  1. Si \(Z\) es una variable con distribución normal estándar, calcula \(\mathbb{P}(−2.34 < Z < 4.78)\).

  2. Calcula el rango intercuartílico de una población normal estándar.

  3. Genera una muestra de tamaño 10 de una población normal estándar. ¿Cuál es la diferencia entre la media muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 números con distribución de Poisson de parámetro \(\lambda = 1\). Representa el gráfico de barras de los números obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguientes valores: \(t_{3, \alpha}\), \(\chi^2_{3, \alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.

CONCLUSIONES

En esta actividad se hizo un desarrollo acerca de las distribuciones de probabilidad y así se pudieron conocer las funciones y significados de cada una de estas para poder aplicar los comandos correspondientes.