U1A5

Javier Salgueiro

14/09/2020

setwd("~/PYE1112ADITSON")

Distribuciones de probabilidad

Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución bínomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text(---)\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text (---)\\ d & \text{density} & \text{Calcula probabiidades puntuales} & \text{Sólo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text(---)\\ \hline \end{array} \]

Distribución exponencial

curve (dexp(x), from=0, to=10)

#r}Repesenta la dencidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x<- rbinom(20,1,0.5)
#genera 20 obervaciones 
x
##  [1] 0 1 0 0 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0
#Genera 20 observaciones con distribución B(1,0,5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
##  8 12

Distribucción normal

Si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variavle aleatoria normal estandar Z, es decir un valor X tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas fórmulas para intervalos y contrastes se obtiene con elcomando qnorm (1-alfa). algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una publicaciión normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean = 10, sd=1)
x
##   [1] 10.025103 10.265429 11.978396 10.646712 10.425541 11.199463 10.243153
##   [8]  8.954029 10.521255 11.429905  8.823017 10.898171  9.713135  9.926017
##  [15] 10.521981  9.678434  9.714696  9.183795  9.954066  9.260125 10.217698
##  [22] 10.552953  9.240793  7.937439 10.792961 11.196325  9.053561  9.114212
##  [29]  8.967552  8.921865 10.255884 10.323590 10.497892  9.451618 10.392600
##  [36]  9.637553 10.229244  8.794981  9.057965 10.113709 10.211573  7.976222
##  [43]  9.411763  9.896323  7.779264 10.490932  9.752461 10.217425  9.027005
##  [50]  9.859524 10.738379  9.172525  9.760014 10.364632 11.590447 10.921185
##  [57]  9.560539  9.240115 11.142130 11.268579  9.524209 10.596828  9.658357
##  [64]  9.037527  8.706728  9.741283 10.161172  9.139326  8.856971  9.120783
##  [71] 10.266365 11.306481  9.325540  9.904919  9.923720 11.223981 11.691007
##  [78]  8.735088 11.236544  9.926278  9.124657  9.473021  9.665562 11.355602
##  [85] 10.890395  9.627126 10.309381  8.038952 11.895909  8.872430  9.021015
##  [92]  9.891615  9.300934  9.671425  9.635411 10.655329 10.522924 10.628387
##  [99] 10.320417 10.327121
  • Para estimar el promedio de x
mean(x)
## [1] 9.938046
  • Histograma de frecuencias
hist(x)

  • Gráfico de cajas y bigote
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sean 1) junto con la densidad de poblacion:
hist(x,freq =FALSE) #FREAQ= FALSE,PARA QUE EL AREA DEL HISTOGRAMA SEA 1
curve(dnorm(x, mean=10, sd=1), form= 7, to =13, add = TRUE)
## Warning in plot.xy(xy.coords(x, y), type = type, ...): "form" is not a graphical
## parameter

Ejercicios

  1. si \(Z\) es una variavle con distribución normal estándar, calcula \(\mathbb{P}(-2.34 < z < 4.78)\).

  2. Calcula el rango de inrercuartílico de una población normal estandar.

  3. Genera una mestra de tamaño 10 de una población normal estándar. ¿Cúal es la diferencia entre la medida muestral y la poblacional? Repite el ejercicio 3 veces y anota las 3 diferencias.

  4. Genera 1000 numeros con distribucion de Poisson de parámetro \(\lambda = 1)\). Representa el gráfico de barras de los números obtenidps. Calcula la media y la varianzade los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguentes calores: \(t_{3,\alpha}\), \(chi^2_{3,\alpha}\), para \(\alpha = 0.05\), y \(\alpha = 0.01\). Compara los valores obtenidos con los que aparecen en las correspondientes tablas.