U1A5

Juan

11 de Septiembre de 2020

library(prettydoc)

Probabilidad ##Distribuciones de probabilidad **Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f
$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array}\]

$$

Distribución exponencial

curve(dexp(x), from=0, to= 10)

#representa la densidad de una ezponencial de media 1 entre 0 y 10

Distribución binomíal

x <- rbinom(20, 1, 0.5)
x
##  [1] 1 0 0 1 0 1 0 1 0 1 0 1 1 1 0 0 0 0 1 1
#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 10 10

e.g. Distribución normal

si \(X\) es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que X sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447

Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que

qnorm(0.7)
## [1] 0.5244005

*Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5

qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964

*Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean=10, sd=1 )
x
##   [1] 10.217404 10.553777  9.173774  9.356614 10.850912 10.774895 10.263026
##   [8] 10.049011 10.273254 11.321802 10.253953 12.095058  9.204243  9.396779
##  [15] 11.797152  9.087747  8.784728  8.962100 10.147164  7.806367 10.555796
##  [22] 10.938841  8.182465 11.109770  9.730161  8.915964 10.691575 10.689601
##  [29]  8.750234  9.269515  9.178377 12.349187 10.989954  9.837540 10.614827
##  [36]  9.494380 10.955396 10.699792  9.464427 10.714127 11.079752 11.250296
##  [43] 10.078319  7.903113  9.513813 10.483329 10.825908  9.604854 10.596150
##  [50] 10.139884  7.577894  9.784231  9.398409 10.686956  9.706596 11.786372
##  [57] 10.105305 10.314132  9.261578 10.496591 10.772633 10.239218  7.863949
##  [64] 11.218516 10.096556 11.833949  9.541276 10.895266 11.167046  9.268039
##  [71] 10.568750 10.956570  9.987790 10.629633  9.629506  9.775147  9.392582
##  [78] 10.887630  9.024209 10.702203 10.148682 10.390873  9.640295  8.488412
##  [85]  8.903925  9.216629 11.396546  8.839868  9.573357  9.947199 10.034645
##  [92]  8.649322  9.517435 10.647107 11.098589 11.279457 10.356558  9.368694
##  [99]  9.071241  8.263290

*Para estimar el promedio de x

mean(x)
## [1] 10.03378

*Histograma de frecuencias

hist(x)

*Gráfico de cajas y bigote

boxplot(x)

*Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:

hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

Lo aprendido en clase: En esta asignacion se ven funciones para calcular distribuciones de probabilidad en R, ademas de los graficos mas importantes usadaos en la probabilidad, todo a partir de datos importados.