AI7UC1_8

Jesús Murillo

30/9/2021

DISTRIBUCIONES DE PROBABILIDAD

Tipos de variables

1.- Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.

2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores en y son principalmente del conteo realizado.

3.- Variable aleatoria continua: Este tipo de variables generalmente son resultado de una medición y pueden tomar cualquier valor dento de un intervalo.

Distribución Normal

Es una distribución muy utilizada y funciona generalmente para variables continuas. Se usa para entender fenomenos naturales, sociales, artificiales.

  • Ejemplo: Calcular la probabilidad de que \(X\) sea menor a 48, es decir

\[ P < 48 \]

Tomando en cuenta que la media es 50 y la varianza es 25

Para esto usaremos la función de distribución de probabilidad

pnorm(48, mean=50, sd = sqrt(25), lower.tail = TRUE)
## [1] 0.3445783

Entonces es 34% probable que tengamos un valor menor a 48

Ahora, cual es la probabilidad de que obtengamos un valor Mayor a 48

pnorm(48, mean=50, sd = sqrt(25), lower.tail = FALSE )
## [1] 0.6554217

La probabilidad de que obtengamos un valor MAYOR a 48 es de 65.5%

Distribuciones de probabilidad

**Funciones en R:

En R, cada distribución de probabilidad se nombra mediante la palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución chi2 chisq
  • Distribución F f

\[ \begin{array}{1[1]} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & text {---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{genera datos aleatorios según una distribución especifica} & \text{---}\\ \hline \end{array} \]

Distribucion Exponencial

curve(dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom (20, 1, 0.5)
x
##  [1] 1 0 1 1 0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 0
#Genera 20 observaciones con distribución B(1, 0.5)

Contando exitos vs fracasos

table(x)
## x
##  0  1 
##  8 12

e.g. Distribución normal

Si \(x\) es uan variable aleatoria, con distribucion normal de media 3, y de desviacion tipica es de 0.5, la probabilidad de que x sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447

*Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor x tal que

qnorm(0.7)
## [1] 0.5244005

*Para calcular el mismo cuantil, pero para con v.a. normal de media 0 y DT 0.5

qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y constrastes se obtiene con el comado qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964

*Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación tipica 1 (y guardarla en un vector x):

x <- rnorm(100, mean=10, sd=1)
x
##   [1]  9.770271  9.617256  8.987576 11.360174 11.102322 11.175032  8.556832
##   [8] 10.493547  6.526647  9.053190 10.100268 10.201243 10.266670  8.731773
##  [15] 10.429592  9.495155 10.304722  9.822416  9.819695 10.871863  7.782343
##  [22]  9.751953 10.059312 10.164392 10.151704 10.516848  8.426850 11.028834
##  [29] 10.337189  9.478061  8.734370 10.512085  8.265832  9.374520  9.022286
##  [36] 11.324427 10.897449  8.572756  9.353447  9.022806  9.952773 10.062733
##  [43]  8.658422 10.035508  9.593391 10.394863 10.967886  9.454985  9.906136
##  [50] 12.501173  9.242420  8.370314 10.058767 11.371608 10.310440 10.443312
##  [57]  9.076519  9.551749  8.318916 12.466655 11.994718  9.260859 10.886765
##  [64]  9.140877 11.585078 12.719455  9.463787 10.511439 10.641184 10.160488
##  [71]  9.053235  8.886782 10.117964 11.646527 11.564217 10.042780  9.646722
##  [78] 10.218103 10.449479 10.421225 10.825095  7.935710 11.026255 11.589946
##  [85]  9.650071  9.533592 10.577516 11.965858 11.068793  9.721683  8.948310
##  [92]  8.513798 10.869294 10.423530 10.618370  8.756618  9.968489 11.089589
##  [99] 10.446924  8.887182

*Para estimar el promedio de x

mean(x)
## [1] 10.01031

*Histograma de frecuencias

hist(x)

*Grafico de cajas y bigote

boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sea 1) junto con la densidad de la población.
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add= TRUE)