DISTRIBUCIONES DE PROBABILIDAD

Tipos de variables

1.- Aleatoria: resultados que se presentan al azar en cualquier evento o experimento.

2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores principalmente

3.- Variable aleatoria continua: Este tipo de variables generalmente son resultado de una medicion y puede tomar cualquier valor dentro de un intervalo. Double

Distribucion normal

Es un distribucion muy utilizada y funciona generalmente para variables continuos.

Se usa para entender fenomenos naturales, sociales artificiales.

  • Ejemplo1: Calcular la probabilidad de que \(X\) sea menor a 48, es decir

\[ P <48 \] ** Funciones en R

En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones más importantes son:

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución Chi2 chisq Distribución F f

Distribución Exponencial

curve(dexp(x), from=0, to=10) #representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5) #Genera 20 observaciones con distribución B(1,0.5)
x
##  [1] 0 0 1 0 1 1 1 1 0 0 0 1 0 1 1 1 0 0 0 0

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 11  9

e.g. Distribución normal

si X es una variable aletoria, con distribución normal de media 3, y du desviación típica es de 0.5, la probabilidad de que X sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447

Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que

qnorm(0.7)
## [1] 0.5244005

El valor zα que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964

Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean=10, sd=1 )
x
##   [1]  8.142381  9.284181  9.465300  7.773199 11.427281  9.829313 11.419538
##   [8]  9.746824  9.767873  8.847573  9.612683  9.604035  9.658111 10.186240
##  [15]  9.038372 10.105338 10.134123  8.742292  9.413463  8.946350  9.315679
##  [22] 10.262691  9.585280  9.735871 10.739647 10.048868 10.276377  9.787770
##  [29] 10.565316  9.991490  9.954865 10.396040  9.518627  8.804860  9.634501
##  [36] 10.578207 10.067163 10.358421  7.684571 10.371724  9.187054 10.001902
##  [43]  8.846087 10.905409  9.004536 11.886433  9.871513 10.029485  9.544039
##  [50] 10.932542 10.442255 10.579161 10.359872 10.741929 10.190496 10.168624
##  [57] 10.110031 10.259186 13.121327 10.444749  8.209634  8.928130 11.553796
##  [64] 11.632859 11.418686  8.421701 10.391363 10.081698  7.895757 10.332344
##  [71] 10.523556 11.313793 10.789083 10.751456 10.926974  9.544279 10.717493
##  [78] 10.679087 10.767403 11.661852  9.964089  9.395243 10.392151  8.960985
##  [85] 10.553496 11.165515  9.703454 10.008998  8.742251 11.401351  9.621677
##  [92]  9.191875  9.788275  8.703691  9.118321  9.755626  9.957274  8.057935
##  [99]  9.441317  9.118699

Para estimar el promedio de x

mean(x)
## [1] 9.950322

Histograma de frecuencias

hist(x)

Gráfico de cajas y bigote

boxplot(x)

Histograma de la muestra

hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

EJERICIOS

1.- Si z es una variable con distribucion normal estandar, calcula P(−2.34<z<4.78)

P = (pnorm(4.78, mean = 0, sd = 1) - pnorm( −2.34, mean = 0, sd = 1))
P 
## [1] 0.9903573

2.- Calcula el rango intercuartílico de una poblacion normal

pob <- c(1,1,3,3,4,4,5,5,6,6,7,7,8,9,9,9)
summary(pob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   3.750   5.500   5.438   7.250   9.000

3.- Genera una muestra de tamaño 19 de población normal estandar. ¿cuál es la diferencia entre la media mostral y la poblacional? repite el ejercicio 3 veces y anota las 3 diferencias

x <- rnorm(19, mean=3, sd=1) #Intento 1
x
##  [1] 3.2793671 4.1340310 4.4971993 7.1253586 2.0839995 3.6261297 3.4267835
##  [8] 1.4208049 3.0251009 0.8480384 4.7678246 1.8311519 2.7350803 4.4170903
## [15] 2.1508371 3.8852665 3.2798593 1.8941482 3.1751640

4.- Genera 1000 números con distribución de Poisson de parámetro λ=1). Representa el gráfico de barras de los numeros obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

Poiss <- rpois(1000, 1) 
Poiss
##    [1] 0 0 4 1 0 0 0 1 0 0 1 1 0 1 2 2 0 0 3 0 0 0 0 0 0 0 1 0 1 1 4 3 2 0 0 3 0
##   [38] 1 3 3 0 0 2 0 2 0 1 1 1 2 0 2 0 2 0 1 1 1 1 0 1 2 3 2 0 1 1 0 1 1 1 0 1 3
##   [75] 1 1 0 2 1 3 2 0 5 0 0 2 0 0 1 0 3 1 1 0 0 0 2 0 2 1 2 2 2 1 1 1 0 2 2 1 1
##  [112] 2 0 1 1 2 0 2 1 2 2 0 0 1 0 0 1 0 2 1 1 4 0 0 2 0 0 1 0 0 1 0 2 0 0 3 1 1
##  [149] 0 1 1 0 0 0 1 2 1 0 1 4 0 3 2 1 0 2 1 0 0 1 3 2 1 0 2 0 0 1 2 0 0 2 0 1 1
##  [186] 1 1 0 2 0 2 0 2 2 0 2 2 0 0 1 2 1 1 1 1 0 3 1 4 2 0 1 3 2 3 1 2 1 2 2 1 0
##  [223] 1 0 0 1 1 1 1 2 0 1 0 2 1 2 1 1 0 0 0 2 0 1 1 0 1 0 1 1 0 0 1 0 0 1 2 0 3
##  [260] 1 0 1 1 0 1 1 0 1 0 3 0 0 2 1 1 0 1 0 2 1 1 2 1 2 0 2 1 0 2 0 0 1 0 2 0 0
##  [297] 0 1 2 0 1 1 0 4 2 0 0 1 0 2 1 2 1 1 2 1 0 2 0 0 1 1 1 1 1 1 1 0 1 1 0 0 0
##  [334] 1 1 1 1 0 0 3 2 4 0 0 1 1 0 1 1 0 1 1 1 1 1 0 1 1 0 0 0 0 0 3 1 2 1 0 1 1
##  [371] 1 2 2 0 1 1 1 1 1 0 1 3 1 1 0 2 0 0 1 0 2 0 0 1 0 1 0 0 0 1 0 1 2 1 4 3 1
##  [408] 1 1 1 5 0 0 1 0 2 1 1 2 1 0 0 0 1 1 2 0 0 0 1 1 1 2 4 1 2 0 1 0 0 1 0 2 1
##  [445] 0 0 0 1 0 0 2 0 1 1 1 0 0 0 1 2 1 1 0 1 1 0 2 2 2 0 2 1 0 1 1 1 0 2 0 2 0
##  [482] 0 2 3 0 0 0 0 1 0 2 0 0 2 1 2 0 3 1 2 0 0 2 1 1 2 3 0 3 1 2 0 2 0 0 0 2 1
##  [519] 1 1 0 2 0 1 3 1 0 2 0 0 1 2 2 1 0 2 2 1 1 2 1 2 1 0 1 1 0 1 2 0 3 3 1 2 0
##  [556] 1 0 0 4 0 2 0 1 0 2 0 0 3 1 0 1 0 0 2 2 0 0 1 1 3 1 0 1 0 0 0 1 1 1 0 2 1
##  [593] 0 1 1 0 1 1 0 1 0 1 0 2 1 1 1 3 4 0 0 0 0 2 0 0 2 2 0 3 0 0 2 0 1 1 1 1 0
##  [630] 1 3 2 1 1 0 2 0 1 3 1 1 2 0 2 0 1 1 0 3 3 1 2 0 1 0 0 2 2 1 0 0 0 1 1 0 2
##  [667] 0 1 1 0 1 2 1 0 1 0 0 0 2 1 1 1 1 1 1 0 1 1 1 0 1 0 2 0 0 1 2 2 0 0 4 0 2
##  [704] 2 1 1 2 0 0 2 0 2 1 0 0 0 1 1 2 0 1 1 2 1 2 1 1 0 1 0 1 0 0 0 0 2 0 1 0 0
##  [741] 1 0 2 5 2 1 1 1 1 1 0 0 2 1 0 1 0 0 1 0 1 0 1 1 0 0 1 0 1 0 2 2 3 0 2 2 1
##  [778] 2 0 0 2 1 2 1 3 0 1 0 0 1 1 0 1 2 1 1 1 2 1 2 2 1 2 0 1 2 0 1 4 3 1 0 1 0
##  [815] 0 0 0 2 1 1 1 1 1 0 1 1 1 0 1 1 0 1 0 1 2 2 2 0 3 0 1 1 2 0 2 1 0 2 0 1 0
##  [852] 1 1 2 1 2 2 0 1 2 0 2 2 2 2 1 1 0 0 1 1 0 0 2 1 1 3 3 3 2 2 0 1 0 2 1 1 0
##  [889] 1 1 1 3 2 1 2 0 4 3 0 3 0 0 1 1 1 1 0 1 0 0 2 2 0 1 0 2 1 1 2 1 2 0 0 1 1
##  [926] 3 2 0 1 1 0 0 1 4 3 0 0 1 0 2 3 3 0 0 2 1 0 3 1 0 2 2 2 0 0 0 0 1 0 1 1 0
##  [963] 0 1 0 0 0 1 1 0 2 3 1 2 2 1 1 2 1 1 2 1 0 0 0 2 0 0 3 1 0 1 1 1 0 0 1 2 1
## [1000] 0
mean(Poiss) # media
## [1] 0.987
var(Poiss) #varianza
## [1] 0.9577888

Conclusion

Estos ejercicios ayudan a comprender los temas repasados en clases anteriores, de una forma mas sencilla y clara, englobando asi desde los graficos de un histograma hasta el calculo de varianza y media.