DISTRIBUCIONES DE PROBABILIDAD

1.- Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.

2.- Variable aleatoria discreta: Aqui se toman solamente ciertos valores en y son principalmente del conteo realizado. integer

  1. Variable aleatoria continua: Este tipo de variables generalmente son resultado de una medición y pueden tomar cualquier valor dento de un intervalo. double

Distribución Normal

Es una distribución muy utilizada y funciona generalmente para variables continuas.

  • Ejemplo: calcular la probabilidad de \(X\) sea menos a 48 es decir que :

\[ P<48 \]

Tomando en cuanta que la media y la varianza es 50 y 25 respectivamente.

Para esto usaremos la funcion de distribucion de probabilidad.

pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE) # lower.tail = TRUE es usado para calcular P desde 48 para abajo
## [1] 0.3445783

Entonces es 34% probable que tengamos un valor menor a 48.

Ahora, cual es la probabilidad de que obtengamos un valor MAYOR a 48

pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE) # lower.tail = FALSE es usado para calcular P desde 48 para arriba
## [1] 0.6554217

La prbabilidad de que obtengamos un valor MAYOR a 48 es de 65.5%

Distribuciones de probabilidad:

Nos dice de que manera se comportan las frecuencias

Funciones en R:

En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de poisson pos
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de studen t
  • Distribución chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text {calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text {calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text {calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text {Genera datos aleatorios según una distribucion especifica} & \text{---}\\ \hline \end{array} \]

Distribucion exponencial

curve(dexp(x), from = 0, to = 10) #representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

#Generador de numeros aleatorios dentro de una distribución espefica y con numeros especificos a los que se va a ajustar
x <- rbinom(20, 1, 0.5)
x
##  [1] 1 0 0 1 0 1 1 1 0 0 1 0 0 1 1 1 0 1 0 1
#Genera 20 observaciones con distribución B(1, 0.5)

Contando exitos vs Fracasos

table(x)
## x
##  0  1 
##  9 11

Ejemplo: Distribución Normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es 0.5, la prbabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
  • Para calcular el cuantil 0.7 de una variable aleatoria normal estandar Z, es decir, un valor x tal que
qnorm(0.7)
## [1] 0.5244005
  • Para calcular el mismo cuantil pero para una v.a. normal de media 0 y DT 0.5
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtiene del comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una poblacion normal de medida 10 y desviacion tipica 1 (y guardarla en un vector x)
x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 10.225234 11.429440  8.042812 10.761611  9.389472 10.869378  8.374946
##   [8]  7.375305 11.936467 10.031472 11.180058 10.770682 11.383807  9.794828
##  [15]  9.493407 10.300844  8.868594 10.983062  9.904772 10.761126  8.944195
##  [22]  9.372657  8.632095  9.009886  9.124793 10.116817 11.275345  9.825686
##  [29]  9.729796  9.932211  8.681548  9.037251  9.706542 11.067142  9.239758
##  [36] 10.114853  9.750616 10.238091 10.911837  9.682877 11.334539 11.455785
##  [43] 10.186292 10.664500  9.425774  9.179693 11.160491 12.584428 11.976873
##  [50]  9.587667 11.094396 10.217323 11.163959 10.225755  9.632683  8.619597
##  [57]  9.739853 10.249338 10.487464 10.532929  9.706781 11.362865  9.156975
##  [64]  9.028532 11.085097 10.617391  8.856395  9.345653 11.274723 11.681235
##  [71] 10.226641  9.988548 10.893094 10.246682 11.539054 11.288099  9.592725
##  [78]  9.859841 10.036633  9.824194  8.796759 10.974680  8.299689 12.315949
##  [85] 10.615535 10.066643  9.376458  9.032370  9.920461  9.868654 11.068098
##  [92]  9.949601  8.765323  9.630908  9.908933  9.543509 11.378024 10.905234
##  [99]  9.463962 10.705556
  • Para estimar el promedio de x
mean(x)
## [1] 10.11988
  • Histograma de frecuencias
hist(x)

  • Gráfico de cajas y bigote
boxplot(x)

# Si salen puntos son valores atipicos
  • Histograma de la muestra (normalizado para que la suma de las areas de los rectangulos sean 1) junto con la densidad de la poblacion:
hist(x, freq = FALSE) #freq = false, para que el area del histograma sea 1, es decir, normalizarla

curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE) #add = TRUE, esto empalmara 2 graficas

Ejercicios

  1. Si \(z\) es una variable con distribucion normal estandar, calcula \(\mathbb{P} (-2.34< z < 4.78)\)
P = (pnorm(4.78, mean = 0, sd = 1) - pnorm( −2.34, mean = 0, sd = 1))
P 
## [1] 0.9903573

\[P = \{0.9903573\}\]

  1. Calcula el rango intercuartílico de una poblacion normal estándar
pob <- c(1,1,4,4,5,5,6,6,6,6,7,8,8,9)
summary(pob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   4.250   6.000   5.429   6.750   9.000

\[ IQR = {3erQ−1erQ}\]

Por lo tanto :

\[ IQR = \{6.75 − 4.25\} = 2.5\]

  1. Genera una muestra de tamaño 19 de población normal estandar. ¿cuál es la diferencia entre la media mostral y la poblacional? repite el ejercicio 3 veces y anota las 3 diferencias
  • Intento 1:
x <- rnorm(19, mean=5, sd=1)
x
##  [1] 3.523011 3.667334 3.988118 5.115116 5.108470 5.250974 5.382697 3.488845
##  [9] 3.522733 3.776621 2.507250 4.043480 6.012519 4.197631 4.394019 4.019880
## [17] 6.474068 4.736559 4.409990
  • Intento 2:
y <- rnorm(19, mean=5, sd=1)
y
##  [1] 3.954841 6.789272 5.283216 5.424829 4.031643 5.944237 5.149128 4.570490
##  [9] 5.095308 4.556795 3.983747 4.336350 2.536782 4.140211 6.583554 6.237206
## [17] 6.150069 6.092763 5.039582
  • Intento 3:
z <- rnorm(19, mean=5, sd=1)
z
##  [1] 4.870631 7.344857 4.687309 5.604565 4.365520 4.699320 4.120246 5.482250
##  [9] 4.567355 5.166026 3.589368 6.010327 4.675618 5.120013 5.912455 4.601111
## [17] 4.178444 4.794807 6.296796
  • Conclusión: A pesar de tener la misma cantidad de numero de datos, la misma media y hata la misma desviación estandar en cada intervalo es distinto, esto porque son números aleatorios en cada evento.
  1. Genera 1000 números con distribución de Poisson de parámetro \(\lambda = 1)\). Representa el gráfico de barras de los numeros obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?
Poiss <- rpois(1000, 1) 
Poiss
##    [1] 0 0 0 0 0 0 0 1 1 0 0 1 3 3 1 0 0 1 0 1 0 2 1 1 0 0 1 0 0 1 0 0 2 1 3 0 0
##   [38] 1 2 1 0 3 0 1 1 1 0 5 0 2 0 2 0 0 0 1 0 0 1 1 3 1 0 0 1 2 0 0 0 0 0 1 1 0
##   [75] 3 1 0 1 0 3 1 1 1 1 1 0 1 1 2 0 1 1 1 2 2 2 0 1 0 0 2 1 0 2 0 0 1 1 1 1 1
##  [112] 0 1 1 2 1 0 0 0 0 0 1 0 3 1 1 1 1 1 0 1 1 0 2 2 1 0 0 1 2 0 2 1 0 1 2 1 1
##  [149] 2 0 2 2 1 1 1 0 2 1 0 1 4 3 0 1 0 0 0 0 0 1 2 0 1 1 2 1 1 0 0 1 2 3 1 1 0
##  [186] 3 0 1 1 3 2 0 0 1 0 1 0 2 2 0 1 1 1 0 0 2 0 0 3 0 2 2 1 1 0 1 1 1 1 2 2 3
##  [223] 1 2 3 0 3 0 2 1 0 1 1 0 1 0 0 0 1 1 1 1 0 5 2 1 0 3 4 3 3 1 3 1 2 0 0 1 0
##  [260] 1 0 3 1 2 1 0 2 4 1 1 1 0 0 0 3 0 1 0 0 3 1 2 1 0 2 1 0 1 0 0 1 1 0 2 1 1
##  [297] 1 1 1 0 0 0 0 0 1 0 4 0 1 1 1 1 1 1 2 2 1 5 1 1 0 1 1 2 1 2 0 0 1 1 1 2 2
##  [334] 3 0 0 0 0 0 1 0 0 1 1 0 3 2 3 0 0 1 0 1 1 0 1 1 0 1 0 2 0 2 1 1 1 0 1 0 2
##  [371] 2 0 2 0 2 1 3 0 2 1 1 0 2 0 2 4 1 1 1 1 0 2 2 1 1 0 0 1 0 0 1 1 0 1 0 2 3
##  [408] 1 1 4 0 0 2 1 2 2 1 1 1 5 1 3 2 0 1 2 2 4 0 0 1 0 1 3 2 1 0 2 0 0 0 1 2 3
##  [445] 1 1 1 0 2 1 0 0 1 0 0 0 1 2 0 0 1 0 1 0 0 1 1 0 3 1 0 1 1 0 1 0 1 2 3 1 2
##  [482] 0 1 2 1 0 1 1 3 0 1 0 0 2 1 2 2 1 1 0 0 0 1 1 1 1 0 0 2 1 0 1 2 0 3 2 1 2
##  [519] 0 0 0 2 0 2 0 1 0 0 1 0 0 1 0 1 0 2 0 0 0 0 1 1 0 1 2 0 3 0 3 1 1 0 0 0 1
##  [556] 2 0 1 3 4 3 1 2 1 0 0 1 3 0 1 1 1 2 0 2 1 0 0 2 2 2 0 0 2 1 1 0 1 1 1 0 3
##  [593] 0 0 2 1 1 0 2 2 0 1 2 1 0 3 1 2 2 0 2 1 0 0 1 0 1 1 1 0 0 0 2 1 0 0 0 0 6
##  [630] 1 0 0 0 1 1 0 1 1 1 1 2 1 2 2 0 2 0 2 0 1 1 0 0 0 0 3 0 0 0 4 1 0 0 1 3 1
##  [667] 2 2 0 2 2 1 0 0 3 1 2 0 1 0 2 1 1 0 1 0 3 2 0 1 0 0 1 1 2 1 1 0 1 0 1 1 1
##  [704] 0 0 2 3 1 2 1 0 4 2 0 1 2 1 1 0 1 1 3 0 3 1 1 1 0 2 2 0 2 1 0 0 2 0 4 1 0
##  [741] 1 0 1 0 0 1 1 0 1 1 0 1 2 1 0 1 1 2 2 0 1 2 1 1 1 0 1 2 2 2 1 0 2 1 0 1 2
##  [778] 2 1 1 0 1 1 3 0 0 1 0 1 0 1 2 1 4 1 0 4 0 0 0 1 0 4 1 3 0 1 1 3 0 0 0 0 0
##  [815] 0 0 2 0 0 1 1 1 0 0 2 1 1 1 1 0 0 0 2 0 0 1 0 2 1 0 0 0 1 1 1 1 0 2 1 1 1
##  [852] 3 0 0 0 1 1 3 2 2 1 1 2 1 0 0 1 0 0 1 0 1 0 2 1 0 1 0 0 1 1 3 4 0 0 1 0 2
##  [889] 0 0 1 0 0 1 0 0 0 0 1 0 3 0 2 0 0 1 2 1 0 1 4 2 2 1 1 0 0 2 1 0 1 0 0 1 1
##  [926] 0 2 1 0 2 0 0 0 0 1 2 1 0 1 0 1 1 2 1 4 3 1 0 3 1 1 1 0 2 0 1 1 1 0 1 1 2
##  [963] 2 1 2 2 3 1 0 1 0 1 0 0 1 1 2 5 2 1 0 3 1 0 0 1 0 0 1 1 2 2 1 1 1 0 0 0 1
## [1000] 0
  • Media
mean(Poiss)
## [1] 0.982
  • Varianza
var(Poiss)
## [1] 1.036713
  • Histograma
hist(Poiss, xlab = "Distribucion de Poisson", main = paste("Histograma de Poisson"))

  1. Calcula con R los siguientes valores: \((t_{3,\alpha})\), \(\chi^2_ {3_ \alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Conclusión Para concluir con este tema en la distribución de probabilidad es una función que asigna a cada suceso sobre la variable la probabilidad de que dicho suceso ocurra, esto se puede ver a traves de las graficas, empalmando las graficas dando información mas o menos clara sobre como se pueden comportar las variables en su frecuencia aleatoria, esto nos sirve para saber como esperar vagamente como se comporten los resultados y saber cuando es mas frecuente la variable.