Introduccion a distribuciones de probabilidad

Una distribución de probabilidad es aquella que permite establecer toda la gama de resultados probables de ocurrir en un experimento determinado. Es decir, describe la probabilidad de que un evento se realice en el futuro.

La distribución de probabilidad es una herramienta fundamental para la prospectiva, puesto que con ella es posible diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos.

Las características más importantes a considerar en una distribución de probabilidad son:

La probabilidad de un resultado específico está entre cero y uno. La suma de las probabilidades de todos los resultados mutuamente excluyentes es 1.

Parte en R

En R podemos trabajar con las distribuciones de probabilidad usuales, ya sean continuas o discretas. Para ello, podemos recurrir a las siguientes 4 funciones específicas de R:

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

Distribución Alias Distribución binomial binom Distribución de Poisson pois Distribución normal norm Distribución exponencial exp Distribución t de Student t Distribución \(\chi^2\) chisq Distribución F f

Por ejemplo, dexp(x) es la función de densidad de una distribución exponencial de media 1 mientras que rbinom(100, 1, 0.5) genera 100 números aleatorios con distribución \(B(1,0.5)\). Veamos algunos ejemplos en los que aparecen estos comandos:

setwd("~/Documents/ESTADISTICA")
rbinom(50, 1, 0.5)
##  [1] 1 1 1 1 1 0 0 1 0 0 0 1 1 0 0 0 1 0 1 1 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 0
## [39] 0 0 0 0 0 1 0 0 0 0 1 0

Para generar una curva de distribucion exponencial

curve (dexp(x), from= 0, to =10)

Distribucion binomial

Para generar 20 observaciones aleatorias con distribucion: B(1,0.5)

set.seed(123)
x <- rbinom(100,1,0.5)
x
##   [1] 0 1 0 1 1 0 1 1 1 0 1 0 1 1 0 1 0 0 0 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 0 0 1
##  [38] 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 1 1 1 0 1 1 1 0
##  [75] 0 0 0 1 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 0 0 1 0 0 1

Para calcular las frecuencias absolutas de los valores generados

table(x)
## x
##  0  1 
## 53 47

La distribucion normal

En estadística y probabilidad se llama distribución normal, distribución de Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en estadística y en la teoría de probabilidades.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística descriptiva solo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.

Ejercicios de distribucion normal

  1. Si \(X\) es una variable aleatoria con distribucion normal de media de 3 y una desviacion estandar de 0.5

Estime la probabilidad de que \(X\) sea menor que 3.5

pnorm(3.5, mean= 3, sd = 0.5, lower.tail = TRUE)
## [1] 0.8413447
  1. Si tienes un conjunto de datos con una varianza de 25 y una media de 50, cual es la probabilidad de que \(X\) sea mayor de 48, utilice la distribucion normal para contestar
pnorm(48, mean=50, sd = sqrt(25), lower.tail = FALSE)
## [1] 0.6554217
  1. Calcular la probabilidad de que X sea mayor o igual a 45 y menor que 55, es decir:

$ P(45X < 55) $

pnorm(55, 50, sqrt (25)) - pnorm(45, 50, sqrt (25)) 
## [1] 0.6826895
  1. ¿Cuál es el valor de X que deja un 90% por debajo de el?
qnorm(0.90, mean=50, sd = sqrt(25)     )
## [1] 56.40776
  1. Densidad de probabilidad se puede usar dnorm para construir el gráfico de la distribución de probabilidad de X usando el comando curve.
curve(dnorm(x, mean=50, sd = sqrt(25)), xlim = c(35,65), xlab = "Valores de x", ylab = "densidad de x"            )