Las distribuciones de probabilidad son funciones que asignan probabilidades a cada valor posible de una variable aleatoria 𝑋. Una distribución continua significa que 𝑋 puede asumir uno de un número infinito de valores diferentes (no contables).

Distribución Uniforme:

Para denotar que una variable aleatoria 𝑋 sigue una distribución uniforme, se usa: \[ X \thicksim U (a,b) a<x<b \] Con ello, la fórmula de la distribución uniforme sería: \[ P(X<x)= \frac{1}{b-a}du=\frac{x-a}{b-a} \\ x \in [a,b] \] Con media: \[ \mu = \frac{a+b}{2} \] En R tenemos las siguientes funciones para la distribución uniforme:

Funciones Descripciones
dunif(x, min=0, max=1, log=F) Evalua la función de densidad
punif(x, min=0, max=1, lower.tail=T, log.p=F) Evalua la función acumulada
qunif(p, min=0, max=1, lower.tail=T, log.p=F) Evalua la función de cuantiles
runif(n, min=0, max=1) Devuelve un vector de valores aleatorios

Donde:

  • x: es el vector de cuantiles.
  • p: es el vector de probabilidades.
  • m: es el número de observaciones.
  • min: es el límite inferior de la distribución.
  • max: es el límite superior de la distribución.
  • log, log.p: es el parámetro booleano. Si es TRUE, las probabilidades son devueltas como log(p).
  • lower.tail: es el parámetro booleano, por defecto es TRUE.

Ejemplo:

Las ventas de combustible en una gasolinera tienen, por día, una media de 40 000 litros y un mínimo de 30 000. Suponer que una distribución es apropiada. Determinar las ventas máximas diarias y responder la siguiente pregunta: ¿Qué porcentaje de días las ventas excederán los 34 000 litros?

Solución: los datos que tenemos son u = 40000 y a = 30000.

\[ \mu = \frac{a+b}{2} \\ 40000 = \frac{30000+b}{2} \\ b = 50000 \] La venta máxima es 50000 litros. \[ P(X>34000)=1-P(X<34000)=1-\frac{34000-30000}{50000-30000} \\ P(X>34000)=1-\frac{40000}{20000}=0.8 \] En R:

## [1] "La probabilidad es de 80%."

Por lo tanto, el porcentaje de días donde las ventas excederán 34 000 litros es 80 %.

Distribución Normal o Gaussiana

Para denotar que una variable aleatoria 𝑋 sigue una distribución normal se usa: \[ X \thicksim N(\mu, \sigma) \] Donde \(\mu\) es la media, y , la desviación estándar típica. La fórmula de la distribución es: \[ F(X)=P(X<x)=\frac{1}{\sigma \sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{(v-\mu)^2}{2\sigma^2}}dv \] Cambio de variable: \[ \mu = \frac{v-u}{\sigma}\rightarrow v=\sigma\mu+\mu\rightarrow dv=\sigma du \] Reemplazando: \[ F(z)=\frac{1}{\sigma \sqrt2\pi} \int_{-\infty}^{z} e^\frac{u^2}{2} \sigma du \] Simplificando \(\sigma\): \[ F(z) = P(Z<z)=\frac{1}{\sqrt{2\pi}} \int_{z}^{-\infty} e^\frac{\mu^2}{2}du \] La distribución normal en R:

Funciones Descripciones
dnorm(x, mean=0, sd=1, log=F) Evalua la función de densidad
pnorm(x, mean=0, sd=1, lower.tail=T, log.p=F) Evalua la función acumulada
qnorm(p, mean=0, sd=1, lower.tail=T, log.p=F) Evalua la función de cuantiles
rnorm(n, mean=0, sd=1) Devuelve un vector de valores aleatorios

Donde:

  • x: el vector de cuantiles.
  • mean: es el vector de medias. Por defecto es igual a cero.
  • sd: es el vector de desviación típica. Por defecto es igual a uno.
  • p: es el vector de probabilidades.
  • n: es el número de observaciones.

Ejemplo:

La media de los pesos de 500 estudiantes de un colegio es 70 𝑘𝑔, y la desviación típica 3 𝑘𝑔. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan entre 60 𝑘𝑔 y 75 𝑘𝑔.

Solución: la \(\mu\) es 70 kg., y la \(sd\) es 3 kg.

Entonces, aplicando la fórmula: \[ P(60<X<75)=P(\frac{60-70}{3}<Z<\frac{75-70}{3})=P(\frac{-10}{3}<Z<\frac{5}{3}) \\ P(\frac{-10}{3}<Z<\frac{5}{3})=P(Z<\frac{5}{3}-(P(Z<\frac{-10}{3}) \\ P(\frac{-10}{3}<Z<\frac{5}{3})=P(Z<\frac{5}{3}-(1-P(Z<\frac{-10}{3})) \\ P(\frac{-10}{3}<Z<\frac{5}{3})=P(Z<1.67)-1+P(Z<3.33) \] Usando la tabla N(0,1): \[ P(\frac{-10}{3}<Z<\frac{5}{3})=0.9525-1+0.99957 = 0.95207 \] En R

Usando la fórmula X:

## [1] "Existe la probabilidad de que el  95.178 % de estudiantes pesen entre 60 kg y 75 kg, es decir,  476 estudiantes."

Usando la Z:

## [1] "Existe la probabilidad de que el  95.178 % de estudiantes pesen entre 60 kg y 75 kg, es decir,  476 estudiantes."

Por lo tanto, hay 476 estudiantes que pesan entre 60 𝑘𝑔 y 75 𝑘𝑔.

Distribución Chi Cuadrada

Para denotar que una variable aleatoria \(X=Z_{1}^{2}+...+Z_{n}^{2}\) sigue una distribución chi-cuadrada se usa: \[ X \thicksim X_{n}^{2} \] Donde \(Z_i\) son variables aleatorias y n representa el grado de libertad.

Función Densidad: \[ X_{n}^{2}=\frac{x^{\frac{n}{2}}*e^{-\frac{x}{2}}}{2^{\frac{n}{2}}\Gamma \frac{n}{2}} \] Distribución Chi cuadrado: \[ P(X_{n}^{2}<x)=\int_{0}^{x} X_{n}^{2}(\mu)du \] La distribución Chi Cuadrada en R:

Funciones Descripciones
dchisq(x, df, ncp=0, log=F) Evalua la función de densidad
pchisq(q, df, ncp=0, lower.tail=T, log.p=F) Evalua la función acumulada
qchisq(p, df, ncp=0, lower.tail=T, log.p=F) Evalua la función de cuantiles
rchisq(n, df, ncp=0) Devuelve un vector de valores aleatorios

Donde:

  • x,q: vector de cuantiles.
  • df: grados de libertad.
  • ncp: parámetro que determina la centralidad de la gráfica chi cuadrada. Si se omite, el estudio se realiza con la gráfica no centralizada.
  • p: vector de probabilidades.
  • n: número de observaciones.

Ejemplo:

Calcular 𝑃(χ2 > 21) para el grado de libertad igual a 8.

Solución: Se visualiza la tabla de distribución chi-cuadrada tomando en cuenta que el grado de libertad es 8 y χ2 > 21. Es decir, 𝑃(χ2 > 21) ∈ [0.005,0.010].

Distribución Chi Cuadrada En R

## [1] "La probabilidad es de 0.00715"

Por lo tanto \(P(X^2>21)?0.00715\) y se encuentra entre [0.005,0.010]

Distirbución Exponencial

Para denotar que una variable aleatoria X sigue una distribución exponencial se usa: \[ X \thicksim exp(\lambda) \] La fórmula es la siguiente: \[ p(X<x)=\left\{ \begin{array}{ll} 0,\ \text{para}\ x<0\ \\ 1-e^{\lambda x},\ \text{para}\ x>0\ \end{array} \right. \] La distribución exponencial en R:

Funciones Descripciones
dexp(x, rate=1, log=F) Evalua la función de densidad
pexp(q, rate=1, lower.tail=T, log.p=F) Evalua la función acumulada
qexp(p, rate=1, lower.tail=T, log.p=F) Evalua la función de cuantiles
rexp(n, rate=1) Devuelve un vector de valores aleatorios

Donde:

  • x,q: vector de cuantiles.
  • rate: vector de tasas.
  • p: vector de probabilidades.

Ejemplo:

El tiempo que transcurre entre la ocurrencia de un temblor y el siguiente tiene una media de seis meses. Suponiendo una distribución exponencial para los tiempos de interocurrencia, calcular la probabilidad de que no ocurra ningún temblor en los siguientes seis meses.

Solución: la variable aleatoria X = “Tiempo de interocurrencia”. Donde la media es \(\lambda\) = 1/6, y x = 6. Entonces: \[ P(x>6)=1-P(x<6)=1-(1*e^{- \frac{1}{6}*6}) = e^{-1} = 0.3679 \] En R:

## [1] "La probabilidad es  0.3679"

Distribución T Student

La fórmula es la siguiente: \[ P(t_n<x) = \int_{-\infty}^{x} t_n(\mu)d \mu \] Donde $t_n(x)=(1+) $ es la función densidad y \(n\), el grado de libertad.

La distribución de T Student en R:

Funciones Descripciones
dt(x, df, ncp, log=F) Evalua la función de densidad
pt(q, df, ncp, lower.tail=T, log.p=F) Evalua la función acumulada
qt(p, df, ncp, lower.tail=T, log.p=F) Evalua la función de cuantiles
rt(n, df, ncp) Devuelve un vector de valores aleatorios

Donde:

  • x,q: es el vector de cuantiles.
  • df: representa los grados de libertad.
  • ncp: es el parámetro que determina la centralidad de la gráfica t-student. Si se omite, el estudio se realiza con la gráfica centralizada en 0.
  • p: es el vector de probabilidades.

Ejemplo:

Hallar el valor de 𝑥 en 𝑃(𝑡 > 𝑥) = 0.01 siguiendo una distribución 𝑡 −student con grado de libertad igual a 6.

La solución:

Distribución T Student En R se ingresan los datos:

## [1] "El cuantil es  3.143"

Ejemplos

Ejemplo 1: Distribución Exponencial

La vida media de una hervidora es de 18 meses, esta es una variable aleatoria distribuida exponencialmente. ¿Cuál es la probabilidad de que la hervidora falle después de los 20 meses?

\[ X = 20 \\ \lambda = \frac{1}{8} \\ P (X>20) = 1 - P(x<20) \\ 1-P(x<20)=1-(1-e^{-\frac{1}{18}*20}) = \frac{1}{18}*20} = 0.32919 \] En R:

## [1] 0.082085

Por lo tanto, la probabilidad de que la hervidora falle después de los 20 meses es de 0.3292 (32.92 %).

Ejemplo 2: Distribución Normal

Los diseñadores de un nuevo tipo de cabina de avión quieren colocar un interruptor de tal forma que la mayoría de los pilotos puedan alcanzarlo sin tener que cambiar de posición. Se sabe que la distribución de la distancia máxima (en 𝑐𝑚) que pueden alcanzar los pilotos sin moverse desde el respaldo del asiento es 𝑁(125,10).Si se pone el interruptor a 120 𝑐𝑚 del respaldo del asiento, ¿qué proporción de pilotos no podrá alcanzarlo sin moverse del asiento?

La proporción viene dada por 𝑃(𝑋 < 120), donde 𝑋~𝑁(125,10): \[ P(x<120)=P(Z<\frac{120-125}{10})=P(Z<-0.5) \\ P(X<120)=1-P(Z<0.5) \\ P(x<120)=1-0.6915 \\ P(X<120)=0.3085 \] En R:

## [1] "El valor de Z es  -0.5"
## [1] "La probabilidad es de 30.85%."

Segunda forma:

## [1] "La probabilidad es de 30.85%."

Ejemplo 3: Distribución T-Student:

Calcular el percentil 𝑤0 = 95 y 𝑤1 = 25 en cada uno de los siguientes casos:

  • 1.- Es una distribución t-student con 3 grados de libertad.
  • 2.- Es una distribución t-student con 30 grados de libertad.

En R calculamos el percentil \(w_o\) = 95: En una distribución t-student con 3 grados de libertad.

## [1] "El percentil w0=95 con grado de libertad 3 es 2.35336"

En una distribución t-student con 3 grados de libertad.

## [1] "El percentil w0=25 con grado de libertad 3 es -0.764892"

En R calculamos el percentil \(w_o\) = 25: En una distribución t-student con 30 grados de libertad.

## [1] "El percentil w0=95 con grado de libertad 30 es 1.69726"

En una distribución t-student con 30 grados de libertad.

## [1] "El percentil w0=25 con grado de libertad 30 es -0.682756"

Ejemplo 4: Gráfica de Función Densidad en Distribución Normal

Para ello se instala el paquete ‘tigerstats’. Y se llama con ’library(tigerstats)

Ingresamos los datos:

Se usa la función ‘pnormGC’:

## [1] 0.4522096

Otra forma es:

Ejemplo 5: Distribución Chi-cuadrada

Hallar el valor de \(m\) en: * \(P(X<11.070497)=m\) * \(P(x>m)=0.306219\)

COn una distribución Chi-cuadrada y grado de libertad igual a 5. Entonces se tiene: \[ P(x<11.070497)=m \] Para resolverlo, se debe usar ‘pchisq’:

## [1] 0.95

Luego: \[ P(x>m)=0.306219 \] Para resolverlo, se debe usar ‘qchisq’:

## [1] 5.999999

Ejemplo 6: Gráfica de una Función Densidad en Distribución Chi-cuadrada

Ingresamos los datos:

Usando las funciones ‘curve’ (para la línea) y ‘polygon’ (para el relleno).

Bibliografía