Variable aleatoria

Una variable asociada al resultado de un experimento aleatorio

  • cantidad de caras obtenidas al lanzar una moneda \(n\) veces
  • suma puntos obtenidos al tirar un dado \(n\) veces
  • edad de una persona elegida aleatoriamente
  • cantidad de personas que ingresan como pacientes a un hospital un día aleatoriamente elegido
  • porcentaje de votos que obtiene un candidato en una muestra aleatoria

Variable aleatoria discreta: Solo asume valores enteros

Ejemplo

  • se arroja una moneda una vez
  • se define la variable a aleatoria \(x\) como el número de caras obtenido
  • se llama éxito al evento cara
  • resultados posibles del experimento: x, c
  • valores posibles de la variable: \(x=0\), \(x=1\)
  • probabilidad de ninguna cara:
    • \(P(x=0)=\frac{1}{2}\)

Variable aleatoria discreta

Mismo ejemplo con tres lanzamientos

  • se define la variable a aleatoria \(x\) como el número de caras obtenido
  • se llama éxito al evento cara
  • resultados posibles del experimento: ccc, ccx, cxc, cxx, xcc, xcx, xxc, xxx
  • valores posibles de la variable: \(x=0\), \(x=1\), \(x=2\), \(x=3\)
  • probabilidad de ninguna cara:
    • \(P(x=0)=\frac{1}{8}\)

Variable aleatoria discreta

Si se arrojara cinco veces, el cálculo manual se vuelve muy lento

  • contamos con un modelo para este tipo de experimento

Modelo binomial

Si una variable proviene de \(n\) repeticiones de una experimento en el que la probabilidad de éxito es \(p\); la probabilidad de obtener exactamente x éxitos es:

\[\binom{n}{x}*p^x*(1-p)^{(n-x)} \]

Modelo binomial

Parámetros

  • \(n\): número de repeticiones del experimento
  • \(p\): probabilidad de éxito a cada repetición

Modelo binomial

Aplicado al ejemplo

\(n\ =\ 3\); \(p\ =\ \frac{1}{2}\)
\[P(x=0)= \binom{3}{0}*(\frac{1}{2})^0*(1-\frac{1}{2})^{(3-0)}=1*1*\frac{1}{2}^3=\frac{1}{8} \]

Calculadora de probabilidades en Infostat

Elección del modelo, los parámetros y el valor de la variable

Resultado

Probabilidad de obtener al menos una cara

Equivale a obtener más de cero éxitos: \(P(x>0)\)

En Infostat

En R

Función de densidad

dbinom(0,3,.5) 
## [1] 0.125
dbinom(2,3,.5)
## [1] 0.375

En R

Función de distribución

pbinom(0,3,.5) 
## [1] 0.125
pbinom(2,3,.5)
## [1] 0.875

Ejemplo

Una enfermedad afecta al 5% de la población de una comunidad. ¿Cuál es la probabilidad de que en una muestra de 80 personas haya más de 6 afectados?

  • cada persona que se selecciona tiene probabilidad \(0.05\) de estar afectada
  • se repite esta selección \(80\) veces
  • los parámetros: \(n\ =\ 80\), \(p\ =\ 0.05\)
  • la pregunta: \(P(x>6)\)

Cálculo de probabilidades \(P(x \leq 6)\) si \(x \sim B(n=80, p=.05)\)

pbinom(6,80,.05)
## [1] 0.8947147

Cálculo de \(P(x > 6)\) si \(x \sim B(n=80, p=.05)\)

1 - pbinom(6,80,.05)
## [1] 0.1052853

Ejemplo

¿Cuántos se esperaría que estuviesen afectados en la muestra?

  • el resultado se llama esperanza y se calcula
    \[E(x)=n*p\]
  • es un valor promedio a futuro
  • si se sacaran muchas muestras de 80 casos cada una, en algunas de ellas habrá cuatro, en otras menos, en otras más de cuatro
  • el promedio de las cantidades de afectados en todas esas muestras es cuatro

La cantidad de casos que puede aparecer en la muestra va de 0 a 80, pero con diferentes probabilidades

Variable aleatoria continua

Con valores en el intervalo [a, b]

  • la probabilidad de un valor particular es cero
    • \(P(x=A)=0\)
  • la suma de las probabilidades de “todos” los valores es uno
    • \(P(a \leq x \leq b)=1\)

Variable aleatoria continua

Las probabilidades se representan gráficamente

Variable aleatoria continua

Un valor único define una área nula

Variable aleatoria continua

Se calculan probabilidades acumuladas

Variable aleatoria continua

Que se llama función de distribución

\[F(x)=P(X \leq x) \]

Variable aleatoria continua

Es el área bajo la función de densidad \(f(x)\)

\[ F(x)=P(X\leq x)=\int_{a}^{x}{f(x)dx}\]

Variable aleatoria continua

Probabilidad de hallar a la variable dentro de un intervalo

Distribución uniforme discreta

Distribución uniforme discreta

Si es un dado

Variable continua con distribución uniforme en el intervalo [1, 6]

La probabilidad acumulada hasta un valor

Es el área bajo la curva

Si \(x\) es una variable aleatoria con distribución uniforme entre \(1\) y \(6\)

\(P(x \leq 4)\) si \(x \sim U(a=1, b=6)\)

punif(4, 1,6)
## [1] 0.6

Distribución normal

Curva unimodal y simétrica

Distribución normal

Parámetros

  • media poblacional: \(\mu\) (mu)
  • varianza poblacional: \(\sigma^2\) (sigma cuadrado) o la desviación estándar: \(\sigma\) (sigma)

Distribución normal de la estatura de personas adultas (Japón, 1990)

Parámetros

  • media poblacional: \(\mu = 170.4cm\)
  • varianza poblacional: \(\sigma^2 = 31.36cm^2\)
  • desviación estándar: \(\sigma = \sqrt{31.36cm^2}=5.6cm\)

Su gráfico

Probabilidad de encontrar personas con estatura de 165cm o menos: \(P(x \leq 165)\)

Probabilidad de encontrar personas con estatura de 165cm o más: \(P(x \geq 165cm)\)

Probabilidad de encontrar personas con estatura entre 165cm y 170cm: \(P(165 \leq x \leq 170)\)

Cálculo de \(P(x \leq 165)\) si \(x \sim N(\mu = 170.4, \sigma = 5.6)\)

pnorm(165, 170.4, 5.6)
## [1] 0.1674514

Cálculo de \(P(x \geq 165)\) si \(x \sim N(\mu = 170.4, \sigma = 5.6)\)

1 - pnorm(165, 170.4, 5.6)
## [1] 0.8325486

\(P(165 \leq x \leq 170)\) si \(x \sim N(\mu = 170.4, \sigma = 5.6)\)

Se calcula como la diferencia

  • entre lo acumulado hasta \(x=170\)
  • y lo acumulado hasta \(x=165\)
  • \(P(165 \leq x \leq 170) = P(x \leq 170) - P(x \leq 165)\)
pnorm(170, 170.4, 5.6) - pnorm(165, 170.4, 5.6)
## [1] 0.304077

Gráficamente

Distribución normal estándar

Cuando

  • la media es cero: \(\mu = 0\) y
  • la varianza y la desviación estándar es uno: \(\sigma^2 = 1\), \(\sigma = 1\)

Distribución normal estándar

Se expresa en términos de la variable \(z\)

\[z=\frac{x-\mu}{\sigma}\]

Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-2.54)=0.005\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-1.96)=0.025\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-1.64)=0.05\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-2.54<z<2.54)=0.99\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-1.96<z<1.96)=0.95\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-1.64<z<1.64)=0.90\)

Otros modelos de probabilidad

Distribución \(\chi^2\) (ji cuadrado o chi cuadrado)

  • es la suma de \(v\) variables aleatorias con distribución normal estándar
  • parámetro: los grados de libertad (\(v\) o \(df\))

Distribución \(\chi^2\) con cuatro grados de libertad

\(P(x \leq 5)\) si \(x \sim \chi^2_4\)

Cálculo

\(P(x \leq 5)\) si \(x \sim \chi^2_4\)

pchisq(5, 4)
## [1] 0.7127025

\(P(2 \leq x \leq 5)\) si \(x \sim \chi^2_4\)

Cálculo

\(P(2 \leq x \leq 5)\) si \(x \sim \chi^2_4\)

  • \(P(x \leq 5) - P(x \leq 2)\)
pchisq(5,4) - pchisq(2,4)
## [1] 0.4484614

Otros modelos de probabilidad

Distribución t de student

  • es el cociente entre una variable normal estándar y la raiz cuadrada de una ji cuadrado dividida su grados de libertad
  • parámetro: los grados de libertad (\(v\) o \(df\))

Distribución t con tres grados de libertad

Distribución t con treinta grados de libertad

\(P(x \leq 1)\) si \(x \sim t_{20}\)

\(P(x \leq 1)\) si \(x \sim t_{20}\)

pt(1,20)
## [1] 0.8353717

Otros modelos de probabilidad

Distribución F de Fisher

  • es el cociente entre dos distribuciones \(\chi^2\) cada una dividida sus grados de libertad
  • parámetro: los grados de libertad del numerador y del denominador (\(u\) y \(v\) o \(df_1\) y \(df_2\))

Distribución \(F\) con 5 y 7 grados de libertad

Distribución \(F\) con 20 y 7 grados de libertad

\(P(x \leq 3)\) si \(x \sim F_{20,\ 7}\)

\(P(x \leq 3)\) si \(x \sim F_{20,\ 7}\)

pf(3, 20, 7)
## [1] 0.9292603

\(P(x \geq 1)\) si \(x \sim F_{20,\ 7}\)

Cálculo de probabilidades \(P(x \geq 1)\) si \(x \sim F_{20,\ 7}\)

1-pf(1, 20, 7)
## [1] 0.5401532