Variable aleatoria
Una variable asociada al resultado de un experimento aleatorio
- cantidad de caras obtenidas al lanzar una moneda \(n\) veces
- suma puntos obtenidos al tirar un dado \(n\) veces
- edad de una persona elegida aleatoriamente
- cantidad de personas que ingresan como pacientes a un hospital un
día aleatoriamente elegido
- porcentaje de votos que obtiene un candidato en una muestra
aleatoria
Variable aleatoria discreta: Solo asume valores enteros
Ejemplo
- se arroja una moneda una vez
- se define la variable a aleatoria \(x\) como el número de caras obtenido
- se llama éxito al evento cara
- resultados posibles del experimento: x, c
- valores posibles de la variable: \(x=0\), \(x=1\)
- probabilidad de ninguna cara:
Variable aleatoria discreta
Mismo ejemplo con tres lanzamientos
- se define la variable a aleatoria \(x\) como el número de caras obtenido
- se llama éxito al evento cara
- resultados posibles del experimento: ccc, ccx, cxc, cxx, xcc, xcx,
xxc, xxx
- valores posibles de la variable: \(x=0\), \(x=1\), \(x=2\), \(x=3\)
- probabilidad de ninguna cara:
Variable aleatoria discreta
Si se arrojara cinco veces, el cálculo manual se vuelve muy
lento
- contamos con un modelo para este tipo de experimento
Modelo binomial
Si una variable proviene de \(n\)
repeticiones de una experimento en el que la probabilidad de éxito es
\(p\); la probabilidad de obtener
exactamente x éxitos es:
\[\binom{n}{x}*p^x*(1-p)^{(n-x)}
\]
Modelo binomial
Parámetros
- \(n\): número de repeticiones del
experimento
- \(p\): probabilidad de éxito a cada
repetición
Modelo binomial
Aplicado al ejemplo
\(n\ =\ 3\); \(p\ =\ \frac{1}{2}\)
\[P(x=0)=
\binom{3}{0}*(\frac{1}{2})^0*(1-\frac{1}{2})^{(3-0)}=1*1*\frac{1}{2}^3=\frac{1}{8}
\]
Calculadora de probabilidades en Infostat

Elección del modelo, los parámetros y el valor de la variable

Resultado

Probabilidad de obtener al menos una cara
Equivale a obtener más de cero éxitos: \(P(x>0)\)
En Infostat

En R
Función de densidad
dbinom(0,3,.5)
## [1] 0.125
dbinom(2,3,.5)
## [1] 0.375
En R
Función de distribución
pbinom(0,3,.5)
## [1] 0.125
pbinom(2,3,.5)
## [1] 0.875
Ejemplo
Una enfermedad afecta al 5% de la población de una comunidad. ¿Cuál
es la probabilidad de que en una muestra de 80 personas haya más de 6
afectados?
- cada persona que se selecciona tiene probabilidad \(0.05\) de estar afectada
- se repite esta selección \(80\)
veces
- los parámetros: \(n\ =\ 80\), \(p\ =\ 0.05\)
- la pregunta: \(P(x>6)\)
Cálculo de probabilidades \(P(x \leq
6)\) si \(x \sim B(n=80,
p=.05)\)
pbinom(6,80,.05)
## [1] 0.8947147
Cálculo de \(P(x > 6)\) si \(x \sim B(n=80, p=.05)\)
1 - pbinom(6,80,.05)
## [1] 0.1052853
Ejemplo
¿Cuántos se esperaría que estuviesen afectados en la
muestra?
- el resultado se llama esperanza y se calcula
\[E(x)=n*p\]
- es un valor promedio a futuro
- si se sacaran muchas muestras de 80 casos cada una, en algunas de
ellas habrá cuatro, en otras menos, en otras más de cuatro
- el promedio de las cantidades de afectados en todas esas muestras es
cuatro
La cantidad de casos que puede aparecer en la muestra va de 0 a 80,
pero con diferentes probabilidades

Variable aleatoria continua
Con valores en el intervalo [a, b]
- la probabilidad de un valor particular es cero
- la suma de las probabilidades de “todos” los valores es uno
Variable aleatoria continua
Las probabilidades se representan gráficamente

Variable aleatoria continua
Un valor único define una área nula

Variable aleatoria continua
Se calculan probabilidades acumuladas

Variable aleatoria continua
Que se llama función de distribución
\[F(x)=P(X \leq x) \]
Variable aleatoria continua
Es el área bajo la función de densidad \(f(x)\)
\[ F(x)=P(X\leq
x)=\int_{a}^{x}{f(x)dx}\]
Variable aleatoria continua
Probabilidad de hallar a la variable dentro de un intervalo

La probabilidad acumulada hasta un valor
Es el área bajo la curva

Distribución normal
Curva unimodal y simétrica

Distribución normal
Parámetros
- media poblacional: \(\mu\)
(mu)
- varianza poblacional: \(\sigma^2\)
(sigma cuadrado) o la desviación estándar: \(\sigma\) (sigma)
Distribución normal de la estatura de personas adultas (Japón,
1990)
Parámetros
- media poblacional: \(\mu =
170.4cm\)
- varianza poblacional: \(\sigma^2 =
31.36cm^2\)
- desviación estándar: \(\sigma =
\sqrt{31.36cm^2}=5.6cm\)
Su gráfico

Probabilidad de encontrar personas con estatura de 165cm o menos:
\(P(x \leq 165)\)

Probabilidad de encontrar personas con estatura de 165cm o más:
\(P(x \geq 165cm)\)

Probabilidad de encontrar personas con estatura entre 165cm y 170cm:
\(P(165 \leq x \leq 170)\)

Cálculo de \(P(x \leq 165)\) si
\(x \sim N(\mu = 170.4, \sigma =
5.6)\)
pnorm(165, 170.4, 5.6)
## [1] 0.1674514
Cálculo de \(P(x \geq 165)\) si
\(x \sim N(\mu = 170.4, \sigma =
5.6)\)
1 - pnorm(165, 170.4, 5.6)
## [1] 0.8325486
\(P(165 \leq x \leq 170)\) si \(x \sim N(\mu = 170.4, \sigma = 5.6)\)
Se calcula como la diferencia
- entre lo acumulado hasta \(x=170\)
- y lo acumulado hasta \(x=165\)
- \(P(165 \leq x \leq 170) = P(x \leq 170) -
P(x \leq 165)\)
pnorm(170, 170.4, 5.6) - pnorm(165, 170.4, 5.6)
## [1] 0.304077
Gráficamente

Distribución normal estándar
Cuando
- la media es cero: \(\mu = 0\)
y
- la varianza y la desviación estándar es uno: \(\sigma^2 = 1\), \(\sigma = 1\)
Distribución normal estándar
Se expresa en términos de la variable \(z\)
\[z=\frac{x-\mu}{\sigma}\]
Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-2.54)=0.005\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-1.96)=0.025\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(z<-1.64)=0.05\) si \(z \sim N(\mu = 0, \sigma = 1)\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-2.54<z<2.54)=0.99\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-1.96<z<1.96)=0.95\)

Algunos valores de probabilidad bajo el modelo normal estándar \(P(-1.64<z<1.64)=0.90\)

Otros modelos de probabilidad
Distribución \(\chi^2\) (ji
cuadrado o chi cuadrado)
- es la suma de \(v\) variables
aleatorias con distribución normal estándar
- parámetro: los grados de libertad (\(v\) o \(df\))
Distribución \(\chi^2\) con cuatro
grados de libertad

\(P(x \leq 5)\) si \(x \sim \chi^2_4\)

Cálculo
\(P(x \leq 5)\) si \(x \sim \chi^2_4\)
pchisq(5, 4)
## [1] 0.7127025
\(P(2 \leq x \leq 5)\) si \(x \sim \chi^2_4\)

Cálculo
\(P(2 \leq x \leq 5)\) si \(x \sim \chi^2_4\)
- \(P(x \leq 5) - P(x \leq 2)\)
pchisq(5,4) - pchisq(2,4)
## [1] 0.4484614
Otros modelos de probabilidad
Distribución t de student
- es el cociente entre una variable normal estándar y la raiz cuadrada
de una ji cuadrado dividida su grados de libertad
- parámetro: los grados de libertad (\(v\) o \(df\))
Distribución t con tres grados de libertad

Distribución t con treinta grados de libertad

\(P(x \leq 1)\) si \(x \sim t_{20}\)

\(P(x \leq 1)\) si \(x \sim t_{20}\)
pt(1,20)
## [1] 0.8353717
Otros modelos de probabilidad
Distribución F de Fisher
- es el cociente entre dos distribuciones \(\chi^2\) cada una dividida sus grados de
libertad
- parámetro: los grados de libertad del numerador y del denominador
(\(u\) y \(v\) o \(df_1\) y \(df_2\))
Distribución \(F\) con 5 y 7 grados
de libertad

Distribución \(F\) con 20 y 7
grados de libertad

\(P(x \leq 3)\) si \(x \sim F_{20,\ 7}\)

\(P(x \leq 3)\) si \(x \sim F_{20,\ 7}\)
pf(3, 20, 7)
## [1] 0.9292603
\(P(x \geq 1)\) si \(x \sim F_{20,\ 7}\)

Cálculo de probabilidades \(P(x \geq
1)\) si \(x \sim F_{20,\
7}\)
1-pf(1, 20, 7)
## [1] 0.5401532