# Verificar, instalar y activar el paquete "tidyverse"if (!require(tidyverse)) {install.packages("tidyverse")}library(tidyverse)# Verificar, instalar y activar el paquete "kableExtra"if (!require(kableExtra)) {install.packages("kableExtra")}library(kableExtra)
2 . Introducción
Para el desarrollo de técnicas de inferencia estadística, es conveniente relacionar directamente los resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las características de interés es más productivo.
Dependiendo de si la variable resultante es discreta (solo pueden adoptar un número finito o una infinidad enumerable de valores) o continua (los valores están asociados con una escala continua de medición), es posible describir su comportamiento probabilístico a partir de la función de probabilidad o de la función de densidad, respectivamente.
Además, por medio de estas funciones es posible calcular todo tipo de medidas (e.g., tendencia central) a nivel “poblacional”. En este contexo, tales medidas se denominan parámetros.
3 . Objetivos
1 Apropiarse del concepto de variable aleatoria.
2 Conocer, entender y usar apropiadamente los conceptos de función de probabilidad o función de distribución, según sea el caso.
3 Apropiarse de los conceptos de valor esperado y varianza poblacional.
4 . Conceptos preliminares
Las siguientes definiciones están siempre basadas en un espacio de probabilidad (\Omega , A,P)
4.1 . Variable aleatoria (v.a.)
Una v.a. X es una función cuyo dominio es $ $ y recorrido , R que asigna un único número real a cada resultado del espacio muestral \Omega de un experimento aleatorio. De tal forma que la inversa de R calculada en un subconjunto de los reales, siempre pertenece a A
X: \Omega\to \mathbb{R}: w \mapsto X\bigl(\begin{smallmatrix}
w\end{smallmatrix}\bigr)
4.2 . Clasificación
Las v.a.s pueden ser de dos tipos dependiendo su recorrido:
1 Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de casos incidentes de SarsCov2 en un mes determinado.
2 Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, como por ejemplo la longitud(m) y la temperatura (°C)
Nota: Las v.a. se simbolizan, generalmente, con letras mayúsculas X,Y y Z . Se utiliza su correspondiente letra minúscula (en este caso X,Y,Z) para designar sus posibles valores. Por ejemplo, si X representa la v.a. “número de caras obtenido” que pueden resultar al lanzar una moneda tres veces consecutivas, entonces, sus valores son
X=0,1,2,3 # . Variables aleatorias discretas
4.3 . Función de probabilidad
Sea X una v.a.d que toma los valores x_{1},x_{2}... (finitos o infinitos enumerables). Una función f_{x}: \mathbb{R}\to \begin{bmatrix}
0,1\end{bmatrix}es una función de masa de probabilidad (f.m.p) de X si y solo si fx\bigl(\begin{smallmatrix}
x\end{smallmatrix}\bigr)=\left\{\begin{matrix}
P(X=x), si \textit{x} =x_{1},x_{2}... \\
0, \textit{en otro caso}
\end{matrix}\right.
donde:
\bigl(\begin{smallmatrix}
X=x\end{smallmatrix}\bigr)=\begin{Bmatrix}
w\varepsilon \Omega: X(w)=x \end{Bmatrix} de tal forma que si x no es uno de los los valores que toma la v.a. X, entonces fx(x)=0
4.4 . Propiedades
Sea fx una f.m.p. de una v.a.d. X que asume los valores x1,x2 definida sobre un espacio muestral \Omegano vacío. Entonces se satisface que: f\bigl(\begin{smallmatrix}
x_{k}\end{smallmatrix}\bigr)\geqslant 0,\texttt{para todo valor x}_{k} de X
4.5 . Función de distribución
Mar X una v.a.d. que sume los valores x1,x2... (finitos o infinitos enumerables). La función de distribución es aquella que calcula la probabilidad acumulada hasta un punto x, es decir, es la función F_{X}:\mathbb{R}\to \begin{bmatrix}
0,1\end{bmatrix},, definida por:
F_{X}(x)= P(X\leq x)=\sum_{t\leq x}f_{X}(t)
para cualquier número real x, cuando X tiene f.m.p. f(X)
4.6 . Propiedades
Sea Fx una f.d.a. de una v.a.d. X definida sobre un espacio muestral \Omega no vacío. Entonces se satisface que:
Si x es un número real, entonces:
P(X> x)=1-F_{X}(x) y P(X\geq x)=1-F_{x}(x-)
donde: x- representa el máximo valor que puede asumir X estrictamente menor que
x
Si x es un valor que puede asumir X , entonces:
f_{X}(X)=F_{X}(x)-F_{x}(x-)
Si a y b son números reales tales que a\leq b entonces F_{X}(a)\leq F_{X}(b) es decir,F_{X} es una función creciente; y además se tiene que:
Cuando la variable objeto de estudio es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los valores de la variable como con las variables discretas, ya que el conjunto de valores que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los conceptos, empleando la integral \int en lugar de la suma \sum
Una función f_{x}:\mathbb{R}\to [0,\infty ) se dice que es una función de densidad de probabilidad (f.d.p.) de una v.a.c. X si satisface las siguientes condiciones:
f_{X}(x)\geq 0 para todo x \in \mathbb{R}
Para cualquier par de números reales a y b tales que a\leq b, se tiene que:
P(a\leq X\leq b)= \int_{b}^{a} f_{X}(x)dx
El área bajo toda la gráfica de f_{X} es 1, esto es:
\int_{-\infty }^{+\infty } f(x)dx=1
5.1 . Propiedades
Si $ F_X $ es una función de distribución de una v.a.c. $X $, entonces se satisfacen las siguientes propiedades:
Si x es un número real, entonces $ 0 F_X(x) ,$ y además:
\lim_{x \to -\infty} F_X(x) = 0 \quad \text{y} \quad \lim_{x \to \infty} F_X(x) = 1
Si x es un número real, entonces:
P(X = x) = 0 \quad \text{y} \quad P(X \geq x) = P(X > x) = 1 - F_X(x)
Si ( a ) y ( b ) son dos números reales tales que ( a \leq b ), entonces $ F_X(a) F_X(b)$ , es decir $F $ es creciente; y además se tiene que:
P(a \leq X \leq b) = P(a \leq X < b) = P(a < X \leq b) = P(a < X < b) = F_X(b) - F_X(a)
Si ( f_X ) es la f.d.p. de X , entonces:
f_X(x) = \frac{d}{dx} F_X(x) = F'_X(x)
donde ( F'_X(x) es la derivada de F_X(x) respecto a x .
6 . Medidas de resumén
Sea X una v.a.c. con f.d.a. F_X y p un número real tal que 0 \leq p \leq 100. El percentilp de la distribución de X, denotado con \pi_p, es un valor de X tal que:
\frac{p}{100} = F_X(\pi_p)
El percentil p de una variable continua X (con 0 \leq p \leq 100) corresponde al valor en el eje de medición de X tal que: el p\% del área bajo la gráfica de la f.d.p. de X está a la izquierda de \pi_p. el (100 - p)\% del área está a la derecha.
Caso especial:
El percentil 50 se denomina mediana y se simboliza con \tilde{\mu}_X.
7 . Valor esperado
Sobre la distribución de una v.a. se acostumbra registrar algunas características de interés, denominadas parámetros, como la localización y la dispersión, por ejemplo.
7.1 . Propiedades
Sea X una v.a. con f.m.p. f_X para el caso discreto o con f.d.p. f_X para el caso continuo.
El valor esperado de X se define como:
\mathbb{E}[X] = \mu_X =
\begin{cases}
\sum_{k} x_k f_X(x_k), & \text{si } X \text{ es una v.a.d.} \\
\int_{-\infty}^{\infty} x f_X(x) dx, & \text{si } X \text{ es una v.a.c.}
\end{cases}
En general, si g : \mathbb{R} \longrightarrow \mathbb{R} es una función, entonces el valor esperado de g(X) se define como:
\mathbb{E}[g(X)] =
\begin{cases}
\sum_{k} g(x_k) f_X(x_k), & \text{si } X \text{ es una v.a.d.} \\
\int_{-\infty}^{\infty} g(x) f_X(x) dx, & \text{si } X \text{ es una v.a.c.}
\end{cases}
7.2 . Sea X una v.a. y a, b números reales. Entonces se tiene que:
\mathbb{E}[a] = a
\mathbb{E}[aX + b] = a \mathbb{E}[X] + b
Si a_1, a_2, \ldots, a_n son n números reales y X_1, X_2, \ldots, X_n son n v.a.’s con esperanza finita, entonces: \mathbb{E} \left[ \sum_{i=1}^n a_i X_i \right] = \sum_{i=1}^n a_i \mathbb{E}[X_i]
8 . Varianza
Sea X una v.a. con f.m.p. f_X para el caso discreto o con f.d.p. f_X para el caso continuo. Se define la varianza de X como el segundo momento centrado alrededor de la media de X, esto es:
\mathbb{V}[X] = \sigma_X^2 =
\begin{cases}
\sum_{k}(x_k - \mu_X)^2 f_X(x_k), & \text{si } X \text{ es una v.a.d.;} \\
\int_{-\infty}^{\infty}(x - \mu_X)^2 f_X(x)dx, & \text{si } X \text{ es una v.a.c.}
\end{cases}
Sea X una v.a. y a, b números reales. Entonces se tiene que:
V[X] \geq 0
V[a] = 0
V[X + a] = V[X]
V[bX] = b^2 V[X]
(con k constante)
Varianza de la suma (variables independientes):
Si X_1, X_2, \ldots, X_m son variables aleatorias independientes, entonces: V\left[\sum_{i=1}^m X_i\right] = \sum_{i=1}^m V[X_i]
9 . Desviación estándar
Si X es una v.a. con media \mu_X y varianza \sigma_X^2, entonces la desviación estándar o desviación típica de X, denotada con \sigma_X, se define como:
\sigma_X = \sqrt{\sigma_X^2}.
10 . Coeficiente de variación
El coeficiente de variación de Pearson, denotado con CV_X, está dado por:
CV_X = \left| \frac{\sigma_X}{\mu_X} \right|
11 . Mediana
En el ámbito de la estadística, la mediana representa el valor de la variable de posición central en un conjunto de datos ordenados. Se le denota mediana. Si la serie tiene un número par de puntuaciones, la mediana es la media entre las dos puntuaciones centrales.
\begin{cases}
X\left[\frac{n+1}{2}\right] & \text{si } n \text{ es impar} \\
\frac{X\left[\frac{n}{2}\right] + X\left[\frac{n}{2}+1\right]}{2} & \text{si } n \text{ es par}
\end{cases}
12 . Cuartiles de Localización
Los cuartiles (Q1, Q2, Q3) de una variable aleatoria X con CDF F(x) se definen como:
F(Q_p) = p \quad \text{para} \quad p = 0.25, 0.5, 0.75.
Para una muestra ordenada (x_1, x_2, \dots, x_n), el cálculo sigue:
# Verificar, instalar y activar el paquete "tidyverse"if (!require(tidyverse)) {install.packages("tidyverse")}library(tidyverse)# Verificar, instalar y activar el paquete "kableExtra"if (!require(kableExtra)) {install.packages("kableExtra")}library(kableExtra)
14 . Ejercicios
14.1 .
Se ha verificado que la variable X = ” peso en kilos de lops niños al nacer”es una variable aleatoria continua con función de densidad
f(x) =
\begin{cases}
k x & 2 \leq x \leq 4 \\
0 & \text{en otros casos}
\end{cases}
Definición de la variable
La Variable aleatoria $X $ representa el peso en kg de los niños al nacer definida en el intervalo {2,4}
Función de densidad
La función de densidad de X es:
f(x) =
\begin{cases}
kx & 2 \leq x \leq 4 \\
0 & \text{en otros casos}
\end{cases}
Código para generar la gráfica de la función de densidad:
Ver código
# Función de densidadf <-function(x) {ifelse(x >=2& x <=4, x/6, 0)}# Gráficacurve(f, from =1, to =5, col ="blue", lwd =2,main ="Función de Densidad f(x)", xlab ="Peso (kg)", ylab ="Densidad")
14.2 . La demanda media de un producto es de 100 unidades con una desviación
típica de 40 unidades. Calcular la cantidad del producto que se debe tener a la venta para satisfacer la demanda de forma que puedan ser atendidos al menos el 80% de los clientes.
Variable aleatoria
La variable aleatoria X representa la demanda diaria (en unidades) de un producto.
Tipo: Continua (asumimos distribución normal por los datos proporcionados).
Notación:X \sim N(\mu, \sigma^2), donde \mu = 100 y \sigma = 40.