1 VARIABLE ALEATORIA Y DISTRUBUCCIÓN DE PROBABILIDAD
1.1 Variable Aleatoria
En estadística, una variable aleatoria es una variable que toma valores numéricos de manera aleatoria en función de la probabilidad. Es decir, es una función que asigna un número real a cada resultado posible de un experimento aleatorio. La variable aleatoria comúnmente se representa con una \(equis\) mayúscula “\(\displaystyle \mathbb {X}\)”.
Hay dos tipos de variables aleatorias: discretas y continuas.
1.1.1 1. Variable Aleatoria Discreta:
Una variable aleatoria discreta toma valores numéricos específicos, como números enteros.
Por ejemplo, si lanzamos un dado, la variable aleatoria \(\mathbb{X}\) que representa el resultado del lanzamiento es discreta, ya que solo puede tomar los valores \(1, 2, 3, 4, 5\) o \(6\) con probabilidades iguales de \(\frac{1}{6}\).
1.1.2 2. Variable Aleatoria Continua:
variable aleatoria continua puede tomar cualquier valor dentro un intervalo. Por ejemplo:
si medimos la altura de las personas en una población, la variable aleatoria Y que representa la altura es continua, ya que puede tomar cualquier valor en un intervalo (por ejemplo, desde \(1.50\) hasta \(1.95\)\(metros\)) con una distribución de probabilidad determinada.
1.2 Función de Distribución de Probabilidad o Función de Probabilidad (\(f(x)\))
Es una función que asigna a cada posible resultado de un experimento aleatorio una probabilidad. En el caso de una variable aleatoria \(discreta\), la función de probabilidad “también llamada función masa o cuantía” se puede expresar como una lista de las probabilidades de cada valor posible de la variable. En el caso de una variable aleatoria \(continua\), la función de probabilidad se expresa como la función de densidad de probabilidad.
Para cada una de las variables aleatorias. La función de probabilidad tiene sus propias propiedades.
1.3 Función de Probabilidad Acumulada o Función de Distribución “\(F(x)\)”
es una función matemática que describe la probabilidad acumulada de que una variable aleatoria \(X\) tome un valor igual o menor que un valor dado \(x\).
Para una variable aleatoria discreta, la función de distribución se puede expresar como la suma acumulada de las probabilidades individuales de cada valor posible de la variable aleatoria. La función de distribución de una variable aleatoria discreta F(X) se define como:
\[F(X) = P(X ≤ x)\]
Para una variable aleatoria continua, la función de distribución se expresa como la integral acumulada de la función de densidad de probabilidad de la variable aleatoria. La función de distribución de una variable aleatoria continua \(F(X)\) se define como:
\[F(x)=f(X\leq x)=\int_{-\infty }^{x}f(t)dt\]
1.4 Medidas de Resumen “PARÁMETROS”
Las medidas de resumen son estadísticas que se utilizan para resumir las características de una variable aleatoria en una sola medida o un conjunto de medidas.
1.4.1 Valor Esperado o Esperanza Matemática
es una medida que indica el promedio esperado de una variable aleatoria después de múltiples repeticiones. En otras palabras, es el valor que se espera obtener en promedio cuando se realiza una prueba muchas veces.
\[{\displaystyle \mathbb {E} [X]} = \mu \]
1.4.2 Varianza
Es una medida de la dispersión de una variable aleatoria respecto a su valor esperado. En otras palabras, mide cuánto se alejan los valores individuales de una variable aleatoria del valor esperado.
\[{\displaystyle \mathbb {V} [X]} = \sigma^2 \]
1.4.3 Desviación Tipica o Estandar
es una medida de la dispersión de una variable aleatoria similar a la varianza. Sin embargo, es más fácil de interpretar que la varianza, ya que está en las mismas unidades que la variable aleatoria. Es la raíz cuadrada de la varianza. La desviación típica indica cuánto se desvían los valores individuales de una variable aleatoria del valor esperado en promedio.
\[\sqrt{{\displaystyle \mathbb {V} [X]}}=\sigma\]
1.5 Parámetros Para la Variable Aleatoria Discreta
\(1.\) Un experimento consiste en lanzar tres veces una moneda. Sea la variable aleatoria: \(\mathbb{X}\)\(=\)“número de caras que se obtienen”. Se pide:
\(a)\)Distribución de probabilidad de\(\mathbb{X}\)
library(MASS)columna1 =c(0,1,2,3)columna2 =as.fractions(c(1/8,3/8,3/8,1/8))columna3=as.fractions(columna1*columna2)columna3.1=as.fractions(sum(columna3))columna4=as.fractions(columna1-columna3.1)columna5=as.fractions(columna4^2)columna6=as.fractions(columna2*columna5)datos=data.frame(columna1,columna2,columna3,columna4,columna5,columna6)fila_sumatoria <-data.frame(columna1 =NA, columna2 =sum(columna2), columna3 =sum(columna3), columna4 =NA, columna5 =NA, columna6=sum(columna6))datos <-rbind(datos, fila_sumatoria)# Cambiar el nombre de la columna 1nombre_columna1 <-"$\\mathbb{X}=x_{i}$"names(datos)[1] <- nombre_columna1# Cambiar el nombre de la columna 2nombre_columna2 <-"$P\\left ( \\mathbb{X}=x_{i} \\right )=f(x)$"names(datos)[2] <- nombre_columna2# Cambiar el nombre de la columna 3nombre_columna3 <-"$x_{i}f(x)$"names(datos)[3] <- nombre_columna3# Cambiar el nombre de la columna 4nombre_columna4 <-"$x_{i}-\\mu$"names(datos)[4] <- nombre_columna4# Cambiar el nombre de la columna 5nombre_columna5 <-"$(x_{i}-\\mu)^2$"names(datos)[5] <- nombre_columna5# Cambiar el nombre de la columna 6nombre_columna6 <-"$f(x)*(x_{i}-\\mu)^2$"names(datos)[6] <- nombre_columna6kable(datos, format ="markdown", row.names =FALSE, caption ="DISTRIBUCIÓN DE PROBABILIDAD")
X =c(0,1,2,3)Px =c(1/8,3/8,3/8,1/8)Pxacumulada=cumsum(Px)tabla_2=data.frame(X,Px,Pxacumulada)# Cambiar el nombre de la columna 1 xX <-"$\\mathbb{X}=x_{i}$"names(tabla_2)[1] <- X# Cambiar el nombre de la columna 2Px <-"$P\\left ( \\mathbb{X}=x_{i} \\right )$"names(tabla_2)[2] <- Px# Cambiar el nombre de la columna 3Pxacumulada <-"$F(X) = P(X ≤ x)$"names(tabla_2)[3] <- Pxacumuladakable(tabla_2, format ="markdown", row.names =FALSE, caption ="FUNCIÓN DE DISTRIBUCIÓN")
\(d)\)Probabilidad de que salgan a lo sumo dos caras
\(P(\mathbb{X} \leq 2)=P(\mathbb{X}=0)+P(\mathbb{X}=1)+P(\mathbb{X}=2)=\frac{1}{8}+\frac{3}{8}+\frac{3}{8}=\frac{7}{8}\) o bien \(P(\mathbb{X} \leq 2)=F(2)=\frac{7}{8}=0.875\)
\(e)\)Probabilidad de que salgan al menos dos caras
# Definir los datosx <-seq(0, 6, by =0.01)y <-ifelse(x >=2& x <=4, 1/6* x, 0)df <-data.frame(x, y)# Crear el gráficoplot(df$x, df$y, type ="l", lwd =2, col ="#EE3B3B",xlab ="x", ylab ="f(x)", main ="Función de densidad de probabilidad")
Code
library(ggplot2)ggplot(df, aes(x = x, y = y)) +geom_line(size =1, color ="blue") +xlab("x") +ylab("f(x)") +ggtitle("Función de densidad de probabilidad") +theme(panel.grid.major =element_blank(),panel.grid.minor =element_blank(),panel.background =element_blank()) +geom_line(aes(x = x, y = y), size =1, color ="red") +geom_segment(aes(x =2, y =1/6*2, xend =2, yend =0), linetype ="dotted", color ="white", size =3.5) +geom_segment(aes(x =4, y =1/6*4, xend =4, yend =0), linetype ="dotted", color ="white", size =3.5) +geom_segment(aes(x =2, y =1/6*2, xend =4, yend =1/6*4),color ="red", size =1)
b) Hallar la función de distribución. Representarla
Para hallar la función de distribución, primero debemos calcular la integral de la función de densidad desde menos infinito hasta un valor x:
# Código para generar la gráfica con R basex <-seq(0, 6, by =0.01)y <-1/12* x^2-1/3y[x <2] <-0y[x >4] <-1plot(x, y, type ="l", col ="#E32733", xlab ="x", ylab ="F(x)", main ="Función de distribución")
Code
# Código de R para generar la gráficax <-seq(0, 6, by =0.01)y <-1/12* x^2-1/3y <-ifelse(x <2, 0, y) # asignar valor 0 para x < 2y <-ifelse(x >4, 1, y) # asignar valor 1 para x > 4df <-data.frame(x, y)ggplot(df, aes(x = x, y = y)) +geom_line(size =1, color ="#E32733") +xlab("x") +ylab("F(x)") +ggtitle("Función de distribución")
Allaire, JJ, Yihui Xie, Christophe Dervieux, Jonathan McPherson, Javier Luraschi, Kevin Ushey, Aron Atkins, et al. 2023. “Rmarkdown: Dynamic Documents for r.”https://github.com/rstudio/rmarkdown.
Dahl, David B., David Scott, Charles Roosen, Arni Magnusson, and Jonathan Swinton. 2019. “Xtable: Export Tables to LaTeX or HTML.”https://CRAN.R-project.org/package=xtable.
Wickham, Hadley, Romain François, Lionel Henry, Kirill Müller, and Davis Vaughan. 2023. “Dplyr: A Grammar of Data Manipulation.”https://CRAN.R-project.org/package=dplyr.
Xie, Yihui. 2023. “Knitr: A General-Purpose Package for Dynamic Report Generation in r.”https://yihui.org/knitr/.