DISTRIBUCIONES DE PROBABILIDAD Y VARIABLE ALEATORIA

TALLER PARCIAL 1
Autores/as
Afiliación
Anyela Cabezas
Universidad del Tolima
Fecha de publicación

12 de mayo de 2023

Paquetes R

Código
library(kableExtra)
library(tidyverse)
library(ggplot2)
library(MASS)
library(flextable)
library(vembedr)

(Zhu 2021; Wickham et al. 2019; Wickham 2016; Venables y Ripley 2002; Gohel y Skintzos 2023; Lyttle 2021)

1 INTRODUCCION

Exploraremos los conceptos de variables aleatorias y distribución de probabilidad en estadística. En términos generales, una variable aleatoria es una cantidad que puede tomar diferentes valores en función de los resultados obtenidos en un experimento aleatorio. Por otro lado, la distribución de probabilidad describe la probabilidad de ocurrencia de cada valor posible de una variable aleatoria.

Discutiremos en detalle los diferentes tipos de variables aleatorias, así como las distribuciones de probabilidad más comunes, que incluyen distribuciones discretas y continuas. Además, mostraremos algunos ejemplos prácticos y ejercicios para ilustrar cómo se pueden utilizar las variables aleatorias y distribuciones de probabilidad en la toma de decisiones basadas en datos.

Esperamos que al finalizar este trabajo, los lectores tengan una comprensión sólida de los conceptos básicos de las variables aleatorias y la distribución de probabilidad, así como una idea clara de cómo se aplican en la práctica 1.

2 VARIABLE ALEATORIA

Es una función que asigna valores numéricos a los posibles resultados de un experimento aleatorio. Es decir, es una función que convierte los resultados del experimento en números. Formalmente, una variable aleatoria es una función \(X\) que mapea los elementos del espacio muestral \(Ω\) del experimento aleatorio a los números reales, es decir:\(X: Ω → ℝ\).

Por ejemplo, consideremos el experimento aleatorio de lanzar dos monedas al aire. El espacio muestral Ω en este caso estaría dado por los cuatro posibles resultados que pueden obtenerse, es decir, \(Ω = {CC, CS, SC,SS}\), donde \(C\) representa cara y \(S\) representa sello.

Podemos definir una variable aleatoria \(X\) que tome el valor 2 si ambos resultados son caras \((CC)\), el valor 1 en los casos \((CS, SC)\) y el valor de 0 si ambos resultados son sellos \((SS)\). Formalmente, escribimos \(X(CC) = 2, X(CS) = X(SC) =1 Y X(SS) = 0.\) De esta manera, \(X\) es una función que asigna valores numéricos a los elementos del espacio muestral \(Ω\).

Nota

X= Variable

x= Valores que toma la variable

2.1 TIPOS DE VARIABLES ALEATORIAS

Las variables aleatorias se clasifican en discretas y continuas:

2.1.1 VARIABLE ALEATORIA DISCRETA

Es aquella que toma valores fijos o determinados ( numeración o conteo), es decir pueden tomar un número finito o infinito numerable de valores posibles.

Por ejemplo, la variable aleatoria “número de hijos que puede tener una familia \(X=\) \((0,1,2,3...)\).

2.1.2 VARIABLE CONTINUA

Pueden tomar cualquier valor dentro de un rango continuo de valores(mediciones). Por ejemplo, la variable aleatoria “tiempo que tarda un estudiante en resolver un examen” puede tomar cualquier valor dentro de un rango continuo de tiempos.

Por ejemplo, si consideramos el tiempo que tarda un estudiante en resolver un examen” puede tomar cualquier valor dentro de un rango continuo de tiempos. \(X=\) Puede tomar valores entre \(0\) y \(+\infty\).

El siguiente video explica de manera detallada los dos tipos de variable aleatoria.

Código
library(vembedr)
embed_url("https://youtu.be/_wonmKS4Blk")

3 FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD \(f(X)\)

La función de distribución describe el comportamiento probabilístico de una variable aleatoria \(X\) asociada a un experimento aleatorio.

Para estudiar la función de distribución de probabilidad distinguiremos entre el caso discreto y el caso continuo.

3.1 VARIABLE ALEATORIA CASO DISCRETA

Esta función tambien recibe el nombre de función masa o de cuantia, y cumple con las siguientes propiedades

  1. \(f(x\geqslant 0)\)
  2. \(\sum\limits_{i=1} f(x)=1\)
  3. \(P(x=a)= f(a)\)

3.2 VARIABLE ALEATORIA CONTINUA

Tambien recibe el nombre de función densidad y cumple con las siguientes propiedades

  1. \(f(x)\geqslant0\)
  2. \(\int_{-\infty}^{+\infty}f(x)dx=1\)
  3. \(p(a< x< b)=\int_{a}^{b}f(x)dx\)

4 FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD ACOMULADA \(F(X)\)

Es una función matemática que describe la probabilidad acumulada de que una variable aleatoria X sea menor o igual a un valor dado x. Es decir proporciona la probabilidad acumulada de que X tome valores menores o iguales a x.

4.1 VARIABLE ALEATORIA DISCRETA

Es la suma acumulada de las probabilidades de cada valor posible de la variable aleatoria hasta ese punto. Es decir, si X es una variable aleatoria discreta que toma valores {x1, x2, x3, ...}

\(F(x)=f(X\leqslant x)=\sum_{t\leqslant x}^{}f(t)\)

\(F(a)= f(x\leqslant a)\)

4.2 VARIABLE ALEATORIA CONTINUA

Se utiliza para calcular la probabilidad de que la variable aleatoria X tome valores en un intervalo específico, así como para calcular medidas de resumen como la media y la varianza de la distribución de probabilidad.

\(F(x)= f(X\leqslant x)=\int_{-\infty}^{x}f(t)dt\)

5 MEDIDAS DE RESUMEN

Las medidas de resumen son herramientas estadísticas que se utilizan para resumir o describir las características de una distribución de probabilidad o de una muestra de datos de una variable aleatoria.

5.1 ESPERANZA MATEMÁTICA O VALOR ESPERADO

La esperanza matemática, también conocida como valor esperado, es una medida de centralización que representa el promedio ponderado de los posibles valores que puede tomar una variable aleatoria. Se representa de la siguiente manera \(E(X)=μ\)

Posee las siguientes propiedades:

  • \(E[aX]=aE[X]\)

  • \(E[X+a]=E[X]+a\)

  • \(E[X+Y]=E[X]+E[Y]\)

  • \(E[aX+bY]=aE[X]+bE[Y]\)

Esperanza matemática para una variable aleatoria continua

\(E[X]=\mu=\sum_{x}^{}xf(x)\)

Esperanza matemática para una variable aleatoria discreta

\(E[X]=\mu =\int_{-\infty}^{+\infty}xf(x)dx\)

5.2 VARIANZA

La varianza es una medida de dispersión que se utiliza en estadística para medir la variabilidad de una variable aleatoria con respecto a su media. En otras palabras, la varianza mide qué tan alejados están los valores individuales de una variable aleatoria de su valor esperado o media.

Formalmente, si \(X\) es una variable aleatoria con media \(μ\), la varianza se denota como \(σ^2\) y se define como la esperanza del cuadrado de la desviación de X respecto a su media. \(V[X]= \sigma ^{2}\)

Posee las siguientes propiedades

  • \(V[X]\geqslant 0\)

  • \(V[a]=0\)

  • \(V[X+a]=V[X]\)

  • \(V[aX]=a^{2}V[X]\)

La varianza para una variable aleatoria discreta

  1. \(V(X)=\sigma ^{2}=\sum_{x}^{}(x-\mu)^{2}f(x)\)

  2. \(V(X)=\sigma ^{2}=E[X^{2}]-(E[X])^{2}\)

    donde: \(E[X^{2}]=\mu=\sum_{x}^{}x^{2}f(x)\)

La varianza matemática para una variable aleatoria continua

  1. \(V[X]=\int_{-\infty }^{+\infty }(x-\mu)^{2}f(x)dx\)
  2. \(V[X]=\sigma ^{2}= E[x^{2}]-(E[x])^{2}\) donde: \(E[X^{2}]=\mu =\int_{-\infty}^{+\infty}x^{2}f(x)dx\)

5.3 DESVIACIÓN TIPICA O ESTANDAR

Es una medida de dispersión que se utiliza en estadística para cuantificar qué tan alejados están los valores individuales de una variable aleatoria con respecto a su media. La desviación estándar se denota por σ (sigma) y se calcula como la raíz cuadrada positiva de la varianza. \(\sigma =\sqrt{V[X]}\), esta formula se utiliza en la variable aleatoria discreta y variable aleatoria continua.

5.4 COVARIANZA

Es una medida que se utiliza en estadística para medir el grado de interdependencia entre dos variables aleatorias. Se define como el valor esperado del producto de las desviaciones de cada variable respecto a su media.

\(V[X+Y]=V[X]+V[Y]+2Cov[X,Y]\) donde: \(Cov(X,Y)= E[X\cdot Y]-E[X]\cdot E[Y]\)

6 EJEMPLO VARIABLE ALEATORIA DISCRETA

Ejercicio 1:

Se lanza tres monedas al aire. Sea X la variable aleatoria que representa el número de caras obtenidas. Encuentre la función de probabilidad, la función de distribución acumulada, las medidas de resumen vistas anteriormente.

\(\Omega=\begin{Bmatrix} ccc, ccs, csc, css\\ scc, scs, ssc, sss \end{Bmatrix}\) \(2^{3}=8\)

\(X(ccc)=3\)

\(X(csc)=X(scc)=X(ccs)=2\)

\(X(css)=X(scs)=X(ssc)=1\)

\(X(sss)=0\)

Código
#crearemos una tabla con flextable 

library(flextable)

# Crear un data frame con los datos de ejemplo

df <- data.frame(X = 0:3, P_X = c(1/8, 3/8, 3/8, 1/8))

# Cambiar los nombres de las columnas

colnames(df) <- c("valores de X", "fx")

# Agregar una columna de probabilidades acumuladas

df$`FX` <- cumsum(df$fx)

# Crear la tabla con flextable

ft <- flextable(df) %>%

  set_header_labels("valores de X" = "Valores de X", "fx" = "f(X)", "FX" = "F( x)") %>%

  bold(part = "header") %>%

  autofit()

# Imprimir la tabla

ft

Valores de X

f(X)

F( x)

0

0.125

0.125

1

0.375

0.500

2

0.375

0.875

3

0.125

1.000

Código
#otra forma de hacer la tabla, con kable extra 
# Mostramos la tabla en la consola
library(knitr)
library(kableExtra)

# Creamos un vector con los valores para la primera columna
Numero_caras <- c(0, 1, 2, 3)

# Creamos un vector con los valores para la segunda columna
Probabilidad <- c(1/8, 3/8, 3/8, 1/8)

df$`FX` <- cumsum(df$fx)

# Creamos la tabla usando la función data.frame()
tabla <- data.frame(Numero_caras = Numero_caras, Probabilidad = Probabilidad)

# Creamos la tabla con los mismos estilos que especificaste
tabla %>%
  kbl(booktabs = TRUE, align = "c") %>%
  kable_classic() %>%
  kable_styling(bootstrap_options = "striped") %>%
  column_spec(1, bold = TRUE)
Numero_caras Probabilidad
0 0.125
1 0.375
2 0.375
3 0.125
\(X\) \(f(x)\) \(F(x)\) \(Xf(x)\) \((x-μ)^{2}fx\) \(x^{2}f(x)\)
0 1/8 1/8 0 9/32 0
1 3/8 1/2 3/8 3/32 3/8
2 3/8 7/8 6/8 3/32 12/8
3 1/8 1 3/8 9/32 9/8
\(\sum\) 1 3/2 3/4 3

\[ E[x]=\mu= \sum_{x}^{}f(x)=\frac{3}{2} \]

\[ V(X)=\sigma ^{2}=\sum_{x}^{}(x-\mu)^{2}f(x)=\frac{3}{4} \]

\[ \sigma=\sqrt{\frac{3}{4}}=\frac{\sqrt{3}}{2}= 0,\widehat{6} \]

\[ f(x)=\left\{\begin{matrix}0 & para\: x< 0\\ \frac{1}{8} & para\: 0\leqslant x\leqslant 1 \\\frac{1}{2} & para\: 1\leqslant x\leqslant 2\\\frac{7}{8} & para\: 2\leqslant x\leqslant 3 \\ 1 & para\:x\geqslant 3\\ \end{matrix}\right. \]

Código
#grafica de probabilidad 
Omega <- expand.grid(moneda_1 = 0:1, moneda_2 = 0:1, moneda_3 = 0:1)
n.heads <- apply(Omega, 1, sum)
library("MASS")
T1 <- table(n.heads)/length(n.heads)


x<- c(0,1,2,3)
plot( xlab = "Numero de caras", ylab="P(X = x)", main = "Grafica de probabilidad",x = x, y = T1,  pch = 15, col = "blue", xaxp = c(0, 3, 3))
axis(2, at = c(1/8, 3/8), labels = c("1/8", "3/8"), las = 1)
segments(x0 = x, y0 = 0, x1 = x, y1 = T1, lwd = 3.5, col = "blue")

Código
 df <- data.frame(X = 0:3, Frecuencia = c(0.125, 0.375, 0.375, 0.125))
ggplot(df, aes(x = X, y = Frecuencia)) +
  geom_segment(aes(x = X, y = 0, xend = X, yend = Frecuencia), color = "blue", size = 1) +
  geom_text(aes(x = X, y = Frecuencia, label = Frecuencia), vjust = -0.5, color = "blue", size = 4, fontface = "bold") +
  scale_y_continuous(limits = c(0, max(df$Frecuencia) * 1.2), expand = c(0, 0)) +
  scale_x_continuous(breaks = df$X) +
  labs(title = "Diagrama de Bastones", x = "Valores de X", y = "Frecuencia") +
  theme(panel.background = element_rect(fill = "white", color = "black"),
        plot.title = element_text(hjust = 0.5, size = 18),
        axis.title = element_text(size = 14),
        axis.text = element_text(size = 12),
        
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

Código
#frecuencia acomulada 
Omega <- expand.grid(moneda_1 = 0:1, moneda_2 = 0:1, moneda_3 = 0:1)
n.heads <- apply(Omega, 1, sum)

#utilizamos la libreria MASS para poner las fracciones en la grafica 

#asignamos valores a los ejes 
Fx<-c(1/8,4/8,7/8,1)
Frecuencia_acomulada<-c(0,1,2,3)
#utilizamos el siguiente codigo para ver la frecuencia absoluta por medio de una grafica de escalones
plot(x = c(0, Frecuencia_acomulada), y = c(0, Fx), type = "s", xlab = "Numero de caras", ylab = "Frecuencia_acomulda", col = "blue", lwd = 2, xaxp = c(0, 3, 3), yaxp = c(-70, 70, 5), main = "Distribución de frecuencia acomulada")
points(x, Fx, col = "blue", pch = 15)
axis(2, at = c(1/8, 4/8, 7/8, 1), labels = c("1/8", "4/8", "7/8", "1"), las = 1)

Código
X <- c(0, 1, 2, 3)
Fx <- c(1/8,4/8,7/8,1)
tabla <- data.frame(X, Fx)
tabla$Fx <- fractions(tabla$Fx)

ggplot(tabla, aes(x = X, y = Fx)) +
  geom_step(color = "blue", size = 1.5) +
  labs(title = "Frecuencia acomulada",
       x = "Valores de X",
       y = "F(x)") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5),
        axis.title = element_text(size = 12),
        axis.text = element_text(size = 10)) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.1))) +
  scale_x_continuous(breaks = X, expand = expansion(mult = c(0.1, 0))) +
  coord_cartesian(clip = "off")

Ejercicio 2: John y Peter juegan un juego con una moneda tal que P(cara)= p. El juego consiste en lanzar una moneda dos veces. John gana si se obtiene el mismo resultado en los dos lanzamientos, y Peter gana si los dos resultados son diferentes.

(a) ¿A qué valor de p ninguno de los dos está favorecido por el juego?

(b) Si p es diferente de tu respuesta en (a), ¿quién está favorecido?

Solución:

\(\Omega=\begin{Bmatrix} cc, ss\\ sc, cs\end{Bmatrix}\) \(2^{2}=4\)

a) La probabilidad de que John gane es :\(P(cc) + P(ss) = p^2 + (1-p)^2\)

La probabilidad de que Peter gane es:\(P(cs) + P(sc) = 2p(1-p)\)

Igualando las probabilidades, obtenemos: \(p^2 + (1-p)^2 = 2p(1-p)\)

\(4p^2 - 4p + 1 = 0\)

\((2p - 1)^2 = 0\)

\(2p-1=0\)

\(p=\frac{1}{2}\)

Por lo tanto, el valor de p en el que ninguno de los dos está favorecido es \(p =\frac{1}{2}\)

b) Si p es diferente de \(\frac{1}{2}\) , entonces uno de los dos jugadores estará favorecido. Si p es mayor que \(\frac{1}{2}\) , entonces la probabilidad de que Peter gane es mayor que la probabilidad de que John gane. Si p es menor que \(\frac{1}{2}\), entonces la probabilidad de que John gane es mayor que la probabilidad de que Peter gane.

Código
# Crear data frame
p<-c(1/2)
df <- data.frame(
  Persona = c("John", "Peter"),
  Gana_si_cara_cara = c("Sí", "No"),
  Gana_si_cara_cruz = c("No", "Sí"),
  Probabilidad_de_ganar = c(p^2, 2*p*(1-p))
)

# Renombrar columnas
colnames(df) <- c("Persona", "Gana si cara-cara", "Gana si cara-cruz", "Probabilidad de ganar")

# Importar librería
library(kableExtra)

# Mostrar tabla con estilos
kable(df, format = "markdown", align = "c", caption = "Tabla de probabilidades de John y Peter en el juego de la moneda") %>%
  kable_styling(bootstrap_options = "striped", full_width = FALSE)
Tabla de probabilidades de John y Peter en el juego de la moneda
Persona Gana si cara-cara Gana si cara-cruz Probabilidad de ganar
John No 0.25
Peter No 0.50
Código
# Crear data frame
p <- 1/2
df <- data.frame(
  Persona = c("John", "Peter"),
  Gana_si_cara_cara = c("Sí", "No"),
  Gana_si_cara_cruz = c("No", "Sí"),
  Probabilidad_de_ganar = c(p^2, 2*p*(1-p))
)

# Renombrar columnas
colnames(df) <- c("Persona", "Gana si cara-cara", "Gana si cara-cruz", "Probabilidad de ganar")

# Importar paquete
library(flextable)

# Crear tabla
tabla <- flextable(df)

# Añadir formato a la tabla
tabla <- set_caption(tabla, "Tabla de probabilidades de John y Peter en el juego de la moneda")
tabla <- theme_zebra(tabla)

# Imprimir tabla
tabla

Persona

Gana si cara-cara

Gana si cara-cruz

Probabilidad de ganar

John

No

0.25

Peter

No

0.50

7 EJEMPLO VARIABLE ALEATORIA CONTINUA

Ejercicio 1:

Supongamos que X es una variable aleatoria continua que representa la duración de las llamadas telefónicas en minutos. Se sabe que la función de densidad de probabilidad de X está dada por:

\[f(x)=\left\{\begin{matrix} 2x& 0\leqslant x\leqslant 1 \\ 0& e.o.p\end{matrix}\right.\]

a) Calcule la función de distribución acumulada de X.

b) Calcule la probabilidad de que la duración de una llamada telefónica sea menor o igual a 0.6 minutos.

c) Calcule la esperanza matemática de X.

d) Calcule la varianza y la desviación estándar de X.

Solución:

a) La función de distribución acumulada de \(X\) se calcula integrando la función de densidad de probabilidad de \(X\) desde menos infinito hasta \(x\). Para 0 ≤ x ≤ 1, tenemos:

\(F(X) = \int_{-\infty }^{x} f(t) dt\)

\(\, \,\: \:\, \, \, \, \, \, \, \, \,= \int_{0 }^{x} 2t dt\) \(\, \,\: \:\, \, \, \, \, \, \, \, \,=x^{^{2}}, 0\leqslant x\leqslant 1\)

\(F(X)\left\{\begin{matrix} 0&x< 0\\ X^{^{2}} &0\leqslant x\leqslant 10&x< 0 \\ 1& x> 1\end{matrix}\right.\)

b) La probabilidad de que la duración de una llamada telefónica sea menor o igual a 0.6 minutos se puede calcular como:

\[P(X \leqslant 0.6) = F(0.6) = 0.6^2 = 0.36\]

Por lo tanto, la probabilidad de que la duración de una llamada telefónica sea menor o igual a 0.6 minutos es 0.36.

c) La esperanza matemática de \(X\) se calcula como:

\(E[X]=\int_{-\infty }^{\infty }xf(x)dx\) \(\, \,\: \:\, \, \, \, \, \, \, \, \,=\int0^1 (2x^2) dx\)

\(\, \,\: \:\, \, \, \, \, \, \, \, \,=\frac{2}{3}\)

Por lo tanto, la esperanza matemática de \(X\) es \(\frac{2}{3}\)

d) La varianza de X se calcula como:

\(V(X) = E(X^2) - [E(X)]^2\) donde \(E(X^2) = \int_{-\infty }^{\infty }x^2 f(x) dx\)

\(E(X^2) = \int 0^1 (2x^3) dx =\frac{1}{2}\)

Por lo tanto, la varianza de X es: \(V(X) = E(X^2) - [E(X)]^2 = 1/2 - (2/3)^2 = 1/18\)

La desviación estándar de X es la raíz cuadrada de la varianza:

\(\sigma = \sqrt{V(X)} = \sqrt{\frac{1}{18}} = 0.236\)

Por lo tanto, la desviación estándar de X es aproximadamente 0.236 minutos.

Código
# Definir la función de densidad
f <- function(x) {
  ifelse(x < 0 | x > 1, 0, x^2)
}

# Generar valores de x para la gráfica
x <- seq(0, 1, length.out = 100)

# Graficar la función de densidad
plot(x, f(x), type = "l", col = "blue", lwd = 2, xlab = "X", ylab = "f(X)",
     main = "Función de densidad", xlim = c(0, 1), ylim = c(0, 1))

Código
library(ggplot2)

# Definir la función de densidad
f <- function(x) {
  ifelse(x < 0 | x > 1, 0, x^2)
}

# Graficar la función de densidad
ggplot(data.frame(x = c(0, 1)), aes(x)) +
  stat_function(fun = f, geom = "line", color = "blue", size = 1.5) +
  xlim(0, 1) +
  ylim(0, 1) +
  xlab("X") +
  ylab("f(X)") +
  ggtitle("Función de densidad f(X)") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
        axis.title.x = element_text(size = 14),
        axis.title.y = element_text(size = 14),
        axis.text = element_text(size = 12),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        panel.border = element_blank(),
        panel.background = element_blank())

Ejercicio 2:

La variable X= “número de centímetros a que un dardo queda del centro de la diana” al ser tirado por una persona tiene como función de densidad

\(f(x)=\left\{\begin{matrix} k& 0< x< 10\\ 0& en\, otros\, casos\end{matrix}\right.\)

Se pide:

a) Hallar k para que f(x) sea función de densidad. Representarla

b) Hallar la función de distribución. Representarla

c) Media, varianza y desviación típica

d) \(P(X\leq 1)\)

e) Probabilidad de acertar en la diana

Solución:

a) Para que f(x) sea función de densidad debe verificar

\(1=\int_{-\infty }^{0}f(x)dx=\int_{-\infty }^{0}f(x)dx+\int_{0}^{10}f(x)dx+\int_{10}^{\infty }f(x)dx=\int_{0}^{10}f(x)dx\)

\(1=\int_{0}^{10}kdx=k\int_{0}^{10}dx=10\left [ x \right ]_{0}^{10}=10k\rightarrow k=\frac{1}{10}\)

En consecuencia, \(f(x)=\left\{\begin{matrix}\frac{1}{10} &0< x< 10 \\ 0& en\: otros\: casos\end{matrix}\right.\)

Código
library(MASS)

# Definir la función de densidad
f <- function(x) {
  ifelse(x > 0 & x < 10, 1/10, 0)
}

# Crear la gráfica
plot(f, xlim = c(-5, 15), ylim = c(0, 1/10), type = "l",
     xlab = "X", ylab = "f(X)", main = "Función de densidad f(X)", 
     col = "blue", lwd = 1.5, yaxt = "n")
     
# Formatear etiquetas en fraccionarios
axis(2, at = seq(0, 0.2, by = 0.05), 
     labels = as.character(fractions(seq(0, 0.2, by = 0.05))))

Código
# Definir la función de densidad
f <- function(x) {
  ifelse(x > 0 & x < 10, 1/10, 0)
}

# Crear la gráfica
ggplot(data.frame(x = c(-5, 15)), aes(x)) +
  stat_function(fun = f, color = "blue", size = 1.5) +
  xlim(-5, 15) +
  ylim(0, 0.2) +
  xlab("X") +
  ylab("f(X)") +
  ggtitle("Función de densidad f(X)") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
        axis.title.x = element_text(size = 14),
        axis.title.y = element_text(size = 14),
        axis.text = element_text(size = 12),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        panel.border = element_blank(),
        panel.background = element_blank())

b) La función de distribución se define \(F(x)=\int_{-\infty }^{x}f(t)dt\)

\(x< 0\; \; \; \; \;\; \; \; \; F(x)=\int_{-\infty }^{x}f(t)dt=0\)

\(0< x< 10\; \; \; \; \;\; \; F(x)=\int_{-\infty }^{x}f(t)dt=\int_{-\infty }^{0}f(t)dt+\int_{0}^{x}f(t)dt=\frac{x}{10}\)

\(x< 10\; \; \; \; \;\; \; F(x)=\int_{-\infty }^{x}f(t)dt=\int_{-\infty }^{0}f(t)dt+\int_{0}^{10}f(t)dt+\int_{10}^{x}f(t)dt\)

\(\; \; \; \; \;\; \;\; \; \; \; \;\; \; \; \; \; \; \; \; \; \;\;\; \; \;=\int_{0}^{10}\frac{1}{10}dt=1\)

En consecuencia, \(F(x)=\left\{\begin{matrix}0 & x< 0\\ \frac{x}{10}&0\leq x\leq 10 \\ 1& x> 10\end{matrix}\right.\)

Código
# Definir la función de escalera
F <- function(x) {
  ifelse(x < 0, 0,
         ifelse(x <= 10, x/10, 1))
}

# Crear un vector de valores de x
x <- seq(-5, 15, length.out = 1000)

# Generar valores de y con la función F
y <- F(x)

# Crear la gráfica
plot(x, y, type = "s", lwd = 2, col = "blue",
     xlab = "X", ylab = "F(X)", ylim = c(0, 1),
     main = "Función de distribución acumulada F(X)")

Código
# Definir la función de escalera
F <- function(x) {
  ifelse(x < 0, 0,
         ifelse(x <= 10, x/10, 1))
}
# Crear la gráfica
ggplot(data.frame(x = c(-5, 15)), aes(x)) +
  stat_function(fun = F, color = "blue", size = 1.5) +
  xlim(-5, 15) +
  ylim(0, 1) +
  xlab("X") +
  ylab("F(X)") +
  ggtitle("Función de distribución acumulada F(X)") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
        axis.title.x = element_text(size = 14),
        axis.title.y = element_text(size = 14),
        axis.text = element_text(size = 12),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        panel.border = element_blank(),
        panel.background = element_blank())

c) Media

\(\alpha {1}=\mu _{X}=E(X)=\int{-\infty }^{\infty }xf(x)dx=\int_{0}^{10}x\frac{1}{10}dx\)

\(=\frac{1}{10}\int_{0}^{10}xdx=\frac{1}{10}\left [ \frac{x^{2}}{2} \right ]_{0 }^{10 }=5cm\)

\(Varianza:\sigma_{X}^{2}=\alpha _{2}-\alpha _{1}^{2}\)

\(\alpha {2}=E(x)=\int{-\infty }^{\infty }x^{2}f(x)dx=\int_{0}^{10}x^{2}\frac{1}{10}dx\)

\(=\frac{1}{10}\int_{0}^{10}x^{2}dx= \frac{1}{10}\left [ \frac{1000}{3}-0\right ]=\frac{100}{3}\)

\(\sigma_{X}^{2}=\alpha _{2}-\alpha _{1}^{2}=\frac{100}{3}-5^{2}=\frac{25}{3}cm^{2}\)

\(desviación tipica \sigma _{x}=\sqrt{\frac{25}{3}}=2,9 cm\)

d) \(P(X\leq 1)=F(1)=\frac{1}{10}\)

o también, \(P(X\leq 1)=\int_{0}^{1}\frac{1}{10}dx=\frac{1}{10}\int_{0}^{1}dx=\frac{1}{10}\)

e) Probabilidad de acertar en la diana: \(P(X=0)=0\) por ser una variable continua

\(P(X=0)=\int_{0}^{0}f(x)dx=\int_{0}^{0}\frac{1}{10}dx=\frac{1}{10}\int_{0}^{0}dx=0\)

EJERCICIOS SOBRE VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD

Realiza estos dos ejercicios de variable aleatoria continua y discreta para afianzar tus conocimientos

14

Una variable aleatoria continua X tiene por función de densidad2.

\(f(x)=\left\{\begin{matrix}1-x &0\leq x< 1 \\ x-1& 1\leq x\leq 2\\ 0 & otros\: casos\end{matrix}\right.\)

Se pide:

a) Representa la función de densidad

b) Hallar la función de distribución y su gráfica

c) \(P(0\leq X\leq 1)\: ,\: P(-2\leq X\leq 2)\: ,\: P\left ( \frac{1}{2}\leq X< \infty \right )\)

52

Considera un experimento en el que se lanzan dos dados. Sea la variable aleatoria X la suma de los dos dados y la variable aleatoria Y la diferencia entre los dos dados.3.

(a) Encuentra la media de X.

(b) Encuentra la varianza de X.

(c) Encuentra la media de Y.

(d) Encuentra la varianza de Y.

Referencias

Gohel, David, y Panagiotis Skintzos. 2023. «flextable: Functions for Tabular Reporting». https://CRAN.R-project.org/package=flextable.
Lyttle, Ian. 2021. «vembedr: Embed Video in HTML». https://CRAN.R-project.org/package=vembedr.
Venables, W. N., y B. D. Ripley. 2002. «Modern Applied Statistics with S». https://www.stats.ox.ac.uk/pub/MASS4/.
Wickham, Hadley. 2016. «ggplot2: Elegant Graphics for Data Analysis». https://ggplot2.tidyverse.org.
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. «Welcome to the tidyverse» 4: 1686. https://doi.org/10.21105/joss.01686.
Zhu, Hao. 2021. «kableExtra: Construct Complex Table with ’kable’ and Pipe Syntax». https://CRAN.R-project.org/package=kableExtra.

Notas

  1. Se toma como modelo el trabajo de variables aleatorias y distribucion de probabilidad. Rpubs Dagoberto Salgado↩︎

  2. Libro . EJERCICIOS RESUELTOS VARIABLE ALEATORIA UNIDIMENSIONAL↩︎

  3. Libro . Ejercicio 52 del libro Probability and Statistics with R, Second Edition↩︎