Parcial 2

library(ggplot2)
library(flextable)
library(DiagrammeR)

Primera pregunta

Algunos casos de historias clínicas indican que diferentes enfermedades producen síntomas idénticos. Suponga que un conjunto particular de síntomas, denotado como H, se presenta sólo con cualquiera de tres enfermedades, I1, I2 o I3. Suponga que la presentación simultánea de más de una de estas enfermedades es imposible y que P(I1) = 0.01, P(I2) = 0.005, P(I3) = 0.02. Las probabilidades de desarrollar el conjunto de síntomas H, dada cada una de estas enfermedades, se sabe que son: P(H | I1) = 0.90, P(H | I2) = 0.95, P(H | I3) = 0.75

Elabore un dataframe que resuma la información.
Suponiendo que una persona enferma presenta los síntomas, H, ¿Cuál es la probabilidad de que la persona tenga la enfermedad I1?

Solución

library(flextable)

p.I1 <- 0.01
p.I2 <- 0.005
p.I3 <- 0.02
p.H_I1 <- 0.90
p.H_I2 <- 0.95
p.H_I3 <- 0.75
p.I1_H <- p.I1 * p.H_I1
p.I2_H <- p.I2 * p.H_I2
p.I3_H <- p.I3 * p.H_I3

p.H <- p.I1_H + p.I2_H + p.I3_H

# Calcular P(I1 | H)
p.I1_dado_H <- p.I1_H / p.H

cat("La probabilidad de que la persona tenga la enfermedad I1 dado que presenta H es:", p.I1_dado_H)
## La probabilidad de que la persona tenga la enfermedad I1 dado que presenta H es: 0.3130435

tabla1 <- data.frame(
  Evento = c("Presenta H", "No presenta H", "Total"),
  I1 = c(p.I1_H, p.I1 - p.I1_H, p.I1),
  I2 = c(p.I2_H, p.I2 - p.I2_H, p.I2),
  I3 = c(p.I3_H, p.I3 - p.I3_H, p.I3),
  Total = c(p.H, 1 - p.H, 1)
)

flextable(tabla1)

Evento	I1	I2	I3	Total
Presenta H	0.009	0.00475	0.015	0.02875
No presenta H	0.001	0.00025	0.005	0.97125
Total	0.010	0.00500	0.020	1.00000

Segunda pregunta

Sea X una variable aleatoria con f(x) dada en la siguiente tabla.

Dibuje la función de probabilidad.
Obtenga la función de distribución, F(x), y, con base en ella, encuentre F(2.5) \[ \begin{array}{c|c} x & f(x) \\ \hline 1 & 0.4 \\ 2 & 0.3 \\ 3 & 0.2 \\ 4 & 0.1 \\ \end{array} \] Solución


tabla3 <- data.frame(x = 1:4, f.x=c(0.4,0.3,0.2,0.1))

flextable(tabla3)

x	f.x
1	0.4
2	0.3
3	0.2
4	0.1


x <- 1:4

ggplot(tabla3, aes(x = x, y =f.x))+
  geom_point(size =3,col = "purple")+
  geom_segment(aes(x = x, xend = x, y =0, yend = f.x),
               col="purple",linetype="dashed")+
  labs(title="Gráfica Función de Probabilidad")

F.x <- function(x){
  ifelse(x < 1, 0,
         ifelse(x < 2, 0.4,
                ifelse(x < 3, 0.7,
                       ifelse(x < 4, 0.9, 1))))
}

F.x(2.5)
## [1] 0.7

Tercera pregunta

Suponga que X tiene la función de densidad dada abajo

Dibuje la función de densidad (debe encontrar el valor de k)
Dibuje F(x)
Encuentre P( 0.4 < X < 0.8) redondeado a 3 decimales. a

integral <- integrate(function(x) x*(1-x), 0, 1)$value
k <- 1 / integral
cat("Valor de k =", k, "\n")
## Valor de k = 6

f <- function(x) ifelse(x >= 0 & x <= 1, k*x*(1-x), 0)
F <- function(x) ifelse(x < 0, 0,
ifelse(x <= 1, k*((x^2)/2 - (x^3)/3), 1))

curve(f, from = 0, to = 1, col = "blue", lwd = 2,
main = "Función de Densidad f(x)", ylab = "f(x)", xlab = "x")


curve(F, from = 0, to = 1, col = "skyblue", lwd = 2,
main = "Función de Distribución F(x)", ylab = "F(x)", xlab = "x")

P <- integrate(f, 0.4, 0.8)$value
cat("P(0.4 < X < 0.8) =", round(P, 3))
## P(0.4 < X < 0.8) = 0.544

Cuarta pregunta

Suponga que un distribuidor de joyería antigua está interesado en comprar un collar de oro para el que tiene 0.22 de probabilidades de venderlo con 250 de utilidad; 0.36 de venderlo con 150 de utilidad; 0.28 de venderlo al costo y 0.14 de venderlo con una pérdida de 150. ¿Cuál es la desviación estándar de la utilidad?

x <- c(250, 150, 0, -150)
p <- c(0.22, 0.36, 0.28, 0.14)

E.X <- sum(x * p)
cat("El valor esperado es:", E.X, "dolares\n")
## El valor esperado es: 88 dolares

E.X2 <- sum((x^2) * p)
Var.X <- E.X2 - (E.X)^2
Desv.X <- sqrt(Var.X)

cat("La varianza es:", round(Var.X, 2), "\n")
## La varianza es: 17256
cat("La desviacion estandar es:", round(Desv.X, 2), "dolares\n")
## La desviacion estandar es: 131.36 dolares

Quinta pregunta

Calcule la proporción X de personas que se podría esperar que respondieran a cierta encuesta que se envía por correo, si X tiene la función de densidad mostrada. Dibuje la función de densidad

\[ f(x) = \begin{cases} \dfrac{2(x + 2)}{5}, & 0 < x < 1, \\[8pt] 0, & \text{en otro caso.} \end{cases} \]


f.x <- function(x){
  ifelse(x <= 0 | x >= 1, 0,
         2 * (x + 2) / 5) # función de densidad
} 
a <- integrate(f.x, lower = 0, upper = 1)$value
cat("Área bajo la curva =", a, "\n")
## Área bajo la curva = 1

# Proporcion
expected_value <- integrate(function(x) x * f.x(x), 0, 1)$value
cat("Valor esperado E[X] =", round(expected_value, 4), "\n")
## Valor esperado E[X] = 0.5333

# Graficaa
x. <- seq(-0.2, 1.2, by = 0.001)
plot(x., f.x(x.), type = "l", col = "brown", lwd = 2,
     main = "Función de densidad f(x)",
     xlab = "x (proporción)", ylab = "f(x)")
abline(h = 0, col = "gray")

Sexta pregunta

El tiempo de falla (en cientos de horas) para un transistor es una variable aleatoria Y con función de distribución dada abajo.

Dibuje F(y)
Dibuje f(y)
Encuentre la probabilidad de que el transistor opere durante al menos 200 horas. 9 puntos


F.y <- function(y){
  ifelse(y < 0, 0,
         1 - exp(-y^2)) # Función de distribución acumulada
}

f.y <- function(y){
  ifelse(y < 0, 0,
         2 * y * exp(-y^2)) # Función de densidad
}

y <- seq(-1, 3, by = 0.001)

plot(y, F.y(y), type = "l", col = "blue", lwd = 2,
     main = "Función de distribución F(y)",
     xlab = "y (cientos de horas)", ylab = "F(y)")
abline(h = 0:1, col = "gray", lty = 2)


plot(y, f.y(y), type = "l", col = "red", lwd = 2,
     main = "Función de densidad f(y)",
     xlab = "y (cientos de horas)", ylab = "f(y)")


# Probabilidad del transistor 200 horas
p <- exp(-4)
cat("Probabilidad del transistor 200 horas", round(p, 4), "\n")
## Probabilidad del transistor 200 horas 0.0183

Parcial 2

Samuel Rodriguez

2025-10-30

Primera pregunta

Segunda pregunta

Tercera pregunta

Cuarta pregunta

Quinta pregunta

Sexta pregunta