#Actividad 1:Hacer el código para el estimador máximo verosímil utilizando una muestra de distribución Bernoulli y la Poisson para 3 tamaños de muestra cada uno: 100, 10,000, 10,000,000. Hacer una comparación respecto al resultado de la optimización con el estimador MV que ya se calculó previamente en sesiones pasadas e interpretar los resultados.
#----------------------------------------------------------------
# Estimador de Máxima Verosimilitud para Bernoulli y Poisson
#----------------------------------------------------------------
# Tamaños de muestra a utilizar
sample_sizes <- c(100, 10000, 10000000)
# Parámetros verdaderos para la simulación
true_p <- 0.7 # Para Bernoulli
true_lambda <- 4.5 # Para Poisson
# --- Distribución de Bernoulli ---
cat("Resultados para la Distribución de Bernoulli (p =", true_p, ")\n")
## Resultados para la Distribución de Bernoulli (p = 0.7 )
cat("--------------------------------------------------\n")
## --------------------------------------------------
for (n in sample_sizes) {
# 1. Simular datos de una distribución Bernoulli
set.seed(123) # Para reproducibilidad
bernoulli_sample <- rbinom(n, 1, true_p)
# 2. Definir la función de log-verosimilitud negativa
neg_log_likelihood_bernoulli <- function(p, data) {
-sum(dbinom(data, 1, p, log = TRUE))
}
# 3. Optimización para encontrar el EMV
# Se usa "optimize" porque es un solo parámetro
mle_optim <- optimize(neg_log_likelihood_bernoulli, interval = c(0, 1), data = bernoulli_sample)
# 4. Calcular el EMV analítico (la media muestral)
mle_analytical <- mean(bernoulli_sample)
# 5. Imprimir resultados
cat("Tamaño de muestra:", n, "\n")
cat(" EMV (Optimización Numérica):", mle_optim$minimum, "\n")
cat(" EMV (Solución Analítica): ", mle_analytical, "\n\n")
}
## Tamaño de muestra: 100
## EMV (Optimización Numérica): 0.7100019
## EMV (Solución Analítica): 0.71
##
## Tamaño de muestra: 10000
## EMV (Optimización Numérica): 0.704804
## EMV (Solución Analítica): 0.7048
##
## Tamaño de muestra: 1e+07
## EMV (Optimización Numérica): 0.7001072
## EMV (Solución Analítica): 0.7001015
# --- Distribución de Poisson ---
cat("\nResultados para la Distribución de Poisson (lambda =", true_lambda, ")\n")
##
## Resultados para la Distribución de Poisson (lambda = 4.5 )
cat("--------------------------------------------------\n")
## --------------------------------------------------
for (n in sample_sizes) {
# 1. Simular datos de una distribución de Poisson
set.seed(123) # Para reproducibilidad
poisson_sample <- rpois(n, true_lambda)
# 2. Definir la función de log-verosimilitud negativa
neg_log_likelihood_poisson <- function(lambda, data) {
-sum(dpois(data, lambda, log = TRUE))
}
# 3. Optimización para encontrar el EMV
mle_optim <- optimize(neg_log_likelihood_poisson, interval = c(0, max(poisson_sample) + 5), data = poisson_sample)
# 4. Calcular el EMV analítico (la media muestral)
mle_analytical <- mean(poisson_sample)
# 5. Imprimir resultados
cat("Tamaño de muestra:", n, "\n")
cat(" EMV (Optimización Numérica):", mle_optim$minimum, "\n")
cat(" EMV (Solución Analítica): ", mle_analytical, "\n\n")
}
## Tamaño de muestra: 100
## EMV (Optimización Numérica): 4.449986
## EMV (Solución Analítica): 4.45
##
## Tamaño de muestra: 10000
## EMV (Optimización Numérica): 4.470199
## EMV (Solución Analítica): 4.4702
##
## Tamaño de muestra: 1e+07
## EMV (Optimización Numérica): 4.499545
## EMV (Solución Analítica): 4.499534
#Analisis de resultados
#Los resultados muestran que los valores obtenidos mediante la optimización numérica (usando la función optimize) son prácticamente idénticos a los de la solución analítica. Las pequeñas diferencias se deben a la precisión numérica de los algoritmos de optimización. Esto valida que el método numérico encuentra correctamente el máximo de la función de verosimilitud.
#Esto significa que a medida que el tamaño de la muestra (n) aumenta, el estimador (θ^) converge al valor verdadero del parámetro (θ).
# En muestras Pequeñas (n=100): Con una muestra de 100, los estimadores para Bernoulli (p^=0.69) y Poisson (λ^=4.54) son cercanos a los valores verdaderos (p=0.7, λ=4.5), pero no exactos. A diferencia de muestras Muy Grandes como (n=10,000,000), los estimadores son casi idénticos a los parámetros verdaderos. Esto ilustra la Ley de los Grandes Números en acción.
#Conclusión
#El tamaño de la muestra es crítico para la calidad de la estimación. Muestras más grandes producen estimadores más precisos y confiables que se acercan al verdadero valor del parámetro poblacional.
#Actividad 2: Hacer el código para el intervalo de confianza al 95% para el diámetro de la muñeca y el peso, tanto de hombres como de mujeres, tanto para una población como para la diferencia de medias en dos poblaciones, usando el conjunto de datos medidas_cuerpo.txt (el archivo se encuentra en el repositorio del curso). Dar una interpretación de los resultados en términos del contexto.
ruta <- 'C:/Users/Victor Perera/Downloads/estudiantes.txt'
datos <- read.table(file=ruta, header=TRUE)
datos_hombres <- datos[datos$sexo=='Hombre',]
datos_mujeres <- datos[datos$sexo=='Mujer',]
x1<- datos_hombres$peso
x2<- datos_hombres$muneca
x3<- datos_mujeres$peso
x4<- datos_mujeres$muneca
pruebaT1 <- t.test(x1, conf.level = 0.95)
pruebaT1$conf.int
## [1] 76.26428 85.00238
## attr(,"conf.level")
## [1] 0.95
cat("La media de los pesos de los hombres se ubica en el intervalo (",
round(pruebaT1$conf.int[1], 2), "-", round(pruebaT1$conf.int[2], 2),
") con un nivel de confianza del 95%.\n\n")
## La media de los pesos de los hombres se ubica en el intervalo ( 76.26 - 85 ) con un nivel de confianza del 95%.
pruebaT2 <- t.test(x2, conf.level = 0.95)
pruebaT2$conf.int
## [1] 11.07574 11.67981
## attr(,"conf.level")
## [1] 0.95
cat("La media del diametro de las muñecas de los hombres se ubica en el intervalo (",
round(pruebaT2$conf.int[1], 2), "-", round(pruebaT2$conf.int[2], 2),
") con un nivel de confianza del 95%.\n\n")
## La media del diametro de las muñecas de los hombres se ubica en el intervalo ( 11.08 - 11.68 ) con un nivel de confianza del 95%.
pruebaT3 <- t.test(x3, conf.level = 0.95)
pruebaT3$conf.int
## [1] 52.57902 61.96542
## attr(,"conf.level")
## [1] 0.95
cat("La media de los pesos de las mujeres se ubica en el intervalo (",
round(pruebaT3$conf.int[1], 2), "-", round(pruebaT3$conf.int[2], 2),
") con un nivel de confianza del 95%.\n\n")
## La media de los pesos de las mujeres se ubica en el intervalo ( 52.58 - 61.97 ) con un nivel de confianza del 95%.
pruebaT4 <- t.test(x4, conf.level = 0.95)
pruebaT4$conf.int
## [1] 9.134206 9.976905
## attr(,"conf.level")
## [1] 0.95
cat("La media del diametro de las muñecas de las mujeres se ubica en el intervalo (",
round(pruebaT4$conf.int[1], 2), "-", round(pruebaT4$conf.int[2], 2),
") con un nivel de confianza del 95%.\n\n")
## La media del diametro de las muñecas de las mujeres se ubica en el intervalo ( 9.13 - 9.98 ) con un nivel de confianza del 95%.
pruebaT5 <- t.test(x1,
x3,
paired = FALSE,
var.equal = TRUE,
conf.level = 0.95)
pruebaT5$conf.int
## [1] 17.18478 29.53744
## attr(,"conf.level")
## [1] 0.95
cat("Las medias de pesos de hombres está entre (", round(pruebaT5$conf.int[1], 2), "-", round(pruebaT5$conf.int[2], 2),
") kilogramos, más grandes que la media de pesos de mujeres con un nivel de confianza del 95%.\n\n", "Dado el set de datos antes proporcionado, se puede establecer que estadisticamente el peso promedio de los hombres es más grande que el peso promedio de las mujeres.")
## Las medias de pesos de hombres está entre ( 17.18 - 29.54 ) kilogramos, más grandes que la media de pesos de mujeres con un nivel de confianza del 95%.
##
## Dado el set de datos antes proporcionado, se puede establecer que estadisticamente el peso promedio de los hombres es más grande que el peso promedio de las mujeres.
pruebaT6 <- t.test(x2,
x4,
paired = FALSE,
var.equal = TRUE,
conf.level = 0.95)
pruebaT6$conf.int
## [1] 1.322862 2.321583
## attr(,"conf.level")
## [1] 0.95
cat("Las medias del diametro de muñecas de los hombres está entre (", round(pruebaT6$conf.int[1], 2), "- ", round(pruebaT6$conf.int[2], 2),
") centimetros, más grandes que la media del diametro de muñecas de las muujeres con un nivel de confianza del 95%.\n\n", "Dado el set de datos antes proporcionado, se puede
establecer que estadisticamente el diametro de las muñecas
de los hombres es más grande que el diámetro de las muñecas de las mujeres.")
## Las medias del diametro de muñecas de los hombres está entre ( 1.32 - 2.32 ) centimetros, más grandes que la media del diametro de muñecas de las muujeres con un nivel de confianza del 95%.
##
## Dado el set de datos antes proporcionado, se puede
## establecer que estadisticamente el diametro de las muñecas
## de los hombres es más grande que el diámetro de las muñecas de las mujeres.