Estimadores

Una estadística basada en las mediciones contenidas en una muestra- es un estimador que nos aproxima al valor verdadero de un parámetro poblacional.

Los estimadores tienen sus propias características.

1. Media Poblacional (μ):

Ejemplo: Supongamos que estamos interesados en estimar la altura media (μ) de una especie de planta en una región. Medimos la altura de 10 plantas seleccionadas al azar y obtenemos los siguientes datos en centímetros:

altura_plantas <- c(30, 35, 28, 40, 32, 38, 25, 36, 33, 29)
media_estimada <- mean(altura_plantas)
media_estimada
## [1] 32.6
  1. Varianza Poblacional \((σ^2)\):

Ejemplo: Supongamos que queremos estimar la varianza (σ^2) del tiempo de entrega de paquetes en una empresa de mensajería. Medimos el tiempo de entrega de 15 paquetes y obtenemos los siguientes datos en minutos:

tiempo_entrega <- c(24, 28, 23, 26, 30, 22, 27, 29, 25, 31, 24, 28, 26, 23, 30)
varianza_estimada <- var(tiempo_entrega)
varianza_estimada
## [1] 8.257143
  1. Proporción Poblacional \((p)\):

Ejemplo: Supongamos que queremos estimar la proporción (p) de estudiantes en una escuela que han aprobado un examen. Tomamos una muestra aleatoria de 50 estudiantes y encontramos que 35 aprobaron 3. Proporción Poblacional (p):

aprobados <- 35
total_estudiantes <- 50
proporcion_estimada <- aprobados / total_estudiantes
proporcion_estimada
## [1] 0.7
  1. Diferencia de Medias \((μ_1 −μ_2)\):

Ejemplo: Supongamos que queremos estimar la diferencia en la altura promedio (μ) entre dos especies de plantas, A y B. Tomamos muestras aleatorias de ambas especies y medimos las alturas en centímetros:

altura_plantas_A <- c(32, 35, 30, 28, 31)
altura_plantas_B <- c(36, 40, 34, 33, 37)
diferencia_medias_estimada <- mean(altura_plantas_A) - mean(altura_plantas_B)
diferencia_medias_estimada
## [1] -4.8
  1. Diferencia de Proporciones \((p_1 - p_2)\):

Ejemplo: Supongamos que queremos estimar la diferencia en la proporción de estudiantes que aprueban el examen entre dos escuelas, Escuela A y Escuela B. Tomamos muestras aleatorias de ambas escuelas y encontramos las proporciones de aprobados:

aprobados_A <- 40
total_estudiantes_A <- 60
proporcion_A_estimada <- aprobados_A / total_estudiantes_A

aprobados_B <- 25
total_estudiantes_B <- 50
proporcion_B_estimada <- aprobados_B / total_estudiantes_B

diferencia_proporciones_estimada <- proporcion_A_estimada - proporcion_B_estimada
diferencia_proporciones_estimada
## [1] 0.1666667
  1. Regresión Lineal \((y = mx + b)\):

Ejemplo: Supongamos que queremos estimar la relación entre las horas de estudio \(\bar{x}\) y \(\bar{y}\) las calificaciones de un grupo de estudiantes. Utilizamos el método de mínimos cuadrados para ajustar una línea de regresión:

horas_estudio <- c(5, 8, 6, 10, 7)
calificaciones <- c(75, 88, 78, 92, 82)

modelo_regresion <- lm(calificaciones ~ horas_estudio)
pendiente_estimada <- coef(modelo_regresion)[2]
intercepto_estimado <- coef(modelo_regresion)[1]

pendiente_estimada
## horas_estudio 
##      3.581081
intercepto_estimado
## (Intercept) 
##    57.21622

Estimación Puntual de la Media Poblacional (μ):

Ejemplo: Supongamos que queremos estimar la altura media de árboles en un bosque. Tomamos una muestra de 20 árboles y medimos sus alturas en metros. Utilizamos el promedio de estas alturas como nuestra estimación puntual de la altura media poblacional.

# Alturas de los árboles en metros
alturas_arboles <- c(15, 12, 18, 20, 16, 14, 19, 22, 17, 15, 13, 21, 14, 16, 18, 19, 20, 17, 15, 14)

# Estimación puntual de la media poblacional
media_estimada <- mean(alturas_arboles)
media_estimada
## [1] 16.75

Estimador de maxima verosimilitud Supongamos que tenemos una muestra de datos que sigue una distribución normal y queremos encontrar los estimadores de máxima verosimilitud para la media (μ) y la desviación estándar (σ).

# Generar datos de ejemplo
set.seed(123)  # Para reproducibilidad
datos <- rnorm(100, mean = 5, sd = 2)

# Función de verosimilitud para una distribución normal
likelihood_normal <- function(parametros) {
  mu <- parametros[1]
  sigma <- parametros[2]
  if (sigma <= 0) return(Inf)  # Evitar valores no finitos
  -sum(dnorm(datos, mean = mu, sd = sigma, log = TRUE))
}

# Estimación MLE
resultado_mle <- optim(c(0, 1), likelihood_normal, method = "Nelder-Mead")
mu_estimada <- resultado_mle$par[1]
sigma_estimada <- resultado_mle$par[2]

# Mostrar resultados
cat("Estimación MLE para la media:", mu_estimada, "\n")
## Estimación MLE para la media: 5.180711
cat("Estimación MLE para la desviación estándar:", sigma_estimada, "\n")
## Estimación MLE para la desviación estándar: 1.816117

proporcionará los estimadores de máxima verosimilitud para la media (μ) y la desviación estándar (σ) basados en la muestra de datos generada.

Intervalo de Confianza para la Media Poblacional \(\bar{μ}\): Proporciona un rango de valores dentro del cual es probable que se encuentre el parámetro poblacional desconocido. En lugar de proporcionar una única estimación puntual, los intervalos de confianza ofrecen un intervalo de valores que, con cierto nivel de confianza, contiene el verdadero valor del parámetro.

# Alturas de los árboles en metros
alturas_arboles <- c(15, 12, 18, 20, 16, 14, 19, 22, 17, 15, 13, 21, 14, 16, 18, 19, 20, 17, 15, 14)

# Estimación puntual de la media poblacional
media_estimada <- mean(alturas_arboles)

# Nivel de confianza (ejemplo: 95%)
nivel_confianza <- 0.95

# Desviación estándar de la muestra
desviacion_estandar <- sd(alturas_arboles)

# Tamaño de la muestra
tamano_muestra <- length(alturas_arboles)

# Error estándar de la media
error_estandar_media <- desviacion_estandar / sqrt(tamano_muestra)

# Valor crítico t para el nivel de confianza
valor_critico_t <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)

# Margen de error
margen_error <- valor_critico_t * error_estandar_media

# Intervalo de confianza
intervalo_confianza <- c(media_estimada - margen_error, media_estimada + margen_error)

# Imprimir el intervalo de confianza
cat("Intervalo de Confianza para la Media Poblacional (", nivel_confianza * 100, "%): [",
    round(intervalo_confianza[1], 2), ", ", round(intervalo_confianza[2], 2), "]\n")
## Intervalo de Confianza para la Media Poblacional ( 95 %): [ 15.44 ,  18.06 ]

Estimación MLE para una Distribución Exponencial

# Generar datos de ejemplo
set.seed(456)  # Para reproducibilidad
datos_exp <- rexp(150, rate = 0.2)

# Función de verosimilitud para una distribución exponencial
likelihood_exponencial <- function(parametros) {
  lambda <- parametros[1]
  -sum(dexp(datos_exp, rate = lambda, log = TRUE))
}

# Estimación MLE
resultado_mle_exp <- optim(c(0.1), likelihood_exponencial, method = "L-BFGS-B")
lambda_estimada <- resultado_mle_exp$par[1]

# Mostrar resultado
cat("Estimación MLE para el parámetro lambda:", lambda_estimada, "\n")
## Estimación MLE para el parámetro lambda: 0.2306263

2. Intervalo de confianza calcular el intervalo de confianza para la media poblacional utilizando la distribución t de Student

Intervalo de Confianza para la Media Poblacional (μ)

# Datos de ejemplo
datos <- c(25, 30, 28, 35, 32, 31, 29, 27, 30, 33)

# Estadísticas muestrales
media_muestral <- mean(datos)
desviacion_estandar <- sd(datos)
tamano_muestra <- length(datos)

# Nivel de confianza (ejemplo: 95%)
nivel_confianza <- 0.95

# Valor crítico t
valor_critico_t <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)

# Margen de error
margen_error <- valor_critico_t * (desviacion_estandar / sqrt(tamano_muestra))

# Intervalo de confianza
intervalo_confianza <- c(media_muestral - margen_error, media_muestral + margen_error)

# Mostrar resultado
cat("Intervalo de Confianza para la Media Poblacional:", intervalo_confianza, "\n")
## Intervalo de Confianza para la Media Poblacional: 27.89405 32.10595