Es un rango de valores que se utiliza para estimar el parámetro de una población. Este parámetro podría ser la media, la proporción, la desviación estándar u otro valor que estemos tratando de estimar. El intervalo de confianza proporciona una medida de la certeza o confianza que tenemos en nuestra estimación.
# Datos de muestra
muestra <- c(23, 25, 28, 32, 35, 18, 20, 22, 26, 30, 31, 27, 29, 24, 33, 19, 21, 34, 36, 28)
# Calcular el intervalo de confianza para la media
nivel_confianza <- 0.95
muestra_media <- mean(muestra)
desviacion_estandar <- sd(muestra)
tamano_muestra <- length(muestra)
# Calcular el error estándar de la media
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)
# Calcular el valor crítico de la distribución t
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)
# Calcular el margen de error
margen_error <- valor_critico * error_estandar
# Calcular el intervalo de confianza
intervalo_confianza <- c(muestra_media - margen_error, muestra_media + margen_error)
# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)
## Intervalo de confianza del 95 % para la media: 24.48444 29.61556
Ejemplo Supongamos que encuestaste a 150 clientes seleccionados al azar y registraste que 120 de ellos estaban satisfechos con el producto.
# Datos de la encuesta (simulados para este ejemplo)
clientes_satisfechos <- 120
tamano_muestra <- 150
proporcion_satisfechos <- clientes_satisfechos / tamano_muestra
calcular un intervalo de confianza del 95% para la proporción de clientes satisfechos
# Calcular el intervalo de confianza para la proporción
nivel_confianza <- 0.95
# Calcular el error estándar de la proporción
error_estandar_proporcion <- sqrt((proporcion_satisfechos * (1 - proporcion_satisfechos)) / tamano_muestra)
# Calcular el valor crítico de la distribución normal estándar
valor_critico <- qnorm((1 + nivel_confianza) / 2)
# Calcular el margen de error
margen_error_proporcion <- valor_critico * error_estandar_proporcion
# Calcular el intervalo de confianza
intervalo_confianza_proporcion <- c(proporcion_satisfechos - margen_error_proporcion, proporcion_satisfechos + margen_error_proporcion)
# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de clientes satisfechos:", intervalo_confianza_proporcion)
## Intervalo de confianza del 95 % para la proporción de clientes satisfechos: 0.7359878 0.8640122
Intervalo de Confianza para la Media
Supongamos que tienes una muestra de 25 observaciones de una variable aleatoria normalmente distribuida con una desviación estándar conocida de 5. La muestra es la siguiente:
set.seed(123)
muestra <- rnorm(25, mean = 30, sd = 5)
# Datos
muestra <- c(26, 32, 28, 35, 30, 24, 29, 27, 31, 33, 25, 28, 34, 29, 26, 32, 30, 27, 33, 28, 31, 25, 29, 30, 28)
# Cálculos
nivel_confianza <- 0.95
muestra_media <- mean(muestra)
desviacion_estandar <- sd(muestra)
tamano_muestra <- length(muestra)
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)
margen_error <- valor_critico * error_estandar
intervalo_confianza <- c(muestra_media - margen_error, muestra_media + margen_error)
# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)
## Intervalo de confianza del 95 % para la media: 27.98481 30.41519
2: Intervalo de Confianza para la Proporción
Imagina que realizas una encuesta en la que 80 de 100 personas encuestadas están de acuerdo con cierta afirmación. Calcula un intervalo de confianza del 90% para la proporción de personas que están de acuerdo.
# Datos
clientes_acuerdo <- 80
tamano_muestra <- 100
proporcion_acuerdo <- clientes_acuerdo / tamano_muestra
# Cálculos
nivel_confianza <- 0.90
error_estandar_proporcion <- sqrt((proporcion_acuerdo * (1 - proporcion_acuerdo)) / tamano_muestra)
valor_critico <- qnorm((1 + nivel_confianza) / 2)
margen_error_proporcion <- valor_critico * error_estandar_proporcion
intervalo_confianza_proporcion <- c(proporcion_acuerdo - margen_error_proporcion, proporcion_acuerdo + margen_error_proporcion)
# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción:", intervalo_confianza_proporcion)
## Intervalo de confianza del 90 % para la proporción: 0.7342059 0.8657941
3: Intervalo de Confianza para la Diferencia de Medias Supongamos que tienes dos muestras independientes, una de 30 observaciones y otra de 25 observaciones. Las medias de estas muestras son 50 y 45, respectivamente, y las desviaciones estándar son 8 y 7. Calcula un intervalo de confianza del 99% para la diferencia de medias entre las dos poblaciones.
# Datos
muestra1 <- c(22, 28, 26, 32, 27, 23, 29, 25, 30, 33, 24, 27, 31, 28, 26, 30, 28, 25, 31, 27, 30, 24, 28, 29, 26)
muestra2 <- c(18, 22, 20, 25, 21, 19, 24, 20, 23, 26, 17, 20, 25, 22, 19, 23, 21, 18, 24, 20, 23, 17, 22, 21, 19)
# Cálculos
nivel_confianza <- 0.99
media_muestra1 <- mean(muestra1)
media_muestra2 <- mean(muestra2)
desviacion_estandar_muestra1 <- sd(muestra1)
desviacion_estandar_muestra2 <- sd(muestra2)
tamano_muestra1 <- length(muestra1)
tamano_muestra2 <- length(muestra2)
# Error estándar de la diferencia de medias
error_estandar_diferencia <- sqrt((desviacion_estandar_muestra1^2 / tamano_muestra1) + (desviacion_estandar_muestra2^2 / tamano_muestra2))
# Valor crítico de la distribución t
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra1 + tamano_muestra2 - 2)
# Margen de error
margen_error_diferencia <- valor_critico * error_estandar_diferencia
# Intervalo de confianza para la diferencia de medias
intervalo_confianza_diferencia <- c((media_muestra1 - media_muestra2) - margen_error_diferencia, (media_muestra1 - media_muestra2) + margen_error_diferencia)
# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la diferencia de medias:", intervalo_confianza_diferencia)
## Intervalo de confianza del 99 % para la diferencia de medias: 4.352838 8.447162