Intervalo de confianza

Es un rango de valores que se utiliza para estimar el parámetro de una población. Este parámetro podría ser la media, la proporción, la desviación estándar u otro valor que estemos tratando de estimar. El intervalo de confianza proporciona una medida de la certeza o confianza que tenemos en nuestra estimación.

# Datos de muestra
muestra <- c(23, 25, 28, 32, 35, 18, 20, 22, 26, 30, 31, 27, 29, 24, 33, 19, 21, 34, 36, 28)

# Calcular el intervalo de confianza para la media
nivel_confianza <- 0.95
muestra_media <- mean(muestra)
desviacion_estandar <- sd(muestra)
tamano_muestra <- length(muestra)

# Calcular el error estándar de la media
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)

# Calcular el valor crítico de la distribución t
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)

# Calcular el margen de error
margen_error <- valor_critico * error_estandar

# Calcular el intervalo de confianza
intervalo_confianza <- c(muestra_media - margen_error, muestra_media + margen_error)

# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)

## Intervalo de confianza del 95 % para la media: 24.48444 29.61556

Ejemplo Supongamos que encuestaste a 150 clientes seleccionados al azar y registraste que 120 de ellos estaban satisfechos con el producto.

# Datos de la encuesta (simulados para este ejemplo)
clientes_satisfechos <- 120
tamano_muestra <- 150
proporcion_satisfechos <- clientes_satisfechos / tamano_muestra

calcular un intervalo de confianza del 95% para la proporción de clientes satisfechos

# Calcular el intervalo de confianza para la proporción
nivel_confianza <- 0.95

# Calcular el error estándar de la proporción
error_estandar_proporcion <- sqrt((proporcion_satisfechos * (1 - proporcion_satisfechos)) / tamano_muestra)

# Calcular el valor crítico de la distribución normal estándar
valor_critico <- qnorm((1 + nivel_confianza) / 2)

# Calcular el margen de error
margen_error_proporcion <- valor_critico * error_estandar_proporcion

# Calcular el intervalo de confianza
intervalo_confianza_proporcion <- c(proporcion_satisfechos - margen_error_proporcion, proporcion_satisfechos + margen_error_proporcion)

# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de clientes satisfechos:", intervalo_confianza_proporcion)

## Intervalo de confianza del 95 % para la proporción de clientes satisfechos: 0.7359878 0.8640122

Intervalo de Confianza para la Media

Supongamos que tienes una muestra de 25 observaciones de una variable aleatoria normalmente distribuida con una desviación estándar conocida de 5. La muestra es la siguiente:

set.seed(123)
muestra <- rnorm(25, mean = 30, sd = 5)

# Datos
muestra <- c(26, 32, 28, 35, 30, 24, 29, 27, 31, 33, 25, 28, 34, 29, 26, 32, 30, 27, 33, 28, 31, 25, 29, 30, 28)

# Cálculos
nivel_confianza <- 0.95
muestra_media <- mean(muestra)
desviacion_estandar <- sd(muestra)
tamano_muestra <- length(muestra)
error_estandar <- desviacion_estandar / sqrt(tamano_muestra)
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)
margen_error <- valor_critico * error_estandar
intervalo_confianza <- c(muestra_media - margen_error, muestra_media + margen_error)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)

## Intervalo de confianza del 95 % para la media: 27.98481 30.41519

2: Intervalo de Confianza para la Proporción

Imagina que realizas una encuesta en la que 80 de 100 personas encuestadas están de acuerdo con cierta afirmación. Calcula un intervalo de confianza del 90% para la proporción de personas que están de acuerdo.

# Datos
clientes_acuerdo <- 80
tamano_muestra <- 100
proporcion_acuerdo <- clientes_acuerdo / tamano_muestra

# Cálculos
nivel_confianza <- 0.90
error_estandar_proporcion <- sqrt((proporcion_acuerdo * (1 - proporcion_acuerdo)) / tamano_muestra)
valor_critico <- qnorm((1 + nivel_confianza) / 2)
margen_error_proporcion <- valor_critico * error_estandar_proporcion
intervalo_confianza_proporcion <- c(proporcion_acuerdo - margen_error_proporcion, proporcion_acuerdo + margen_error_proporcion)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción:", intervalo_confianza_proporcion)

## Intervalo de confianza del 90 % para la proporción: 0.7342059 0.8657941

3: Intervalo de Confianza para la Diferencia de Medias Supongamos que tienes dos muestras independientes, una de 30 observaciones y otra de 25 observaciones. Las medias de estas muestras son 50 y 45, respectivamente, y las desviaciones estándar son 8 y 7. Calcula un intervalo de confianza del 99% para la diferencia de medias entre las dos poblaciones.

# Datos
muestra1 <- c(22, 28, 26, 32, 27, 23, 29, 25, 30, 33, 24, 27, 31, 28, 26, 30, 28, 25, 31, 27, 30, 24, 28, 29, 26)


muestra2 <- c(18, 22, 20, 25, 21, 19, 24, 20, 23, 26, 17, 20, 25, 22, 19, 23, 21, 18, 24, 20, 23, 17, 22, 21, 19)

# Cálculos
nivel_confianza <- 0.99
media_muestra1 <- mean(muestra1)
media_muestra2 <- mean(muestra2)
desviacion_estandar_muestra1 <- sd(muestra1)
desviacion_estandar_muestra2 <- sd(muestra2)
tamano_muestra1 <- length(muestra1)
tamano_muestra2 <- length(muestra2)

# Error estándar de la diferencia de medias
error_estandar_diferencia <- sqrt((desviacion_estandar_muestra1^2 / tamano_muestra1) + (desviacion_estandar_muestra2^2 / tamano_muestra2))

# Valor crítico de la distribución t
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra1 + tamano_muestra2 - 2)

# Margen de error
margen_error_diferencia <- valor_critico * error_estandar_diferencia

# Intervalo de confianza para la diferencia de medias
intervalo_confianza_diferencia <- c((media_muestra1 - media_muestra2) - margen_error_diferencia, (media_muestra1 - media_muestra2) + margen_error_diferencia)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la diferencia de medias:", intervalo_confianza_diferencia)

## Intervalo de confianza del 99 % para la diferencia de medias: 4.352838 8.447162

Ejemplo:

calcular un intervalo de confianza del 95% para la media de la población. Aquí están los puntos clave relacionados con el nivel de confianza y la significancia:

Nivel de Confianza: Utilizar un nivel de confianza del 95%. Esto significa que si repitiéramos este proceso de muestreo y cálculo del intervalo de confianza muchas veces, esperaríamos que el 95% de esos intervalos contengan la verdadera media poblacional.

Significancia (Nivel de Significancia): El nivel de significancia es complementario al nivel de confianza. En este caso, el nivel de significancia asociado con el nivel de confianza del 95% es del 5%. Este nivel se asocia con el riesgo de cometer un error de tipo I en una prueba de

# Datos de muestra (simulados para este ejemplo)
set.seed(123)
puntuaciones <- rnorm(100, mean = 75, sd = 10)

# Cálculos para un intervalo de confianza del 95%
nivel_confianza <- 0.95
media <- mean(puntuaciones)
error_estandar <- sd(puntuaciones) / sqrt(length(puntuaciones))
valor_critico <- qnorm((1 + nivel_confianza) / 2)
margen_error <- valor_critico * error_estandar

# Intervalo de confianza
intervalo_confianza <- c(media - margen_error, media + margen_error)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza, "\n")

## Intervalo de confianza del 95 % para la media: 74.11497 77.69315

# Nivel de significancia
nivel_significancia <- 1 - nivel_confianza
cat("Nivel de significancia:", nivel_significancia, "\n")

## Nivel de significancia: 0.05

El intervalo de confianza obtenido es una estimación de dónde se encuentra la verdadera media de la población con un 95% de confianza. Es decir, si repitiéramos el proceso de muestreo y cálculo del intervalo muchas veces, esperaríamos que el 95% de esos intervalos contengan la verdadera media poblacional. En el ejemplo, el resultado sería algo así como “El intervalo de confianza del 95% para la media de las puntuaciones de examen está entre X e Y”.

Nivel de Significancia del 5%:

El nivel de significancia está relacionado con las pruebas de hipótesis. En este contexto, representa el riesgo de cometer un error de tipo I al rechazar incorrectamente una hipótesis nula verdadera. En este ejemplo, el resultado indica que el nivel de significancia es del 5%. Esto significa que si realizáramos una prueba de hipótesis, estaríamos dispuestos a aceptar un riesgo del 5% de cometer un error de tipo I.

Se usa la funcion qnorm para encontrar el valor crítico asociado con el nivel de confianza seleccionado. Esta función se basa en la distribución normal estándar.

Z	P(Z)
-3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0	0.0013 0.0062 0.0228 0.0668 0.1587 0.3085 0.5000 0.6915 0.8413 0.9332 0.9772 0.9938 0.9987

En esta tabla, la columna “Z” contiene los valores críticos de la distribución normal estándar, y la columna “P(Z)” contiene las probabilidades acumuladas asociadas con esos valores.

# Definir el nivel de confianza o significancia
nivel_confianza <- 0.95

# Encontrar el valor crítico para la distribución normal estándar
valor_critico <- qnorm((1 + nivel_confianza) / 2)

# Mostrar el resultado
cat("Valor crítico para un nivel de confianza del", nivel_confianza * 100, "%:", valor_critico, "\n")

## Valor crítico para un nivel de confianza del 95 %: 1.959964

# También puedes encontrar la probabilidad acumulada asociada con un valor
probabilidad_acumulada <- pnorm(valor_critico)
cat("Probabilidad acumulada asociada con el valor crítico:", probabilidad_acumulada, "\n")

## Probabilidad acumulada asociada con el valor crítico: 0.975

Ejercicios Intervalo de Confianza para la Media Supongamos que tienes los siguientes datos de altura (en centímetros) de una muestra de 25 personas y deseas construir un intervalo de confianza del 90% para la altura media.

# Datos de muestra
altura <- c(165, 170, 155, 180, 175, 160, 172, 168, 162, 178,
            169, 173, 166, 176, 158, 182, 168, 165, 170, 174,
            171, 163, 177, 160, 168)

# Nivel de confianza
nivel_confianza <- 0.90

# Cálculos
media_muestra <- mean(altura)
error_estandar <- sd(altura) / sqrt(length(altura))
valor_critico <- qt((1 + nivel_confianza) / 2, df = length(altura) - 1)
margen_error <- valor_critico * error_estandar

# Intervalo de confianza
intervalo_confianza <- c(media_muestra - margen_error, media_muestra + margen_error)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media de la altura:", intervalo_confianza, "\n")

## Intervalo de confianza del 90 % para la media de la altura: 166.5966 171.4034

Intervalo de Confianza para la Proporción:

Imagina que estás realizando una encuesta y quieres construir un intervalo de confianza del 95% para la proporción de personas que están de acuerdo con una declaración. Tienes una muestra de 150 personas y 120 de ellas están de acuerdo.

# Datos de muestra
acuerdo <- 120
total_muestra <- 150

# Nivel de confianza
nivel_confianza <- 0.95

# Cálculos
proporcion_muestra <- acuerdo / total_muestra
error_estandar_proporcion <- sqrt((proporcion_muestra * (1 - proporcion_muestra)) / total_muestra)
valor_critico_proporcion <- qnorm((1 + nivel_confianza) / 2)
margen_error_proporcion <- valor_critico_proporcion * error_estandar_proporcion

# Intervalo de confianza
intervalo_confianza_proporcion <- c(proporcion_muestra - margen_error_proporcion, proporcion_muestra + margen_error_proporcion)

# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de acuerdo:", intervalo_confianza_proporcion, "\n")

## Intervalo de confianza del 95 % para la proporción de acuerdo: 0.7359878 0.8640122

Resolver: Problema 1: Intervalo de Confianza para la Media Suponer que estás realizando un estudio sobre el tiempo que los estudiantes universitarios pasan estudiando por semana. Tomas una muestra aleatoria de 30 estudiantes y registras las horas que cada uno pasa estudiando. Con estos datos, deseas construir un intervalo de confianza del 95% para la media del tiempo de estudio.

Problema 2: Intervalo de Confianza para la Proporción Imagina que trabajas en una empresa de comercio electrónico y estás interesado en conocer la proporción de clientes que han realizado compras en los últimos tres meses. Tomas una muestra aleatoria de 200 clientes y registras cuántos de ellos han realizado compras recientemente. Con estos datos, deseas construir un intervalo de confianza del 90% para la proporción de clientes que han realizado compras.

Problema 3: Intervalo de Confianza para la Diferencia de Medias Suponer que estás investigando la diferencia en la velocidad de reacción entre dos grupos de conductores: aquellos que practican deportes regularmente y aquellos que no lo hacen. Tomas una muestra aleatoria de cada grupo y mides sus tiempos de reacción en milisegundos. Con estos datos, deseas construir un intervalo de confianza del 99% para la diferencia media en los tiempos de reacción entre los dos grupos.

Problema 4: Intervalo de Confianza para la Varianza Suponer que estás estudiando la variabilidad en el rendimiento de dos máquinas en una fábrica. Recopilas datos sobre la producción diaria de cada máquina durante un mes. Con estos datos, deseas construir un intervalo de confianza del 95% para la varianza en la producción diaria de ambas

Distribucion normal

Supongamos que tienes datos de la puntuación de un examen y quieres realizar algunas inferencias estadísticas sobre ellas.

# Datos de muestra (simulados para este ejemplo)
set.seed(123)
puntuaciones <- rnorm(100, mean = 75, sd = 10)

calcular la media y la desviación estándar de la muestra.

# Calcular la media y la desviación estándar
media <- mean(puntuaciones)
desviacion_estandar <- sd(puntuaciones)

cat("Media:", media, "\n")

## Media: 75.90406

cat("Desviación estándar:", desviacion_estandar, "\n")

## Desviación estándar: 9.128159

Suponer que queremos calcular la probabilidad de obtener una puntuación mayor a 80 en el examen. Utilizaremos la función pnorm para calcular la probabilidad acumulada hasta un punto en la distribución normal.

# Calcular la probabilidad de obtener una puntuación mayor a 80
probabilidad_mayor_80 <- 1 - pnorm(80, mean = media, sd = desviacion_estandar)

cat("Probabilidad de obtener una puntuación mayor a 80:", probabilidad_mayor_80, "\n")

## Probabilidad de obtener una puntuación mayor a 80: 0.3268187

para visualizar la distribución de las puntuaciones, podemos crear un histograma y superponer la curva de la distribución normal utilizando la función

# Crear un histograma y superponer la curva de la distribución normal
hist(puntuaciones, prob = TRUE, col = "lightblue", main = "Distribución de Puntuaciones",
     xlab = "Puntuaciones", ylab = "Frecuencia")
curve(dnorm(x, mean = media, sd = desviacion_estandar), add = TRUE, col = "darkred", lwd = 2)

Intervalo de confianza

Karol Johana Zambrano Cruz

2023-11-18

Intervalo de confianza