Ejemplo 1:

Cuando las personas fuman, la nicotina que absorben se convierte en cotinina, que puede medirse. Una muestra de 40 fumadores tiene una media del nivel de cotinina de 172.5. Suponga que se sabe que σ es 119.5, calcule el estimado del intervalo de confianza del 90% de la media del nivel de cotinina para todos los fumadores.

Muestra de 40 fumadores, media de cotinina = 172.5, σ = 119.5, confianza = 90%

# Datos
n1 <- 40
xbar1 <- 172.5
sigma1 <- 119.5
confianza1 <- 0.90

# Cálculo
z1 <- qnorm(1 - (1 - confianza1)/2)
error1 <- z1 * sigma1 / sqrt(n1)
lim_inf1 <- xbar1 - error1
lim_sup1 <- xbar1 + error1
cat("Nivel de confianza: 90% → Z =",z1,"\n")
## Nivel de confianza: 90% → Z = 1.644854
cat("Error estándar:",(sigma1/sqrt(n1)),"\n")
## Error estándar: 18.89461
cat("Margen de error:",error1,"\n")
## Margen de error: 31.07887
cat("Intervalo de confianza: (",lim_inf1,",",lim_sup1,")\n")
## Intervalo de confianza: ( 141.4211 , 203.5789 )
cat("Tenemos un 90% de confianza en que el nivel medio de cotinina poblacional para todos los fumadores está entre",lim_inf1, "y" ,lim_sup1,".")
## Tenemos un 90% de confianza en que el nivel medio de cotinina poblacional para todos los fumadores está entre 141.4211 y 203.5789 .

Ejercicio 2:

Para ayudar a identificar patrones de crecimiento anormales en los bebés, necesitamos construir un estimado del intervalo de confianza de la media de la circunferencia de la cabeza de todos los bebés con dos meses de vida. Se obtiene una muestra aleatoria de 100 bebés, y se encuentra que la media de la circunferencia de la cabeza es 40.6 cm. Suponiendo que se sabe que la desviación estándar poblacional es de 1.6 cm, calcule un estimado del intervalo de confianza del 99% de la media de las circunferencias de la cabeza de todos los bebés de dos meses de edad.

Muestra de 100 bebés, media de la circunferencia de la cabeza = 40.6, σ = 1.6, confianza = 99%

# Datos
n2 <- 100
xbar2 <- 40.6
sigma2 <- 1.6
confianza2 <- 0.99

# Cálculo
z2 <- qnorm(1 - (1 - confianza2)/2)
error2 <- z2 * sigma2 / sqrt(n2)
lim_inf2 <- xbar2 - error2
lim_sup2 <- xbar2 + error2
cat("Nivel de confianza: 99% → Z =",z2,"\n")
## Nivel de confianza: 99% → Z = 2.575829
cat("Error estándar:",(sigma2/sqrt(n2)),"\n")
## Error estándar: 0.16
cat("Margen de error:",error2,"\n")
## Margen de error: 0.4121327
cat("Intervalo de confianza: (",lim_inf2,",",lim_sup2,")\n")
## Intervalo de confianza: ( 40.18787 , 41.01213 )
cat("Tenemos un 99% de confianza en que la media de la circunferencia poblacional para la cabeza de  todos los bebés se encuentra entre",lim_inf2, "y" ,lim_sup2)
## Tenemos un 99% de confianza en que la media de la circunferencia poblacional para la cabeza de  todos los bebés se encuentra entre 40.18787 y 41.01213

Ejercicio 3:

Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de σ igual a 25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de xҧ=1014 horas. Construya un intervalo de confianza del 95% para la duración promedio.

Muestra de 20 focos, media de la duración promedio = 1014, σ = 25, confianza = 95%

# Datos
n3 <- 20
xbar3 <- 1014
sigma3 <- 25
confianza3 <- 0.95

# Cálculo
z3 <- qnorm(1 - (1 - confianza3)/2)
error3 <- z3 * sigma3 / sqrt(n3)
lim_inf3 <- xbar3 - error3
lim_sup3 <- xbar3 + error3
cat("Nivel de confianza: 95% → Z =",z3,"\n")
## Nivel de confianza: 95% → Z = 1.959964
cat("Error estándar:",(sigma3/sqrt(n3)),"\n")
## Error estándar: 5.59017
cat("Margen de error:",error3,"\n")
## Margen de error: 10.95653
cat("Intervalo de confianza: (",lim_inf3,",",lim_sup3,")\n")
## Intervalo de confianza: ( 1003.043 , 1024.957 )
cat("Interpretación: Tenemos un 95% de confianza en que la duración promedio poblacional para todos los focos está entre",lim_inf3, "y" ,lim_sup3,".")
## Interpretación: Tenemos un 95% de confianza en que la duración promedio poblacional para todos los focos está entre 1003.043 y 1024.957 .

Fórmula para los ejercicios 4 y 5:

\(n = \left( \frac{z \cdot \sigma}{E} \right)^2\)

Ejercicio 4:

La prueba Weschler de CI se diseñó para que la media sea 100 y la desviación estándar sea 15, para la población de adultos normales. Calcule el tamaño de la muestra necesario para estimar la media de la puntuación de CI de estudiantes de estadística. Queremos tener un nivel de confianza del 95% de que nuestra media muestral está dentro de dos puntos de CI de la media real. La media para esta población es claramente mayor que 100. La desviación estándar para esta población es probablemente menor a 15, porque éste es un grupo con menor variación que un grupo seleccionado al azar de la población general; por lo tanto, si usamos σ = 15, estamos siendo conservadores al emplear un valor que hará que el tamaño de la muestra sea al menos tan grande como se necesite. Suponga entonces que σ = 15 y determine el tamaño de muestra que se requiere.

Confianza = 95%, E = 2, σ = 15

# Datos
confianza4 <- 0.95
E4 <- 2
sigma4 <- 15

# Cálculo
z4 <- qnorm(1 - (1 - confianza4)/2)
n4 <- ceiling((z4 * sigma4 / E4)^2)
cat("Nivel de confianza: 95% → Z =",z4,"\n")
## Nivel de confianza: 95% → Z = 1.959964
cat("Tamaño muestral requerido:",n4,"\n")
## Tamaño muestral requerido: 217
cat("Interpretación: El tamaño de la muestra debe ser de al menos",n4,"para tener un 95% de confianza en que la media muestral esté dentro de 2 puntos de CI de la media real.")
## Interpretación: El tamaño de la muestra debe ser de al menos 217 para tener un 95% de confianza en que la media muestral esté dentro de 2 puntos de CI de la media real.

Ejemplo 5:

La Tyco Video Game Corporation encontró que está perdiendo ingresos por las fichas que se usan en sus juegos de video. Las máquinas deben ajustarse para aceptar monedas sólo si caen entre límites que se fijaron desde antes. Para ajustar estos límites, debe estimarse la media del peso de monedas de un cuarto de dólar en circulación. Una muestra de monedas de un cuarto de dólar se pesará para determinar la media. ¿Cuántas monedas de un cuarto de dólar hay que seleccionar al azar y pesar si queremos tener un nivel de confianza del 99% de que la media muestral está dentro de 0.025 g de la media de la población real, para todas las monedas de un cuarto de dólar? Se sabe que la desviación estándar de la población de monedas es 0.068 g.

Confianza = 99%, E = 0.025 g, σ = 0.068 g

# Datos
confianza5 <- 0.99
E5 <- 0.025
sigma5 <- 0.068

# Cálculo
z5 <- qnorm(1 - (1 - confianza5)/2)
n5 <- ceiling((z5 * sigma5 / E5)^2)
cat("Nivel de confianza: 99% → Z =",z5,"\n")
## Nivel de confianza: 99% → Z = 2.575829
cat("Tamaño muestral requerido:",n5,"\n")
## Tamaño muestral requerido: 50
cat("Interpretación: Se necesitan al menos",n5,"monedas para tener un 99% de confianza en que la media muestral esté dentro de 0.025 g del peso promedio real.")
## Interpretación: Se necesitan al menos 50 monedas para tener un 99% de confianza en que la media muestral esté dentro de 0.025 g del peso promedio real.

Ejemplo 6:

En una encuesta de Gallup, que se realizó entre 491 adultos seleccionados al azar, se les preguntó si estaban a favor de la pena de muerte para una persona convicta por homicidio; el 65% de ellos dijeron que estaban a favor. Calcule un estimado de intervalo de confianza del 95% de adultos que están a favor de la pena de muerte.

# Datos
n6 <- 491
p6 <- 0.65
confianza6 <- 0.95

# Cálculos
z6 <- qnorm(1 - (1 - confianza6)/2)
SE6 <- sqrt(p6 * (1 - p6) / n6)
ME6 <- z6 * SE6
lim_inf6 <- p6 - ME6
lim_sup6 <- p6 + ME6
cat("Tamaño muestral: n =",n6,"\n")
## Tamaño muestral: n = 491
cat("Proporción de la muestra: p̂ =",p6,"\n")
## Proporción de la muestra: p̂ = 0.65
cat("Nivel de confianza: 95% → Z =",z6,"\n")
## Nivel de confianza: 95% → Z = 1.959964
cat("Error estándar:=",SE6,"\n")
## Error estándar:= 0.02152534
cat("Margen de error:",ME6,"\n")
## Margen de error: 0.04218888
cat("Intervalo de confianza del 95%: (",lim_inf6,",",lim_sup6,")\n")
## Intervalo de confianza del 95%: ( 0.6078111 , 0.6921889 )
cat("Interpretación: Tenemos un 95% de confianza en que la verdadera proporción de adultos que están a favor de la pena de muerte está entre el",round(lim_inf6*100,2),"% y el" ,round(lim_sup6*100,2),"%.")
## Interpretación: Tenemos un 95% de confianza en que la verdadera proporción de adultos que están a favor de la pena de muerte está entre el 60.78 % y el 69.22 %.

Ejercicio 7:

En una encuesta de 1002 personas, 701 dijeron que votaron en una elección presidencial reciente (según datos del ICR Research Group). Los registros de votos mostraron que el 61% de las personas con derecho a voto realmente votaron. Calcule un estimado del intervalo de confianza del 99% de la proporción de personas que dijeron que votaron. ¿Son consistentes los resultados de encuesta con los votos reales del 61%? ¿Por qué?

# Datos
n7 <- 1002
p7 <- 701 / n7  # Proporción de personas que dijeron que votaron
confianza7 <- 0.99

# Cálculos
z7 <- qnorm(1 - (1 - confianza7)/2)
SE7 <- sqrt(p7 * (1 - p7) / n7)
ME7 <- z7 * SE7
lim_inf7 <- p7 - ME7
lim_sup7 <- p7 + ME7
cat("Tamaño muestral: n =", n7, "\n")
## Tamaño muestral: n = 1002
cat("Proporción de la muestra: p̂ =", p7, "\n")
## Proporción de la muestra: p̂ = 0.6996008
cat("Nivel de confianza: 99% → Z =", z7, "\n")
## Nivel de confianza: 99% → Z = 2.575829
cat("Error estándar:=", SE7, "\n")
## Error estándar:= 0.0144824
cat("Margen de error:", ME7, "\n")
## Margen de error: 0.0373042
cat("Intervalo de confianza del 99%: (", lim_inf7, ",", lim_sup7, ")\n")
## Intervalo de confianza del 99%: ( 0.6622966 , 0.736905 )
cat("Interpretación: Tenemos un 99% de confianza en que la verdadera proporción de personas que votaron está entre el", round(lim_inf7 * 100, 2), "% y el", round(lim_sup7 * 100, 2), "%.\n")
## Interpretación: Tenemos un 99% de confianza en que la verdadera proporción de personas que votaron está entre el 66.23 % y el 73.69 %.
cat("Es por esto que no son consistentes los resultados de encuesta con los votos reales del 61%. ")
## Es por esto que no son consistentes los resultados de encuesta con los votos reales del 61%.

Ejercicio 8:

Un estudio sobre las heridas de caza, y el uso de ropa naranja “de cazador”, mostró que entre 123 cazadores heridos cuando fueron confundidos con presas, seis usaban ropa naranja. Entre 1115 cazadores seleccionados aleatoriamente, 811 reportaron que habitualmente usan ropa color naranja. Los datos son de los Centers for Disease Control.

  1. Construya un estimado del intervalo de confianza del 95%, del porcentaje de cazadores heridos que usaban ropa naranja.
# Datos
n1 <- 123  # Cazadores heridos
x1 <- 6    # Cazadores heridos con ropa naranja
p1 <- x1 / n1
z1 <- qnorm(1 - 0.05 / 2)  # Z para 95% de confianza
SE1 <- sqrt(p1 * (1 - p1) / n1)  # Error estándar
ME1 <- z1 * SE1  # Margen de error
lim_inf1 <- p1 - ME1  # Límite inferior
lim_sup1 <- p1 + ME1  # Límite superior
cat("Intervalo de confianza del 95% para cazadores heridos con ropa naranja: (",lim_inf1, ",",lim_sup1,")\n")
## Intervalo de confianza del 95% para cazadores heridos con ropa naranja: ( 0.01071258 , 0.08684839 )
cat("En porcentaje: (",round(lim_inf1 * 100, 2), "%, ", round(lim_sup1 * 100, 2), "%)\n")
## En porcentaje: ( 1.07 %,  8.68 %)
  1. Construya un estimado del intervalo de confianza del 95%, del porcentaje de cazadores que usan ropa naranja habitualmente.
# Datos
n2 <- 1115 # Cazadores seleccionados aleatoriamente
x2 <- 811  # Cazadores con ropa naranja habitualmente

# Cálculos para el intervalo de confianza de cazadores con ropa naranja habitualmente
p2 <- x2 / n2
SE2 <- sqrt(p2 * (1 - p2) / n2)  # Error estándar
ME2 <- z1 * SE2  # Margen de error
lim_inf2 <- p2 - ME2  # Límite inferior
lim_sup2 <- p2 + ME2  # Límite superior
cat("Intervalo de confianza del 95% para cazadores heridos con ropa naranja: (",lim_inf1, ",",lim_sup1,")\n")
## Intervalo de confianza del 95% para cazadores heridos con ropa naranja: ( 0.01071258 , 0.08684839 )
cat("En porcentaje: (",round(lim_inf1 * 100, 2), "%, ", round(lim_sup1 * 100, 2), "%)\n")
## En porcentaje: ( 1.07 %,  8.68 %)
  1. ¿Indican estos resultados que es menos probable que a un cazador que usa ropa naranja lo hieran por confundirse con una presa? ¿Por qué?
cat("Si el intervalo de confianza para los cazadores heridos con ropa naranja es mucho menor que el intervalo para los cazadores que usan ropa naranja habitualmente, entonces se puede sugerir que el uso de ropa naranja reduce la probabilidad de ser herido por confusión.\n")
## Si el intervalo de confianza para los cazadores heridos con ropa naranja es mucho menor que el intervalo para los cazadores que usan ropa naranja habitualmente, entonces se puede sugerir que el uso de ropa naranja reduce la probabilidad de ser herido por confusión.

Ejemplo 9:

A usted lo contrató la Ford Motor Company para hacer investigación de mercado, por lo que debe estimar el porcentaje de hogares que poseen un vehículo. ¿Cuántos hogares debe entrevistar si desea tener una confianza del 94% de que su porcentaje muestral tiene un margen de error de tres puntos porcentuales?

  1. Suponga que un estudio previo sugiere que el 86% de los hogares poseen vehículos.
# Datos
confianza9 <- 0.94
E9 <- 0.03
p9 <- 0.86

# Cálculo tamaño muestral
z9 <- qnorm(1 - (1 - confianza4)/2)
n9 <- ceiling((z9^2 * p9 * (1 - p9)) / E9^2)
cat("Nivel de confianza: 94% → Z =",z9,"\n")
## Nivel de confianza: 94% → Z = 1.959964
cat("Margen de error: E=", E9, "\n")
## Margen de error: E= 0.03
cat("Proporción estimada: p̂ =", p9, "\n")
## Proporción estimada: p̂ = 0.86
cat("Tamaño muestral requerido: n =", n9, "\n")
## Tamaño muestral requerido: n = 514
cat("Intervalo de confianza del 99%: (", lim_inf7, ",", lim_sup7, ")\n")
## Intervalo de confianza del 99%: ( 0.6622966 , 0.736905 )
cat("Interpretación: Tenemos un 99% de confianza en que la verdadera proporción de personas que votaron está entre el", round(lim_inf7 * 100, 2), "% y el", round(lim_sup7 * 100, 2), "%.\n")
## Interpretación: Tenemos un 99% de confianza en que la verdadera proporción de personas que votaron está entre el 66.23 % y el 73.69 %.
  1. Suponga que en lugar de utilizar hogares que se seleccionaron al azar, los datos muestrales se obtienen pidiendo a los lectores del periódico Washington Post que envíen por correo un formato de encuesta. ¿De qué forma se afectan los resultados?

Al usar lectores del Washington Post que envían encuestas por correo: • Sesgo de autoselección: Solo responden personas motivadas • Sesgo de cobertura: Lectores del periódico no representan a todos los hogares • Sesgo de medición: Posible sobrestimación (quienes tienen vehículos podrían responder más) • Consecuencia: El IC del 94% ya no garantiza contener el parámetro poblacional real