#Estimación por intervalos:

library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.0.4
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.0.6     v dplyr   1.0.4
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## Warning: package 'ggplot2' was built under R version 4.0.4
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
  1. En una muestra aleatoria simple de 50 artículos de una población en la que σ = 6 la media muestral fue 32.
  1. Proporcione un intervalo de confianza de 90% para la media poblacional.
x_barra <- 32
sigma <- 6
n <-  50
ee <- sigma/sqrt(n)
z_90 <- 1.64
me_90 <- z_90*ee

lb_90 <- x_barra - me_90
la_90 <- x_barra + me_90

intervalo_90 <- c(lb_90, la_90)
intervalo_90
## [1] 30.60841 33.39159
  1. Establezca un intervalo de confianza de 95% para la media poblacional.
x_barra <- 32
sigma <- 6
n <-  50
ee <- sigma/sqrt(n)
z_95 <- 1.96
me_95 <- z_95*ee

lb_95 <- x_barra - me_95
la_95 <- x_barra + me_95

intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 30.33688 33.66312
  1. Proporcione un intervalo de confianza de 99% para la media poblacional.
x_barra <- 32
sigma <- 6
n <-  50
ee <- sigma/sqrt(n)
z_99 <- 2.58
me_99 <- z_99*ee

lb_99 <- x_barra - me_99
la_99 <- x_barra + me_99

intervalo_99 <- c(lb_99, la_99)
intervalo_99
## [1] 29.8108 34.1892
  1. Una importante revista reportó que el ingreso familiar mensual medio de sus suscriptores es 3’500.000. Suponga que la estimación del ingreso familiar anual medio está basada en una muestra de 80 familias y que por datos de estudios anteriores la desviación estándar poblacional es conocida y es σ = 875.000.
  1. Desarrolle un intervalo de estimación de 90% de confianza para la media poblacional.
x_barra <- 3500000
sigma <- 875000
n <-  80
ee <- sigma/sqrt(n)
z_90 <- 1.64
me_90 <- z_90*ee

lb_90 <- x_barra - me_90
la_90 <- x_barra + me_90

intervalo_90 <- c(lb_90, la_90)
intervalo_90
## [1] 3339562 3660438
  1. Dé un intervalo de estimación de 95% de confianza para la media poblacional.
z_95 <- 1.96
me_95 <- z_95*ee

lb_95 <- x_barra - me_95
la_95 <- x_barra + me_95

intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 3308257 3691743
  1. Dé un intervalo de estimación de 99% de confianza para la media poblacional.
z_99 <- 2.58
me_99 <- z_99*ee

lb_99 <- x_barra - me_99
la_99 <- x_barra + me_99

intervalo_99 <- c(lb_99, la_99)
intervalo_99
## [1] 3247604 3752396
  1. ¿Qué le pasa a la amplitud del intervalo de confianza a medida que el nivel de confianza aumenta? ¿Parece esto razonable? Explique. R/: Se evidencia que a medida que aumenta el nivel de confianza, el intervalo de confainza aumenta. lo anterior parece razonable en la medida en que a mayor confianza, la amplitud del intervalo es mayor, lo que permite una mayor probabilidad de acierto.
  1. Para la media poblacional se dio el siguiente intervalo de confianza de 95%, de 152 a
  2. Si σ = 15 , ¿cuál es el tamaño de la muestra que se usó en este estudio?
intervalo_95 <- c(152, 160)
me <- 4
sigma <- 15
alpha <- 1-0.95

z_0.025 <- qnorm(alpha/2 , lower.tail = FALSE)

n <- (z_0.025^2 * sigma ^ 2/ me ^2)
n
## [1] 54.02051
  1. En la distribución t con 16 grados de libertad, encuentre el área, o la probabilidad, de cada una de las regiones siguientes:
  1. A la derecha de 2.120
pt(2.120, df = 16 , lower.tail = FALSE)
## [1] 0.02499546
  1. A la izquierda de 1.337
pt(q = 1.337, df = 16)
## [1] 0.9000388
  1. A la izquierda de -1.746
pt(q = -1.746, df = 16)
## [1] 0.04998962
  1. A la derecha de 2.583
pt(q = 2.583, df = 16)
## [1] 0.9899901
  1. Entre -2.120 y 2.120
pt(2.120, df = 16 , lower.tail = FALSE)- pt(q = -2.120, df = 16)
## [1] 0
  1. Entre -1.746 y 1.746
pt(1.746, df = 16 , lower.tail = FALSE)- pt(q = -1.746, df = 16)
## [1] 0
  1. Encuentre los valores de t para las situaciones siguientes.
  1. Un área de 0.025 en la cola superior, con 12 grados de libertad
qt(0.025, df = 12, lower.tail = FALSE)
## [1] 2.178813
  1. Un área de 0.05 en la cola inferior, con 50 grados de libertad
qt(0.05 , 50)
## [1] -1.675905
  1. Un área de 0.01 en la cola superior, con 30 grados de libertad
qt(0.01, df = 30, lower.tail = FALSE)
## [1] 2.457262
  1. Entre los que queda 90% del área, con 25 grados de libertad
qt(0.9, df = 30, lower.tail = FALSE )
## [1] -1.310415
  1. Entre los que queda 95% del área, con 45 grados de libertad
qt(0.95, df = 40, lower.tail = FALSE )
## [1] -1.683851
  1. Los datos muestrales siguientes provienen de una población normal: 10, 8, 12, 15, 13,11, 6,
  1. ¿Cuál es la estimación puntual de la media poblacional?
población <- c(10, 8, 12, 15, 13,11, 6, 5)
n <- length(población)
n
## [1] 8
mean(población)
## [1] 10
  1. ¿Cuál es la estimación puntual de la desviación estándar poblacional?
sd(población)
## [1] 3.464102
sd (población)
## [1] 3.464102
  1. Con 95% de confianza, ¿cuál es el margen de error para la estimación de la media poblacional?
alpha <- 1-0.95
Z_ <- 0.05/2
s <- 22.67647
ee <- 2.666667
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee
ME
## [1] 6.305665
  1. ¿Cuál es el intervalo de confianza de 95% para la media poblacional? Interprete el intervalo.
lb_95 <- x_barra-ME
la_95 <- x_barra+ME
intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 3499994 3500006
  1. En una muestra aleatoria simple con n = 54 la media muestral fue 22.5 y la desviación estándar muestral 4.4.
  1. Encuentre e interprete un intervalo de confianza de 90% para la media poblacional.
x_barra <- 22.5
s <- 4.4
n <- 54
ee <- s/sqrt(n)
alpha <- 1-0.90
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee
ME
## [1] 1.002401
lb_90 <- x_barra-ME
la_90 <- x_barra+ME
intervalo_90 <- c(lb_90, la_90)
intervalo_90
## [1] 21.4976 23.5024

con un nivel de confianza del 90%, la media poblacional se encuentra entre dichos intervalos. b. Dé e interprete un intervalo de confianza de 95% para la media poblacional.

x_barra <- 32
s <- 6
n <- 50
ee <- s/sqrt(n)
alpha <- 1-0.95
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee
ME
## [1] 1.705181
lb_95 <- x_barra-ME
la_95 <- x_barra+ME
intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 30.29482 33.70518

para un inntervalo de confianza del 95%, la media poblacional se encuentra entre dichos intervalos. c. Dé e interprete un intervalo de confianza de 99% para la media poblacional.

x_barra <- 32
s <- 6
n <- 50
ee <- s/sqrt(n)
alpha <- 1-0.99
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee
ME
## [1] 2.274015
lb_99 <- x_barra-ME
la_99 <- x_barra+ME
intervalo_99 <- c(lb_99, la_99)
intervalo_99
## [1] 29.72599 34.27401

para un nivel de confianza del 99%, la media poblacional se encuentra entre dichos intervalos. d. ¿Qué pasa con el margen de error y con el intervalo de confianza a medida que aumenta el nivel de confianza? al aumentar el nivel de confianza se disminuye la probabilidad de cometer un error. Sin embargo, el margen de error no disminuye, por el contrario este aumenta y a su vez el intervalo de confianza.

  1. Los agentes de un call center de una EPS encargado de agendar los turnos para las vacunas contra el Covid 19, presentan un informe semanal que enumera los usuarios de la EPS contactados durante la semana. En una muestra de 30 informes semanales la media muestral es 19,5 usuarios por semana. La desviación estándar de esta muestra es 5,2. Dé intervalos de confianza de 90% y 95% para la media poblacional del número de usuarios contactados semanalmente por los agentes.
  1. intervalo de confianza del 90%
x_barra <- 19.5
s <- 5.2
n <- 30
ee <- s/sqrt(n)
alpha <- 1-0.90
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee


lb_90 <- x_barra-ME
la_90 <- x_barra+ME
intervalo_90 <- c(lb_90, la_90)
intervalo_90
## [1] 17.88687 21.11313
  1. intervalo de confianza del 95%
x_barra <- 19.5
s <- 5.2
n <- 30
ee <- s/sqrt(n)
alpha <- 1-0.95
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee


lb_95 <- x_barra-ME
la_95 <- x_barra+ME
intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 17.55829 21.44171
  1. La Aeronáutica Civil realiza encuestas entre los viajeros de negocios en las que se califica la calidad de los aeropuertos internacionales. La calificación máxima es 10. Se seleccionó una muestra aleatoria simple de viajeros de negocios y a cada uno se le pidió su calificación para el Aeropuerto El Dorado en Bogotá D.C. Las calificaciones que dieron estos viajeros fueron las que se muestran a continuación. 6 4 6 8 7 7 6 3 3 8 10 4 8 7 8 7 5 9 5 8 4 3 8 5 5 4 4 4 8 4 5 6 2 5 9 9 8 4 8 9 9 5 9 7 8 3 10 8 9 6 Calcule e interprete el intervalo de confianza de 95%, 98% y 99% para la media poblacional de las calificaciones del aeropuerto.Repita
calificacion <- c(6, 4, 6, 8, 7, 7, 6, 3, 3, 8, 10, 4, 8, 7, 8, 7, 5, 9,5, 8, 4, 3, 8, 5, 5, 4, 4, 4, 8, 4, 5, 6, 2)
n <- length(calificacion)
n
## [1] 33

media muestral

mean(calificacion)
## [1] 5.787879

desviación

sd(calificacion)
## [1] 2.027276
  1. intervalo del 95%
x_barra <- 5.787879
s <- 2.027276
n <- 33
ee <- s/sqrt(n)
alpha <- 1-0.95
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee


lb_95 <- x_barra-ME
la_95 <- x_barra+ME
intervalo_95 <- c(lb_95, la_95)
intervalo_95
## [1] 5.069038 6.506720
  1. intervalo del 98%
x_barra <- 5.787879
s <- 2.027276
n <- 33
ee <- s/sqrt(n)
alpha <- 1-0.98
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee


lb_98 <- x_barra-ME
la_98 <- x_barra+ME
intervalo_98 <- c(lb_98, la_98)
intervalo_98
## [1] 4.923732 6.652026
  1. intervalo del 99%
x_barra <- 5.787879
s <- 2.027276
n <- 33
ee <- s/sqrt(n)
alpha <- 1-0.99
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee


lb_99 <- x_barra-ME
la_99 <- x_barra+ME
intervalo_99 <- c(lb_99, la_99)
intervalo_99
## [1] 4.821459 6.754299
  1. ¿Qué tan grande debe seleccionarse una muestra para tener un intervalo de confianza de 95% con un margen de error de 10? Suponga que la desviación estándar poblacional es 40. (Revise la sección 8.3 si es necesario.)
ME <- 10
sigma <- 40
alpha <- 1-0.95
Z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (Z_0.025 ^2 * sigma ^2)/ME^2
n
## [1] 61.46334
  1. Los salarios anuales iniciales de estudiantes que acaban de terminar una un proceso de formación en el SENA se espera que estén entre $900.000 y $1’350.000. Suponga que quiere dar un intervalo de confianza de 95% para estimar la media poblacional de los salarios iniciales. ¿Cuál es el valor planeado de la desviación estándar poblacional? ¿Cuán grande deberá ser la muestra si quiere que el margen de error sea
  1. ¿$100.000?
  2. ¿$50.000?
  3. ¿$10.000?
  4. ¿Recomendaría usted tratar de tener $10.000 como margen de error? (Revise la sección 8.3 si es necesario.)
x = c (1350000, 900000)
range(x)
## [1]  900000 1350000
ME <- 100000
sigma <- 
alpha <- 1-0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (Z_0.025 ^2 * sigma ^2)/ME^2
n
## [1] 9.603647e-13
  1. En una muestra aleatoria simple de 400 individuos, 100 de las respuestas fueron Sí.
  1. Dé la estimación puntual de la proporción poblacional de individuos cuya respuesta será Sí.
Si <- 100
n <- 400

p_barra <- Si/n 
p_barra 
## [1] 0.25
  1. Dé la estimación del error estándar de la proporción σp¯.
ee <- sqrt(p_barra*(1-p_barra)/n)
ee
## [1] 0.02165064
  1. Calcule e interprete el intervalo de confianza de 95% para la proporción poblacional.
alpha <- 1-0.95
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME
## [1] 0.04243447
lb <- p_barra - ME
la <- p_barra + ME
intervalo <- c(lb,la)
intervalo 
## [1] 0.2075655 0.2924345

R/: para un nivel de confianza del 95%, la media poblacional se encuentra entre dichos intervalos. d. Calcule e interprete el intervalo de confianza de 99% para la proporción poblacional. (Revise la sección 8.4 si es necesario.)

alpha <- 1-0.99
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME
## [1] 0.05576834
lb <- p_barra - ME
la <- p_barra + ME
intervalo  <- c(lb,la)
intervalo
## [1] 0.1942317 0.3057683
  1. Una encuesta realizada por USA Today/CNN/Gallup durante la campaña presidencial tomó en junio una muestra de 491 votantes potenciales. El objetivo de esta encuesta era estimar la proporción de votantes potenciales a favor de cada candidato. Suponga que el valor planeado es p∗ = 0, 50 con un nivel de confianza de 95%.
  1. Si p∗ = 0, 50. ¿Cuál fue el margen de error planeado en la encuesta de junio?
p_barra <- 0.50
n <- 491

ee <- sqrt(p_barra*(1-p_barra)/n)
ee
## [1] 0.02256468
  1. Al acercarse la elección de noviembre se busca una mejor precisión y un menor margen de error. Suponga que los márgenes de error que se piden son los que se muestran en la tabla siguiente. Calcule el tamaño de muestra que se recomienda para cada estudio.

Septiembre 0,04 Octubre 0,03 Comienzo de noviembre 0,02 Un día antes de la elección 0,01

Septiembre:

p_barra <- 0.50
ME <- 0.04
alpha <- 1- 0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n
## [1] 600.2279

Octubre:

p_barra <- 0.50
ME <- 0.03
alpha <- 1- 0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n
## [1] 1067.072

comienzo de nobiembre:

p_barra <- 0.50
ME <- 0.02
alpha <- 1- 0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n
## [1] 2400.912

un día antes de la elección

p_barra <- 0.50
ME <- 0.01
alpha <- 1- 0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n
## [1] 9603.647
  1. Phoenix Wealth Management/Harris realizó un estudio con 1500 individuos cuyo patrimonio era de un millón o más de dólares, obtuvo diversos estadísticos sobre la gente rica. Los tres años anteriores habían sido malos para el mercado de acciones, lo que motivó algunas de las preguntas realizadas.
  1. En este estudio se encontró que 53% de los encuestados perdió 25% o más del valor de su portafolio en los últimos tres años. Dé e interprete un intervalo de confianza de 95% para la proporción de gente rica que perdió 25% o más del valor de su portafolio en los últimos tres años.
p_barra <- 0.53
n <- 1500
ee <- sqrt((p_barra)*(1-p_barra)/n)
ee
## [1] 0.01288669
alpha <- 1-0.95
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME
## [1] 0.02525744
lb <- p_barra - ME
la <- p_barra + ME
intervalo <- c(lb, la)
intervalo
## [1] 0.5047426 0.5552574

R/: para un nivel de confianza del 95%, la media poblacional se encuentra entre dichos intervalos

  1. El estudio indicó que 31% de los encuestados siente que deberá ahorrar más para su retiro para compensar lo perdido. Dé e interprete un intervalo de confianza de 95% para la proporción poblacional.
p_barra <- 0.31
n <- 1500
ee <- sqrt((p_barra)*(1-p_barra)/n)
ee
## [1] 0.01194152
alpha <- 1-0.95
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME
## [1] 0.02340496
lb <- p_barra - ME
la <- p_barra + ME
intervalo <- c(lb, la)
intervalo
## [1] 0.286595 0.333405

R/: para un nivel de confianza, la proporción poblacional que sienten que deberán ahorrar para recuperar lo perdido se encuentra entre dichos intervalos.

  1. 5% de los encuestados hicieron una donación de $25 000 o más para obras de caridad el año anterior. Dé e interprete un intervalo de confianza de 95% para la proporción de quienes hicieron una donación de $25 000 o más para obras de caridad.
p_barra <- 0.05
n <- 1500
ee <- sqrt((p_barra)*(1-p_barra)/n)
ee
## [1] 0.005627314
alpha <- 1-0.95
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME
## [1] 0.01102933
lb <- p_barra - ME
la <- p_barra + ME
intervalo <- c(lb, la)
intervalo
## [1] 0.03897067 0.06102933

R/: para un nivel de confianza del 95%, la proporción poblacional que realizó la donación se encuentra entre los intervalos calculados anteriormente.

  1. Compare los márgenes de error de las estimaciones por intervalo de los incisos a, b y c. ¿Cuál es la relación entre margen de error y p¯? Si usa la misma muestra para obtener varias proporciones, ¿cuál de las proporciones debe usarse para estimar el valor planeado p∗? ¿Por qué considera que en estos casos suela usarse p∗ = 0.50?

R/: entre mayor sea la proporción elegida, el margen de error va a ser mayor. En ese sentido, se recomiendo usar la proporción del punto A en la medida en que se encuentra más cercano a 0.50.