Parcial 2 María Natalia Torres

Gallup indica que Gustavo Petro ganaría las elecciones presidenciales de 2021 en primera vuelta con un porcentaje de votos de 38,3%. Suponga que el margen de error a un nivel de confianza de 95% de la encuesta es del 5%. Con un nivel de confianza de 95%, ¿entre qué valores se encontraría el porcentaje de votos que obtendría Gustavo Petro en la población?

p_barra <- 0.383
ME <- 0.05
alpha <- 0.05
Z <- qnorm(alpha/2, lower.tail = FALSE)
lb <- p_barra - ME
la <- p_barra + ME
intervalo <- c(lb,la)
intervalo

## [1] 0.333 0.433

En un estudio con una muestra de 64 familias, se encontró que en promedio estas familias gastaban mensualmente $525.000 en bienes esenciales. La desviación muestral fue de $75.000.

Dé e interprete el intervalo de confianza a un nivel de confianza del 95% para la media poblacional del gasto mensual en bienes esenciales de las familias. Un economista experto le dice que la media poblacional del gasto mensual en bienes esenciales en Colombia es de $675,000. Con base en el intervalo encontrado en el punto anterior, ¿podría o no podría rechazar la hipótesis del investigador? a.

x_barra <- 525000
s <- 75000
n <- 64
ee <- s/sqrt(n)
alpha <- 1-0.95
t_0.05 <- qt(alpha/2, df = n-1, lower.tail = FALSE)
ME <- t_0.05*ee
ME

## [1] 18734.44

lb_95 <- x_barra-ME
la_95 <- x_barra+ME
intervalo_95 <- c(lb_95, la_95)
intervalo_95

## [1] 506265.6 543734.4

R/: para un nivel de confianza del 95%, la media poblacional se encuentra entre los intervalos de 506265.6 y 543734.4 b.

x_barra <- 525000
n <- 64
s <- 75000
ee <- s/sqrt(n)
H_0 <- 675000

t <- (x_barra - H_0)/ee
t

## [1] -16

valor_p <- pt(t, df = n-1)
valor_p

## [1] 3.593214e-24

R/: se rechaza la hipótesis del investigardor ya que según el intervalo de confianza, el gasto mensual para bienes en una familia se encuentra entre $506.265,6 y $543.734,4. en ese sentido no es correcta la hipótesis del investigador. 3. El Ministerio de Salud publica anualmente un reporte sobre el porcentaje de personas de 18 años o más que fuma. Asuma que en un nuevo estudio para recoger datos sobre los fumadores y no fumadores se usa como estimación preliminar de la proporción que fuma, 0,15. a. ¿De qué tamaño deberá tomarse la muestra para estimar la proporción de fumadores con un margen de error de 0,02? Use 95% de confianza.

p_barra <- 0.15
ME <- 0.02
alpha <- 1- 0.95
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n

## [1] 1224.465

b. Si el margen de error tolerable fuera mayor a  0,02, ¿se requeriría una muestra más o menos grande? ¿Por qué?
R/: se puede ver que cuando aumenta el nivel de confianza, disminuyye la probabilidad de cometer un error. sin embargo, esto no quiere decir que el margen de error disminuya, por el contrario este aumenta. en ese sentido, el tamaño de la muestra depende del margen de error, la desviación estándar y el nivel de confianza. si el margen de error fuera mayor, se requeriría de una muestra más pequeña para que exista mas probabilidad de que la media poblacional de encuentre entre los intervalos de confianza.
c. Si se quisiera usar un mayor nivel de confianza (por ejemplo 99%), ¿se requeriría una muestra más o menos grande? ¿Por qué?

p_barra <- 0.15
ME <- 0.02
alpha <- 1- 0.99
z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (z_0.025^2* p_barra*(1- p_barra)/ ME^2 )
n

## [1] 2114.873

R/: ya que el ME permanece constante y lo único que cambia es el nivel de confianza, el tamaño de las muestra es más grande a la arrojada con un nivel de confianza del 95%. al aumentar el nivel de confaanza, los intervalos son más grandes y ya que el ME es el mismo nos arroja que la muestra es mucho más grande para cumplir con la amplitud de los intervalo. sin embargo, esto no es necesario porque al aumnetar el tamaño de la muestra hay más probabilidad de que la media poblacional se encuentre entre los intervalos de confianz, pero si aumentamos los intervalos de confianza no es necesario aumentar el tamaño de la población.

La Secretaría de Educación de Bogotá informa que 45% de los estudiantes universitarios en la ciudad trabaja para pagar sus estudios y su sustento. Suponga que se empleó una muestra de 550 estudiantes universitarios en ese estudio.

Dé un intervalo de confianza de 95% para la proporción poblacional de estudiantes que trabajan para mantenerse y pagar sus estudios.

Trabaja <- 248
n <- 550

p_barra <- Trabaja/n 
p_barra

## [1] 0.4509091

ee <- sqrt(p_barra*(1-p_barra)/n)
ee

## [1] 0.02121706

alpha <- 1-0.95
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME

## [1] 0.04158468

lb <- p_barra - ME
la <- p_barra + ME
intervalo  <- c(lb,la)
intervalo

## [1] 0.4093244 0.4924938

Dé un intervalo de confianza de 99% para la proporción poblacional de estudiantes que trabajan para mantenerse y pagar sus estudios. ¿Qué ocurre con el margen de error cuando el nivel de confianza aumenta de 95% a 99%?

alpha <- 1-0.99
z <- qnorm(alpha/2, lower.tail = FALSE)

ME <- z*ee
ME

## [1] 0.05465153

lb <- p_barra - ME
la <- p_barra + ME
intervalo  <- c(lb,la)
intervalo

## [1] 0.3962576 0.5055606

R/: al aumentar el nivel de confianza, el margen de error tambien aumenta.

El Ministerio del Medio Ambiente se encuentra haciendo pruebas de rendimiento de gasolina con un determinado modelo de automóvil, con el fin de establecer algunos límites a los importadores y fabricantes de carros.

Si se quiere dar un intervalo de confianza de 98% con un margen de error de 2 kilómetros por galón, ¿cuántos automóviles deberán usarse? Suponga que por pruebas anteriores se sabe que la desviación estándar del rendimiento es 5,2 kilómetros por galón.

ME <- 2
sigma <- 5.2
alpha <- 1-0.98
Z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (Z_0.025 ^2 * sigma ^2)/ME^2
n

## [1] 36.58441

b.Si el margen de error tolerable fuera menor a 2 kilómetros por galón, ¿se requeriría una muestra más o menos grande? ¿Por qué?

ME <- 3
sigma <- 5.2
alpha <- 1-0.98
Z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (Z_0.025 ^2 * sigma ^2)/ME^2
n

## [1] 16.25974

R/: el margen de error y el tamaño de la muestra son inversamente proporcionales, entre mayor sea el margen de error, el tamaño de la muestra va a ser menor. lo anterior es porque en tre mayor sea el margen de error, se evidencia una mayor desviación de los resultados por lo que a pesar de que esto nos arroje que n es menor se debería considerar aumentar el tamaño de la muestra con el fin de reducir el margen de error. c. Si se quisiera usar un mayor nivel de confianza (por ejemplo 99%), ¿se requeríría una muestra más o menos grande? ¿Por qué?

ME <- 2
sigma <- 5.2
alpha <- 1-0.99
Z_0.025 <- qnorm(alpha/2, lower.tail = FALSE)
n <- (Z_0.025 ^2 * sigma ^2)/ME^2
n

## [1] 44.8519

R/: cuanto mas alto es o se desea el nivel de confianza, mayor deberá ser el tamaño de la muestra, ya que se espera que exista mayor precisión y que los intervalos de confianza cubran a la mayor población posible.