1. El Secretario de Turismo de Santa Marta afirma que la cantidad media que gastan los turistas en un fin de semana es de $800.000 o menos. Un miembro del equipo de investigación de la secretaría observó que en los últimos meses habían aumentado tales cantidades. El investigador emplea una muestra de cuentas de fin de semana para probar la afirmación del secretario.
  1. ¿Qué forma de hipótesis deberá usar para probar la afirmación del secretario? Explique.

\[H_0: \mu \ ≤ 800.000\] \[H_a: \mu > 800.000\] R/: en este caso la hipótesis nula es lo que se cree desde un principio, es la afirmación inicial que se basa en análisis previos, en este caso la información que ya se tenia de la cantidad media que gastan los turistas en un fin de semana, esta es la hipótesis que quiere demostrar el investigador, la que fue postulada por el secretario. Por otro lado, la hipótesis alternativa es un valor diferente diferente al hipótetico, en este caso la alternativa es el cambio que ocurrió durante los últimos 3 meses.

  1. ¿Cuál es la conclusión apropiada cuando no se puede rechazar la hipótesis nula H0?

R/: cuando esta hipótesis no se puede rechazar, es por que el el valor p es mayor al nivel de significancia. En ese sentido, si no se pudiese rechazar la hipótesis nula sería porque la probabilidad de obtener una media muestral en la que se gasten 800.000 o menos es muy alta.

  1. ¿Cuál es la conclusión apropiada cuando se puede rechazar la hipótesis nula H0?

R/: esto se podría concluir cuando el valor p sea manor al nivel de significancia. En ese sentido, la probabilidad de obtener una media muestral en la que se gasten más de 800.000 es mas alta.

  1. El personal de ventas de un almacén vende, en promedio, $ 8 millones. Un vicepresidente de la empresa, propone un plan de compensaciones con nuevos incentivos de venta. El vicepresidente espera que los resultados de un periodo de prueba le permitirán concluir que el plan de compensaciones aumenta el promedio de ventas de los vendedores.
  1. Dé las hipótesis nula y alternativa adecuadas.

\[H_0: \mu \ ≥ 8'000.000\] \[H_a: \mu < 8'000.000\] b. En esta situación, ¿cuál es el error tipo I? ¿Qué consecuencia tiene cometer este error?

R/: este se da cuando la hipótesis nula es verdadera y a consecuencia se debe rechazar por lo postulado en la investigación. esto sucedería si se comprueba que a pesar de subir los incentivos de venta en la empresa, las ventas siguen siendo en promedio de 8 millones.

  1. En esta situación, ¿cuál es el error tipo II? ¿Qué consecuencia tiene cometer este error?

R/: Sucede cuando la hipótesis nula en falsa y a consecuencia de esto se debe aceptar. esto sucedería si se demuestra que al aumentar los incentivos de ventas por parte de la empresa, el promedio de ventas es más de 8 millones

  1. La Employment and Training Administration informó que la prestación media del seguro de desempleo es $238/semana (The World Almanac, 2003). Un investigador del estado de Virginia anticipó que datos muestrales indicarán que la prestación media semanal del seguro de desempleo en el estado de Virginia es menor que la media de todo el país.
  1. Dé las hipótesis adecuadas de manera que el rechazo de H0 favorezca la afirmación del investigador. \[H_0: \mu \ ≥238\] \[H_a: \mu < 238\]
  2. En una muestra de 100 individuos la media muestral encontrada fue $231 y la desviación estándar muestral fue $80. ¿Cuál es el valor-p?
x_barra <- 231
n <- 100
s <- 80
ee <- s/sqrt(n)
ee
## [1] 8
H_0 <- 238
t <- (x_barra - H_0)/ee
t
## [1] -0.875
valor_p <- pt(t, df = n-1)
valor_p
## [1] 0.1918459
  1. Si α = 0, 05, ¿cuál es su conclusión?

no se puede rechazar la hipótesis nula porque el valor p es mayor al nivel de significancia.

  1. Repita la prueba de hipótesis anterior usando el método del valor crítico para un nivel de confianza de 99%.
n <- 100
alpha <- 0.01
h_0 <- 238
v_critico <-  abs(qt(alpha, df =n-1))
v_critico
## [1] 2.364606
x_barra <- 231
s <- 80
ee <- s/sqrt(n)

t <- abs(x_barra - h_0)/ee
t
## [1] 0.875

R/: se puede rechazar la hipótesis nula ya que en este caso el estadístico de prueba es menor al valor crítico

  1. Caracol Noticias parece tener el liderazgo en los noticieros nacionales. Invamer Gallup indicó que en 2019 la media de la audiencia de Caracol Noticias fue de 850 mil espectadores por día. Suponga que en una muestra de 40 días durante la primera mitad de 2020, la cantidad diaria de espectadores haya sido 875.000 espectadores por día y la desviación estándar 8.200 espectadores.
  1. ¿Cuáles son las hipótesis si el director de Noticias Caracol desea información sobre cualquier cambio en la cantidad de espectadores de su noticiero? \[H_0: \mu \ ≤ 850000\] \[H_a: \mu > 850000\]
  2. ¿Cuál es el valor-p?
x_barra <- 875000
n <- 40
s <- 8200
ee <- s/sqrt(n)
ee
## [1] 1296.534
H_0 <- 850000
t <- (x_barra - H_0)/ee
t
## [1] 19.28218
valor_p <- pt(t, df = n-1)
valor_p
## [1] 1
  1. Elija su propio nivel de significancia. ¿Cuál es su conclusión?

con nivel de significancia 0.05, no se rechaza la hipótesis nula ya que el valor p es mayor al nivel de significancia.

  1. Use el método del valor crítico (para el mismo nivel de significancia de la pregunta anterior) para resolver la prueba de hipótesis.
n <- 40
alpha <- 0.05
h_0 <- 850000
# Estimación del valor crítico
v_critico <- qt(alpha, df = n-1)
v_critico
## [1] -1.684875

R/: en este caso la prueba de hipótesis no se rechaza en tanto el valor t no es menor al valor crítico, el estadístico de pueba permite evidenciar que la media muestral no está muy alejada de la hipótesis nula. En ese sentido se puede concluir que esta es verdadera.

  1. ¿Qué recomendación le haría al director de Noticias Caracol en esta aplicación?

si quisiera favorrecer la hipótesis alternativa donde la cantidad de espectadores en los 40 días de 2020 es mayor a 850.000 el director de noticias debería aumentar la muestra de 40 días porque, según los resultados, la hipótesis nula no se puede rechazar.

  1. El Centro Nacional de Consultoría informa que la media en los recibos bimestrales de Cundinamarca es $ 37 mil. Algunos servicios de agua son operados por empresas de servicio público, mientras que otros sistemas de agua son operados por empresas privadas. Un economista indica que la privatización no nivela la competencia y que el poder monopólico dado a las empresas públicas se está transfiriendo ahora a las empresas privadas. El problema es que los usuarios acaban pagando tasas más altas por el agua suministrada por las empresas privadas. El sistema de agua de Caparrapí es operado por una empresa privada. En una muestra de 64 usuarios de Caparrapí, la cantidad media bimestral pagada por el agua fue $43 mil y la desviación estándar fue $12 mil. Empleando α = 0, 05 ¿la muestra favorece la conclusión de que esta empresa privada que suministra el agua tiene tasas promedio mayores? Resuelva la prueba usando el método del valor p y el método del valor crítico, en este último caso, para un nivel de significancia de α = 0, 01.
x_barra <- 43000
n <- 64
s <- 12000
ee <- s/sqrt(n)
ee
## [1] 1500
H_0 <- 37000
t <- (x_barra - H_0)/ee
t
## [1] 4
valor_p <- pt(t, df = n-1)
valor_p
## [1] 0.9999155
n <- 64
alpha <- 0.01
h_0 <- 37000
# Estimación del valor crítico
v_critico <- qt(alpha, df = n-1)
v_critico
## [1] -2.387008
  1. En un estudio se encontró que en 2015, 12.5% de los trabajadores colombianos pertenecían a un sindicato. El caso es que en 2016 se tomó una muestra de 400 trabajadores para ver si el esfuerzo realizado por los sindicatos por organizarse ha hecho que aumente el número de sus miembros.
  1. Formule las hipótesis que puedan ser usadas para determinar si la membresía de los sindicatos ha aumentado en 2006. \[H_0: \mu \ ≤ 0.125\] \[H_a: \mu > 0.125\]

  2. Si los resultados muestrales indican que 52 de los trabajadores pertenecen a los sindicatos, ¿cuál es el valor-p de esta prueba de hipótesis?

p_barra <- (52*100)/400
p_barra
## [1] 13
n <- 400
p_barra <- 0.13
h_0 <- 0.125
ee <- sqrt((h_0*(1-h_0))/n)
z <- (p_barra - h_0)/ee
abs (z)
## [1] 0.3023716
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.7623688
  1. Con α = 0, 05, ¿cuál es su conclusión?
  2. Con α = 0, 02 y usando el método del valor crítico, ¿cuál es su conclusión?
  1. El Instituto Nacional de Salud reportó que 70% de los adultos no hacen ejercicio con regularidad. Un investigador decide realizar un estudio para ver si esto difiere de un departamento a otro.
  1. Establezca las hipótesis nula y alternativa si la intención del investigador es identificar los estados que difieren de este 70% reportado.

\[H_0: \mu \ = 0.7\] \[H_a: \mu ≠ 0.7\] b. Con α = 0, 01, cuál es la conclusión en los departamentos siguientes:

• Cundinamarca: 252 de 350 adultos no hacen ejercicio con regularidad.

alpha <- 0.01
h_0 <- 0.7
n <- 350
p_barra <- 252/n
p_barra
## [1] 0.72
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.0244949
z <- (p_barra - h_0)/ee
z
## [1] 0.8164966
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.4142162

• Valle del Cauca: 189 de 300 adultos no hacen ejercicio con regularidad.

n <- 300
p_barra <- 189/n
p_barra
## [1] 0.63
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02645751
z <- (p_barra - h_0)/ee
z
## [1] -2.645751
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.008150972
  1. Con α = 0, 05 y usando el método del valor crítico, cuál es la conclusión en los dos casos anteriores.
qnorm(0.05/2, lower.tail = FALSE)
## [1] 1.959964

R/: el valor crítico es mayor al estadístico de prueba por tanto no se puede rechazar la hipótesis nula. Con base en la informacion de esta muestra, la proporcion de adultos que no se ejercita regularmente en Cundinamarca y el Valle del Cauca es no parecida a la proporción del 70% postulada por el investigador.

  1. En un artículo anunciado en portada, el diario El Espectador publicó información acerca de los hábitos de sueño de los colombianos. El artículo señalaba que la privación del sueño ocasiona diversos problemas, entre ellos muertes en las carreteras. Cincuenta y uno por ciento de los conductores admitió manejar sintiéndose somnoliento. Un investigador planteó la hipótesis de que este problema es aún mayor entre los trabajadores de los turnos nocturnos.
  1. Formule las hipótesis que ayuden a determinar si más de 51% de la población de trabajadores de los turnos nocturnos admiten conducir somnolientos.

\[H_0: \mu \ ≤ 0.51\] \[H_a: \mu > 0.51\] b. En una muestra de 500 trabajadores de turnos nocturnos. se identificó a quienes admitían conducir somnolientos ¿Cuál es la proporción muestral? ¿Cuál es el valor-p? c. Con α = 0, 01, ¿cuál es la conclusión?

alpha <- 0.01
h_0 <- 0.51
n <- 500
p_barra <- 255

ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02235621
z <- (p_barra - h_0)/ee
z
## [1] 11383.42
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0

R/: en este caso se puede rechazar la hipótesis nula porque elvalor p (0)es menor al nivel de significancia (0.01).

  1. Con α = 0, 05 y usando el método del valor crítico, ¿cuál es la conclusión?
qnorm(0.05, lower.tail = FALSE)
## [1] 1.644854

R/: en este caso se puede rechazar la hipótesis nula ya que el valor del estadístico de proeba z es mayor al valor crítico.

  1. El Ministerio de Transporte informa sobre la cantidad de kilómetros que recorren en automóvil los habitantes de las 23 principales áreas metropolitanas de ese país. Suponga que en una muestra aleatoria simple de 50 habitantes de Bucaramanga, la media es 36 kilómetros por día y la desviación estándar es 13.44 kilómetros por día y que en una muestra aleatoria simple independiente de 40 habitantes de Barranquilla la media es 29.76 kilómetros por día y la desviación estándar es 11.84 kilómetros por día.
  1. ¿Cuál es la estimación puntual de la diferencia entre la media de los kilómetros por día que recorre un habitante de Bucaramanga y la media de las kilómetros por día que recorre un habitante de Barranquilla?

Diferencia de las medias Bucaramanga y Barranquilla

x_barra1 <- 36
x_barra2 <- 29.76

d_barra <- x_barra1 - x_barra2
d_barra
## [1] 6.24

Bucaramanga1 y barranquilla2

s1 <- 13.44 
x_barra1 <- 36
n1 <- 50

s2 <- 11.84
x_barra2 <- 29.76
n2 <- 40
alpha <- 0.05
gl <- function(s1, n1,s2, n2){
  ((s1^2/n1 + s2^2/n2)^2)/
  ((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
  }
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)

me <- t*ee
me
## [1] 5.302475
  1. Dé un intervalo de confianza de 95% para la diferencia entre las dos medias poblacionales.
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1]  0.9375245 11.5424755

R/: con un nivel de confianza del 95%, la diferencia en la media poblacional de estos dos grupos se va a encontrar entre 0.9375245 y 11.5424755.

  1. Realice una prueba de hipótesis sobre la diferencia en estas medias, tomando como hipótesis nula que no hay diferencia en esas medias, e hipótesis alternativa que si existe alguna diferencia. Realice la prueba a un nivel de confianza del 99%.

\[H_0: \mu \ = 0\] \[H_a: \mu ≠ 0\]

h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 2.33898
valor_p <- pt(t, df = grados, lower.tail = FALSE)* 2
valor_p
## [1] 0.02162427

en este caso el valor p es menor al nivel de significancia por tanto rechazo la hipótesis nula de que la diferencia entre las dos medias es cero.

con nivel de confianza del 99%

s1 <- 13.44 
x_barra1 <- 36
n1 <- 50

s2 <- 11.84
x_barra2 <- 29.76
n2 <- 40
alpha <- 0.01
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.01
t <- qt(alpha/2, df = grados, lower.tail = FALSE)

me <- t*ee
me
## [1] 7.025541
h_0 <- 0
t <- (d_barra - h_0)/ee

valor p:

alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.02162427
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1] -0.7855405 13.2655405

R/: con el presente valor p la hipótesis nula no se puede rechazar porque este valor p es mayor a alpha 0.01.

  1. 468 En las zonas costeras de Estados Unidos, Cape Cod, Outer Banks, las Carolinas y la costa del Golfo, hubo, durante los años noventa, un crecimiento relativamente rápido de la población. Los datos recolectados son sobre las personas que viven tanto en zonas costeras como en zonas no costeras de todo Estados Unidos. Suponga que se obtuvieron los resultados muestrales siguientes sobre las edades de estas dos poblaciones de personas. zona costera1 y zona no costera2
x_barra1 <- 39.3
x_barra2 <- 35.4
d_barra <- x_barra1 - x_barra2
d_barra
## [1] 3.9
s1 <- 16.8 
x_barra1 <- 39.3
n1 <- 150

s2 <- 15.2
x_barra2 <- 35.4
n2 <- 175
alpha <- 0.05
  1. Formule las hipótesis nula y alternativa.

\[H_0: \mu \ = 0\] \[H_a: \mu ≠ 0\] b. ¿Cuál es el valor del estadístico de prueba?

gl <- function(s1, n1,s2, n2){
  ((s1^2/n1 + s2^2/n2)^2)/
  ((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
  }
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)

me <- t*ee
me
## [1] 3.521133
  1. ¿Cuál es el valor-p?
alpha <- 0.05
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.05
  1. ¿A qué conclusión llega? el valor p es igual al valor del nivel de significancia

  2. Para α = 0, 01 y usando el método del valor crítico, ¿a qué conclusión llega?

alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.05
h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 2.179544
valor_critico <- qt(alpha/2, df = grados, lower.tail = FALSE)
valor_critico
## [1] 2.592125

R/: el valor del estadístico de prueba es mayor al valor crítico. En ese sentido, puedo rechazar la hipótesis nula.

  1. El consejo universitario compara las puntuaciones obtenidas en la prueba de aptitudes escolares (SAT, por sus siglas en inglés) de acuerdo con el nivel de enseñanza de los padres de los estudiantes que presentan este examen. La hipótesis de investigación es que los estudiantes cuyos padres tienen un nivel más alto de estudios obtendrán mejores puntuaciones en el SAT. En el 2018 la media general en la prueba oral fue
  2. A continuación se presentan las puntuaciones obtenidas en el examen verbal en dos muestras independientes de estudiantes. La primera muestra corresponde a las puntuaciones de estudiantes cuyos padres tienen pregrado. La segunda corresponde a las puntuaciones de estudiantes cuyos padres terminaron el bachillerato pero no tienen pregrado. Con pregrado: 485 487 534 533 650 526 554 410 550 515 572 578 497 448 592 469 Con bachillerato pero sin pregrado: 442 492 580 478 479 425 486 485 528 390 524 535
  1. Formule las hipótesis pertinentes para determinar si los datos muestrales confirman la hipótesis de que los estudiantes cuyos padres tienen un nivel de enseñanza más alto obtienen mejores puntuaciones en el SAT. \[H_0: \mu \ ≥ 507\] \[H_a: \mu < 507\]
  2. Dé la estimación puntual de la diferencia entre las medias de las dos poblaciones.
pregrado <- c (485, 487, 534, 533, 650, 526, 554, 410, 550, 515 ,572 ,578, 497, 448, 592,469)
bachillerato <- c(442, 492, 580, 478, 479, 425, 486, 485, 528, 390, 524, 535)
mean(pregrado)
## [1] 525
mean(bachillerato)
## [1] 487

estimación puntual de la diferencia de las medias

x_barra1 <- 525
x_barra2 <- 487
d_barra <- x_barra1 -x_barra2
d_barra
## [1] 38
sd(pregrado)
## [1] 59.42054
sd(bachillerato)
## [1] 51.74764
  1. Calcule el valor-p en esta prueba de hipótesis.
s1 <- 59.42 
x_barra1 <- 525
n1 <- 16

s2 <- 51.74
x_barra2 <- 487
n2 <- 12
alpha <- 0.05
gl <- function(s1, n1,s2, n2){
  ((s1^2/n1 + s2^2/n2)^2)/
  ((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
  }
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)

me <- t*ee
me
## [1] 43.35566
alpha <- 0.05
valor_p <- pt(t, df = grados, lower.tail =FALSE)
valor_p
## [1] 0.025
  1. Con α = 0, 05, ¿cuál es la conclusión?
  2. Resuelva la prueba de hipótesis usando el método del valor crítico y α = 0, 01 ¿Cuál es la conclusión?
alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)
valor_p
## [1] 0.025
h_0 <- 507
t <- abs(d_barra - h_0)/ee
t
## [1] 22.26386
valor_critico <- qt(alpha, df = grados, lower.tail = FALSE)
valor_critico
## [1] 2.482835

R/: no se puede rechazar la hipótesis nula ya que el valor del estadistico de prueba es menor al valor crítico.

  1. La Aeronaútica Civil vigila la puntualidad de la llegada de los vuelos de las 3 principales aerolíneas del país. Los vuelos que llegan con no más de 15 minutos de retraso se consideran a tiempo. Los siguientes son datos estadísticos de la entidad pertenecientes a enero de 2019 y a enero de 2020. • Enero 2019: En una muestra de 924 vuelos, 742 llegaron a tiempo. • Enero 2020: En una muestra de 842 vuelos, 714 llegaron a tiempo.
  1. Dé una estimación puntual de la proporción de vuelos que llegaron a tiempo en 2019
alpha <- 0.05
h_0 <- 0.83
n <- 924
p_barra <- 742/n
p_barra
## [1] 0.8030303
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01235741
z <- abs(p_barra - h_0)/ee
z
## [1] 2.182471
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0.01453738
  1. Suministre una estimación puntual de la proporción de vuelos que llegaron a tiempo en 2020.
alpha <- 0.05
h_0 <- 0.847
n <- 847
p_barra <- 714/n
p_barra
## [1] 0.8429752
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01236932
z <- abs(p_barra - h_0)/ee
z
## [1] 0.3253853
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0.3724448
  1. Sea p1 la proporción poblacional de los vuelos que llegaron a tiempo en 2019 y p2 la proporción poblacional de los vuelos que llegaron a tiempo en 2020. Plantee las hipótesis a probar para determinar si la puntualidad de las principales líneas aéreas mejoró en este periodo de un año.

tendria que hacer algo con las 2 p o sumarlas???’? d. Si α = 0, 05, ¿cuál es su conclusión? e. Usando el método del valor crítico y α = 0, 01, ¿cuál es su conclusión?

  1. Una empresa grande de seguros de automóviles toma muestras de personas del sexo masculino, asegurados por la empresa, casados y solteros y determina cuántos hicieron uso del seguro en los tres años anteriores. De 400 asegurados solteros, 76 usaron el seguro, mientras que de 900 asegurados casados, 90 usaron el seguro.
  1. Use α = 0, 05. Haga una prueba para determinar si la razón de reclamaciones es diferente entre asegurados solteros y casados.

solteros

alpha <- 0.05
h_0 <- 0.19
n <- 400
p_barra1 <- 76/n
p_barra1
## [1] 0.19
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01961505
z <- abs(p_barra1 - h_0)/ee
z
## [1] 0
valor_p1 <- pnorm(abs(z), lower.tail = FALSE)
valor_p1
## [1] 0.5

casados

alpha <- 0.05
h_0 <- 0.10
n <- 900
p_barra2 <- 90/n
p_barra2
## [1] 0.1
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01
z <- abs(p_barra2 - h_0)/ee
z
## [1] 0
valor_p2 <- pnorm(abs(z), lower.tail = FALSE)
valor_p2
## [1] 0.5
  1. Dé un intervalo de 95% de confianza para la diferencia entre las proporciones de las dos poblaciones.
d_barra <- p_barra1- p_barra2
d_barra
## [1] 0.09
h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 9
me <- t*ee
me
## [1] 0.09
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1] 0.00 0.18
  1. Se realizaron pruebas médicas para probar la resistencia a medicamentos contra la tuberculosis. En La Guajira, de 142 casos, 9 fueron resistentes a los medicamentos. En Chocó, de 268 casos, 5 fueron resistentes a los medicamentos. ¿Estos datos indican que existe una diferencia estadísticamente significativa entre la proporción de casos resistentes a los medicamentos en estos dos departamentos? Use 0,02 como nivel de significancia. ¿Cuál es el valor-p y cuál es la conclusión a la que se llega? Usando 0,05 como nivel de significancia y el método de valor crítico, ¿A qué conclusión se llega?
alpha <- 0.02
h_0 <- 0.0633
n <- 142
p_barra1 <- 9/n
p_barra1
## [1] 0.06338028
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02043421
z <- abs(p_barra2 - h_0)/ee
z
## [1] 1.796007
valor_p1 <- pnorm(abs(z), lower.tail = FALSE)
valor_p1
## [1] 0.03624667
n <- 268
p_barra2 <- 5/n
p_barra2
## [1] 0.01865672
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01487424
z <- abs(p_barra2 - h_0)/ee
z
## [1] 3.001383
valor_p2 <- pnorm(abs(z), lower.tail = FALSE)
valor_p2
## [1] 0.001343782

diferencia de las proporciones

d_barra <- valor_p1 - valor_p2
d_barra
## [1] 0.03490289

no hay diferencia entre las proporciones de las personas que son resistentes a los medicamentos.