Cuando se requiere saber si las proporciones de éxitos de dos poblaciones (\(P_{1}\) y \(P_{2}\)) son iguales o no, por ejemplo, la proporción de artículos defectuosos de la máquina 1 (\(P_{1}\)) y la proporción de artículos defectuosos de la máquina 2 (\(P_{2}\)), se construirá un intervalo de confianza para la diferencia de éstas proporciones como sigue:
o de manera breve
Ejemplo 1. Se quiere saber si la proporción de mujeres zurdas en ITSON (\(P_{1}\)) difiere o no de la proporción de hombres zurdos en ITSON (\(P_{2}\)).
Para poder responder a ese cuestionamiento deben seleccionarse muestras aleatorias de hombres y mujeres. Suponga que se seleccionaron 200 hombres y 220 mujeres de los cuales 20 hombres y 23 mujeres resultaron ser zurdos.
Hay un 10.45% de mujeres zurdas en la muestra:
\(\hat{p}_{1} = \frac{x_{1}}{n_{1}} = \frac{23}{220} = 0.1045\)
e1p1 <- 23/220
e1p1
[1] 0.1045455
y un 10% de hombres zurdos en la muestra:
\(\hat{p}_{2} = \frac{x_{2}}{n_{2}} = \frac{20}{220} = 0.10\)
e1p2 <- 20/200
e1p2
[1] 0.1
En este caso si se establece la confianza en 95% el valor de z será 1.96.
Primero, el límite inferior del intervalo:
e1li <- (e1p1 - e1p2) - 1.96 * sqrt((e1p1*(1 - e1p1))/220 + (e1p2*(1 - e1p2))/200)
e1li
[1] -0.05344955
y un 10% de hombres zurdos en la muestra:
e1ls <- (e1p1 - e1p2) + 1.96 * sqrt((e1p1*(1 - e1p1))/220 + (e1p2*(1 - e1p2))/200)
e1ls
[1] 0.06254046
El intervalo va de -0.054 a 0.062 o de -5.4% hasta 6.2%. Note que el 0 (cero) esta contenido en el intervalo, por lo que se puede decir que:
Al 95% de confianza, la proporción de mujeres zurdas y la proporción de hombres zurdos de ITSON es la misma.
Note que la conclusión fue hecha considerando a la población
Ejemplo 2. La porporción de votantes a favor del candidato A es mayor que la proporción de votantes del candidato B? Use 95% de confianza para responder.
Suponga que en una muestra de 1000 personas, 340 dijeron que votarían por A. En otra muestra de 1000 personas 450 dijeron que votarían por B.
Si etiquetamos a la primera muestra como 1 (es indiferente cuál es 1 o 2). Hay un 34% de la muestra que votaría por A:
\(\hat{p}_{1} = \frac{x_{1}}{n_{1}} = \frac{340}{1000} = 0.34\)
e2p1 <- 340/1000
e2p1
[1] 0.34
y un 45% de la muestra 2 votaría por B:
\(\hat{p}_{2} = \frac{x_{2}}{n_{2}} = \frac{450}{1000} = 0.45\)
e2p2 <- 450/1000
e2p2
[1] 0.45
En este caso si se establece la confianza en 95% el valor de z será 1.96.
Primero, el límite inferior del intervalo
e2li <- (e2p1 - e2p2) - 1.96 * sqrt((e2p1*(1 - e2p1))/1000 + (e2p2*(1 - e2p2))/1000)
e2li
[1] -0.1525776
Ahora el límite superior:
e2ls <- (e2p1 - e2p2) + 1.96 * sqrt((e2p1*(1 - e2p1))/1000 + (e2p2*(1 - e2p2))/1000)
e2ls
[1] -0.06742241
El intervalo va de -0.153 a -0.067 o de -15.3% hasta -6.7%. Note que el 0 (cero) NO esta contenido en el intervalo y que los dos límites son negativos, por lo que se puede decir que:
Al 95% de confianza, la proporción que votará por A es menor que la proporción de votantes de B.
¿Qué tan mas pequeña?, pues de 6.7% a 15.3% más pequeña.
Si las etiquetas 1 y 2 se cambiaran, los dos intervalos serían positivos y eso nos llevaría a la misma conclusión, la proporción de votantes a favor de B es mayor (de 6.7% a 15.3%) que la que está a favor de A.
1. En una muestra de 100 pacientes sometidos a un cierto tratamiento (A) se obtienen 80 curaciones y en otra muestra de 100 pacientes sometidos a otro tratamiento (B) se obtienen 90 curaciones.
# P1 = 100 pacientes sometidos (n) al Tratamiento A con 80 curaciones (x)
tp1 <- 80/100
tp1
[1] 0.8
# P2 = 100 pacientes sometidos (n) al Tratamiento B con 90 curaciones (x)
tp2 <- 90/100
tp2
[1] 0.9
El tratamiento A tiene un 80% de éxito, Mientras que, el tratamiento B tiene un 90% de éxito.
Debido a que la confianza es del 95% el valor de \(Z_{α/2}\) es de 1.96
# Límite Inferior
tli <- (tp1 - tp2) - 1.96 * sqrt((tp1*(1 - tp1))/100 + (tp2*(1-tp2))/100 )
tli
[1] -0.198
# li En porcentaje
tlipor <- tli*100
tlipor
[1] -19.8
# Límite Superior
tls <- (tp1 - tp2) + 1.96 * sqrt((tp1*(1 - tp1))/100 + (tp2*(1-tp2))/100 )
tls
[1] -0.002
# ls En porcentaje
tlspor <- tls*100
tlspor
[1] -0.2
2. En una muestra de 400 pilas tipo B fabricadas por una empresa, se encontraron 21 defectuosas. Mientras que de 500 pilas tipo C 10 fueron defectuosos. Estime con un intervalo del 99% de confianza la diferencia de proporciones de pilas defectuosas y diga en cuál tipo hay más proporción de pilas defectuosos.
# P1 = 400 pilas tipo B fabricadas (n) se encuentran 21 defectuosas (x)
pp1 <-21/400
pp1
[1] 0.0525
# P2 = 500 pilas tipo C fabricadas (n) se encuentran 10 defectuosas (x)
pp2 <- 10/500
pp2
[1] 0.02
De la población de pilas tipo B un 5.25% salieron defectuosas, mientras que, de la de pilas tipo C solo el 2% lo son.
Como el nivel de confianza es de 99% el valor de \(Z_{α/2}\) es igual a 2.58.
# Límite Inferior
pli <- (pp1 - pp2) - 2.58 * sqrt((pp1*(1 - pp1))/400 + (pp2*(1 - pp2))/500)
pli
[1] -0.0004957061
# li En porcentaje
plipor <- pli * 100
plipor
[1] -0.04957061
# Límite Superior
pls <- (pp1 - pp2) + 2.58 * sqrt((pp1*(1 - pp1))/400 + (pp2*(1 - pp2))/500)
pls
[1] 0.06549571
# ls En porcentaje
plspor <- pls * 100
plspor
[1] 6.549571
3. En Ciudad Obregón de 250 personas entrevistadas, 100 leen el periodico habitualmente y en Hermosillo 98 de 240 leen el periodico. Al 90% de confianza en que ciudad la proporción de personas que lee el periodico es mayor?.
## P1 = 100 personas que leen habitualmente el periódico habitualmente en Ciudad obregón (x) de las 250 entrevistadas (n)
cp1 <- 100/250
cp1
[1] 0.4
# P2 = De las 240 personas entrevistadas en Hermosillo (n) 98 de ellas leen el periódico habitualmente
cp2 <- 98/240
cp2
[1] 0.4083333
El número de personas que leen el periódico en Ciudad Obregón corresponde al 40% de los entrevistados, mientras que, en Hermosillo las personas que leen habitualmente el periódico es el 40.83%
el nivel de confianza es del 90%,por lo que, \(Z_{ α/2}\) es igual a 1.65
# Límite Inferior
cli <- (cp1 - cp2) - 1.65 * sqrt((cp1*(1 - cp1))/250 + (cp2*(1 - cp2))/240)
cli
[1] -0.08150586
# li En porcentaje
clipor <- cli * 100
clipor
[1] -8.150586
# Límite Superior
cls <- (cp1 - cp2) + 1.65 * sqrt((cp1*(1 - cp1))/250 + (cp2*(1 - cp2))/240)
cls
[1] 0.06483919
# ls En porcentaje
clspor <- cls * 100
clspor
[1] 6.483919
………… Melanie Icedo Félix …………