1 Ejercicios sobre pruebas de hipótesis

1.1 Prueba de hipótesis para una media con muestras grandes

El organismo a cargo de garantizar la calidad del agua en cierto poblado decide tomar una muestra de \(n=40\) precipitaciones. En cada una precipitación se mide el pH y obtiene un promedio de \(\bar{x}=3.7\), con una desviación estándar de \(s=0.5\). Las hipótesis serán (prueba unilateral izquierda):

\[\begin{align} H_{0}: \mu \geq 5.7 \\ H_{1}: \mu < 5.7 \end{align}\]

De modo que la regla de decisión es:

Si \(\frac{\bar{x}-\mu_{0}}{\frac{\sigma}{\sqrt{n}}} \leq -Z_{\alpha}\), se rechaza \(H_{0}\)

Si \(\frac{\bar{x}-\mu_{0}}{\frac{\sigma}{\sqrt{n}}} > -Z_{\alpha}\), no se rechaza \(H_{0}\)

Utilizado la información brindada en el ejemplo, entonces: \(Z = \frac{3.7 - 5.7}{\frac{0.5}{\sqrt{40}}} = -25.298\). El valor de Z relacionado al nivel de significancia (punto umbral) es \(-1.645\).

El código utilizado para obtener dicho valor del estadístico es el siguiente:

ene<-40
hachecero<-5.7
equibarra<-3.7
des_estan<-0.5
alfa<-0.05

zeta_pru<-(equibarra-hachecero)/(des_estan/sqrt(ene))
zeta_pru
## [1] -25.29822

Mediante el siguiente código se compara el valor del estadístico de prueba con el valor “umbral” (\(Z_{\alpha}\)):

if( zeta_pru < (-qnorm(alfa,lower.tail = FALSE) )){"Rechazar Ho"}else{"No rechazar Ho"}
## [1] "Rechazar Ho"

Y comparando el p-valor contra el valor de significancia (regla de oro):

if(pnorm(zeta_pru)<alfa){"Rechazar Ho"}else{"No rechazar Ho"}
## [1] "Rechazar Ho"

1.2 Pruebas de hipótesis para proporciones (muestras grandes)

Una fundación que tiene por objetivo la prevención del cáncer, decide llevar a cabo una campaña de lucha contra el consumo de tabaco, ya que se este hábito se considera como uno de los principales factores de riesgo para desarrollar cáncer de pulmón. Se conoce por investigaciones ya realizadas que el 20% de la población mayor de 15 años fuma.

Después de efectuar una fuerte campaña radial y televisiva durante seis meses, se decide estudiar si la población adulta de la región ha disminuido el hábito de fumar.

Para ello, se selecciona una muestra aleatoria de 1000 personas adultas a las que se les aplica un cuestionario. Una de las preguntas del cuestionario utilizado estaba referida a si la persona fuma o no.

Una vez resumida la información proporcionada por el trabajo de campo, se observó que el 12% de las personas encuestadas fumaba habitualmente.

La Fundación decide poner a prueba la hipótesis estadística de que la campaña publicitaria había disminuido la cantidad de fumadores.

Las hipótesis postuladas fueron:

\[\begin{align} H_{0} P \geq 0.20 \\ H_{1} P < 0.20 \end{align}\]

Ya hemos dicho, al hablar de la estimación del parámetro poblacional P, que cuando n (el tamaño de la muestra) es grande, la variable aleatoria proporción muestral \(\bar{P}\) se distribuye Normalmente con esperanza igual a P y desviación estándar igual \(P*Q/n\), de modo que al estandarizar se tiene: \(\frac{\bar{P}-P_{0}}{\sqrt{P_{0}*Q_{0}/n}}\sim Z\)

La región de rechazo es como se muestra a continuación:

La regla de decisión de la hipótesis nula establecida es:

Rechazar \(H_{0}\) con un nivel \(\alpha\) de significancia si:

\(\frac{\bar{p}-P_{0}}{\sqrt{P_{0}*Q_{0}/n}} \leq -Z_{\alpha}\)

Mientras que no se rechaza \(H_{0}\) si: \(\frac{\bar{p}-P_{0}}{\sqrt{P_{0}*Q_{0}/n}} > -Z_{\alpha}\)

Si el investigador fija un \(\alpha = 0.05\), \(Z_{0.05}\) será igual a 1.645.

El valor del estadístico \(Z\) se obtiende de la siguiente manera:

proporci_cero<-0.20
ene<-1000
propo_obser<-0.12

estad_zeta<-(propo_obser-proporci_cero)/
  (sqrt(proporci_cero*(1-proporci_cero)/ene))

Utilizando el valor-p y el nivel de significancia \(\alpha\), se tiene:

if((1-pnorm(estad_zeta,lower.tail = FALSE))<alfa){"Rechazar Ho"}else{"No rechazar Ho"}
## [1] "Rechazar Ho"

Y utilizando los valores del estadístico Z y el valor crítico, se obtiene:

if(estad_zeta<-qnorm(0.05,lower.tail = FALSE)){"Rechazar Ho"}else{"No rechazar Ho"}
## [1] "Rechazar Ho"

1.3 Pruebas de hipótesis para razón de varianzas

Vamos a probar la igualdad de las varianzas poblacionales en nuestro ejemplo de las vacas lecheras. Consideramos un valor \(\alpha=0.05\). \(s_{A}^{2}=2.4\) y \(s_{B}^{2}=4.1\)

\(\frac{s_{B}^{2}}{s_{A}^{2}}\) = \(\frac{4.1}{2.4}\) = 1.71

Como los dos grupos de vacas en estudio tienen el mismo tamaño, entonces:

\(n_{a}-1 = n_{b}-1=10-1=9\)

El valor del estadístico \(F_{0.025,9,9}\) se obtiene mediante las siguientes instrucciones:

ese_a2<-2.4
ese_be2<-4.1
enes<-10

efex<-ese_be2/ese_a2

Comparando el p-valor con el nivel si significancia:

if(pf(efex,enes-1,enes-1,lower.tail = FALSE)<alfa){"Rechazar Ho"}else{"No rechazar Ho"}
## [1] "No rechazar Ho"

Comparando el valor de la prueba F con el valor crítico:

val_probF<-qf((alfa/2),enes-1,enes-1,lower.tail = FALSE)

if(efex<val_probF){"No rechazar Ho"}else{"Rechazar Ho"}
## [1] "No rechazar Ho"

Las varianzas son iguales.