1 Prueba de hipotesis para dos grupos

1.1 Varianzas desconocidas, supuestas iguales

1.1.1 Bilateral

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) \neq D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{s\sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} < -t_{n_{1} + n_{2}-2,\alpha/2}\) o \(t_{obs} > t_{n_{1} + n_{2}-2,\alpha/2}\)

Ejercicio 1. En una muestra aleatoria de 125 servidores públicos, el número medio de cambios de empleo durante su vida laboral fue 1.91 y la desviación estándar muestral fue 1.32. En otra muestra aleatoria de 92 empleados del sector privado, el número medio de cambios de empleo fue 3.21 y la desviación típica muestral es 0.53. Contraste la hipótesis nula de que las medias poblacionales son iguales frente a la hipótesis alternativa de que el número medio de cambios de empleo de los empleados privados es diferente que en el de los servidores públicos.

Solución

  • Identificar los valores y crear sus respectivas variables
# Identificar los valores y crear sus respectivas variables
x_barra_1 = 1.91
x_barra_2 = 3.21
s_1 = 1.32
s_2 = 0.53
n_1 = 125
n_2 = 92
D_0 = 0
s = sqrt(((n_1 -1)*s_1^2 + (n_2 -1)*s_2^2)/(n_1 + n_2 -2))

# Ingresar alpha  
alfa = 0.05
alfa_2 = alfa/2  
t_alfa_2_I = qt(df = n_1+n_2 - 2,p = alfa_2)
t_alfa_2_D = abs( qt(df = n_1+n_2 - 2,p = alfa_2))

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((1/n_1 + 1/n_2)))

# Definir la región de rechazo
r = t_obs < t_alfa_2_I | t_obs > t_alfa_2_D

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "Se rechaza la hipótesis nula"

1.1.2 Unilateral Izquierda

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) < D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{s\sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} < -t_{n_{1} + n_{2}-2,\alpha}\)

Ejercicio 2. En una muestra aleatoria de 125 servidores públicos, el número medio de cambios de empleo durante su vida laboral fue 1.91 y la desviación estándar muestral fue 1.32. En otra muestra aleatoria de 92 empleados del sector privado, el número medio de cambios de empleo fue 3.21 y la desviación típica muestral es 0.53. Contraste la hipótesis nula de que las medias poblacionales son iguales frente a la hipótesis alternativa de que el número medio de cambios de empleo de los empleados privados es menor que en el de los servidores públicos.

Solución

# Identificar los valores y crear sus respectivas variables 
x_barra_1 = 1.91
x_barra_2 = 3.21
s_1 = 1.32
s_2 = 0.53
n_1 = 125
n_2 = 92
D_0 = 0
s = sqrt(((n_1 -1)*s_1^2 + (n_2 -1)*s_2^2)/(n_1 + n_2 -2))

# Ingresar alpha  
alfa = 0.05
t_alfa_I = qt(df = n_1+n_2 - 2,p = alfa)

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((1/n_1 + 1/n_2)))

# Definir la región de rechazo
r = t_obs < t_alfa_I 

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "Se rechaza la hipótesis nula"

1.1.3 Unilateral Derecha

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) > D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{s\sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} > t_{n_{1} + n_{2}-2,\alpha}\)

Ejercicio 2. En una muestra aleatoria de 125 servidores públicos, el número medio de cambios de empleo durante su vida laboral fue 1.91 y la desviación estándar muestral fue 1.32. En otra muestra aleatoria de 92 empleados del sector privado, el número medio de cambios de empleo fue 3.21 y la desviación típica muestral es 0.53. Contraste la hipótesis nula de que las medias poblacionales son iguales frente a la hipótesis alternativa de que el número medio de cambios de empleo de los empleados privados es mayor que en el de los servidores públicos.

Solución

  • Identificar los valores y crear sus respectivas variables
# Identificar los valores y crear sus respectivas variables 
x_barra_1 = 1.91
x_barra_2 = 3.21
s_1 = 1.32
s_2 = 0.53
n_1 = 125
n_2 = 92
D_0 = 0
s = sqrt(((n_1 -1)*s_1^2 + (n_2 -1)*s_2^2)/(n_1 + n_2 -2))

# Ingresar alpha  
alfa = 0.05
t_alfa_D = abs(qt(df = n_1+n_2 - 2,p = alfa))

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((1/n_1 + 1/n_2)))

# Definir la región de rechazo
r = t_obs > t_alfa_D 

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "No se rechaza la hipótesis nula"

1.2 Varianzas desconocidas, supuestas distintas

1.2.1 Bilateral

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) \neq D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} < -t_{g,\alpha/2}\) o \(t_{obs} > t_{g,\alpha/2}\)

Ejercicio 1. Para los tres primeros meses del año, 15 vendedores de la Costa tuvieron ventas semanales promedio de 300 dólares con una desviación estándar de 50 dólares; en tanto, 10 vendedores de la Sierra tuvieron ventas semanales promedio de 260 dólares, con una desviación estándar de 16 dólares. Si consideramos que las desviaciones estándar de las ventas son diferentes, determine si los vendedores de la Costa tienen igual ventas semanales.

Solución

  • Identificar los valores y crear sus respectivas variables
# Identificar los valores y crear sus respectivas variables
x_barra_1 = 300
x_barra_2 = 260
s_1 = 50
s_2 = 16
n_1 = 15
n_2 = 10
D_0 = 0
# Ingresar alpha  
alfa = 0.05
alfa_2 = alfa/2
aux_1 = (s_1^2/n_1 + s_2^2/n_2)^2
aux_2 = (s_1^2/n_1)^2 / (n_1 - 1) + (s_2^2/n_2)^2 / (n_2 - 1)
g = ceiling(aux_1/aux_2)
t_alfa_2_I = qt(df = g,p = alfa_2)
t_alfa_2_D = abs( qt(df = g,p = alfa_2))

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((s_1^2/n_1 + s_2^2/n_2)))

# Definir la región de rechazo
r = t_obs < t_alfa_2_I | t_obs > t_alfa_2_D

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "Se rechaza la hipótesis nula"

1.2.2 Unilateral Izquierda

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) < D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} < -t_{g,\alpha}\)

Ejercicio 2. Para los tres primeros meses del año, 15 vendedores de la Costa tuvieron ventas semanales promedio de 300 dólares con una desviación estándar de 50 dólares; en tanto, 10 vendedores de la Sierra tuvieron ventas semanales promedio de 260 dólares, con una desviación estándar de 16 dólares. Si consideramos que las desviaciones estándar de las ventas son diferentes, determine si los vendedores de la Costa tienen menores ventas semanales.

Solución

  • Identificar los valores y crear sus respectivas variables
# Identificar los valores y crear sus respectivas variables
x_barra_1 = 300
x_barra_2 = 260
s_1 = 50
s_2 = 16
n_1 = 15
n_2 = 10
D_0 = 0
# Ingresar alpha  
alfa = 0.05
aux_1 = (s_1^2/n_1 + s_2^2/n_2)^2
aux_2 = (s_1^2/n_1)^2 / (n_1 - 1) + (s_2^2/n_2)^2 / (n_2 - 1)
g = ceiling(aux_1/aux_2)
t_alfa_I = qt(df = g,p = alfa)

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((s_1^2/n_1 + s_2^2/n_2)))

# Definir la región de rechazo
r = t_obs < t_alfa_I 

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "No se rechaza la hipótesis nula"

1.2.3 Unilateral Derecha

Hipótesis Nula: \(H_{0}: (\mu_{1} - \mu_{2}) = D_{0}\)
Hipótesis Alternativa: \(H_{1}: (\mu_{1} - \mu_{2}) > D_{0}\)
Estadístico de Prueba: \(t_{obs} = \frac{(\overline{x}_{1}- \overline{x}_{2}) - D_{0}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}\)
Región de Rechazo. \(t_{obs} > t_{g,\alpha}\)

Ejercicio 2. Para los tres primeros meses del año, 15 vendedores de la Costa tuvieron ventas semanales promedio de 300 dólares con una desviación estándar de 50 dólares; en tanto, 10 vendedores de la Sierra tuvieron ventas semanales promedio de 260 dólares, con una desviación estándar de 16 dólares. Si consideramos que las desviaciones estándar de las ventas son diferentes, determine si los vendedores de la Costa tienen mayores ventas semanales.

Solución

  • Identificar los valores y crear sus respectivas variables
x_barra_1 = 300
x_barra_2 = 260
s_1 = 50
s_2 = 16
n_1 = 15
n_2 = 10
D_0 = 0
# Ingresar alpha  
alfa = 0.05
aux_1 = (s_1^2/n_1 + s_2^2/n_2)^2
aux_2 = (s_1^2/n_1)^2 / (n_1 - 1) + (s_2^2/n_2)^2 / (n_2 - 1)
g = ceiling(aux_1/aux_2)
t_alfa_D = abs(qt(df = g,p = alfa))

# Definir el valor de t_obs 
t_obs = ((x_barra_1 - x_barra_2) - D_0)/(s*sqrt((s_1^2/n_1 + s_2^2/n_2)))

# Definir la región de rechazo
r = t_obs > t_alfa_D 

# Decisión 
ifelse(r, "Se rechaza la hipótesis nula", 
          "No se rechaza la hipótesis nula")
## [1] "Se rechaza la hipótesis nula"