Prueba de Independencia

1._Queremos probar si la selección de cierto deporte es independiente del género. Para ellos se les pregunto a 100 hombres y 100 mujeres que deporte entre arquería, boxeo y ciclismo preferian practicar y en la siguiente tabla se resume las respuestas que dieron:
\[\begin{array}{|c ||c |c |c|c|} \hline \mbox{Género} & \mbox{Arquería}&\mbox{Boxeo} &\mbox{Ciclismo}& \mbox{Total} \\ \hline \mbox{Mujer} & 35 & 15 & 50&\textbf{100}\\ \hline \mbox{Varon}& 10 & 30 &60&\textbf{100}\\ \hline \mbox{Total}&\textbf{45}&\textbf{45}&\textbf{110}&\textbf{200}\\ \hline \end{array}\]
¿Con una α del 5% podría decir que la efectividad (medida con los punatjes) de ambos métodos es similar?

La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La preferencia del tipo de deporte es independiente al género de la población}\] \[vs\] \[\textbf{H}_α: \ \mbox{La preferencia del tipo de deporte no es independiente al género de la población}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados = matrix(nrow = 2,ncol = 3)
for (i in 1:2) {
  for (j in 1:3) {
    Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 3)
for (i in 1:2) {
  for (j in 1:3) {
    Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T =sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T =", T),quote = FALSE)
## [1] Estadístico T =  19.7979797979798

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\] Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,2)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ", cuantil),quote=FALSE)
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test
## 
## data:  datos[-1]
## X-squared = 19.798, df = 2, p-value = 5.023e-05
## [1] 5.022539e-05

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ",cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar $H_0$",quote = FALSE)
 print(c("Estadístico T1 = ", T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ",cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
 }
## [1] Se rechaza H_0
## [1] Estadístico T =  19.7979797979798
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798                                
## [1] p-value  =          5.0225389158538e-05

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que la preferencia del tipo de deporte no es independiente al tipo de género de la población.

2._En un estudio, llevado a cabo por el INE, se tomó una muestra aleatoria de ciudadanos registrados en el Padrón Electoral. Se obtuvo información sobre el partido por el que votaron para Presidente y si tenían o no estudios universitarios.

\[\begin{array}{|c|c c c c c c c|} \hline X_{2}&X_{1}&&&&&&\\ \hline SI & PRI & PRI & PRI & PRI & PRI & PRI & PRI\\ NO & PRI & PRI & PRI & PRI & PRI & PRI & PRI\\ \hline SI & PRI & PAN & PAN & PAN & PAN & PAN &PAN\\ NO & PRI & PAN & PAN & PAN & PAN & PAN & PAN\\ \hline SI & PAN & PAN & PAN & PAN & PAN & PAN & PAN\\ NO & PAN & PAN & PAN & PAN & PAN & PAN&\\ \hline \end{array}\]

Considere \(X_1\)= Partido por el cual votó, \(X_2\) =tiene o no estudios universitarios.

Se desea probar si existe asociación entre el partido por el cual votó y si tienen o no estudios universitarios. Plantee, en el contexto del problema, las hipótesis, estadística de prueba y obtenga su conclusión con un nivel de significancia del 5%

La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La preferencia del partido político es independiente si los ciudadanos tienen o no estudios universitarios}\] \[vs\] \[\textbf{H}_α: \ \mbox{La preferencia del partido político no es independiente si los ciudadanos tienen o no estudios universitarios}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 2)
for (i in 1:2) {
  for (j in 1:2) {
    Esperados[i,j] =(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 2)
for (i in 1:2) {
  for (j in 1:2) {
    Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T=sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =    0.0156190476190474

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,1)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 3.84145882069412

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  datos[-1]
## X-squared = 0, df = 1, p-value = 1

Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 =   0.0156190476190474
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 3.84145882069412                               
## [1] p-value  =  1

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no se puede decir si la preferencia del partido político no es independiente si los ciudadanos tienen o no estudios universitarios.

3._En una encuesta telefónica se preguntó a los participantes hasta que grado estaban de acuerdo con la proposición: “se debe prohibir fumar en lugares públicos.” Con base en los datos recabados se desea saber si existen diferencias significativas en el grado en el que están de acuerdo hombres y mujeres con respecto a prohibir fumar en lugares públicos.
\[\begin{array}{||c |c |c |c| c | c ||} \hline \mbox{Sexo} & \mbox{Muy de acuerdo}& \mbox{De acuerdo} & \mbox{Neutral} & \mbox{En desacuerdo} & \mbox{En total desacuerdo}\\ \hline \mbox{Mujer} & 41 & 16 & 28 & 27 & 31\\ \hline \mbox{Varon} & 22 & 40 & 14 & 39 & 41 \\ \hline \end{array}\]

La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{El grado de estar de acuerdo con la proposición es independiente al género de la población}\] \[vs\] \[\textbf{H}_α: \ \mbox{El grado de estar de acuerdo con la proposición no es independiente al género de la población}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 5)
for (i in 1:2) {
  for (j in 1:5) {
    Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 5)
for (i in 1:2) {
  for (j in 1:5) {
    Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T =sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =  23.7328930539158

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,4)
print(c("Cuantil Ji-cuadrado con 4 grados de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 4 grados de libertad  = 
## [2] 9.48772903678115

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test
## 
## data:  datos[-1]
## X-squared = 23.733, df = 4, p-value = 9.035e-05

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 4 grados de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 4 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T1 =  23.7328930539158 
## [1] Cuantil Ji-cuadrado con 4 grados de libertad  = 
## [2] 9.48772903678115                                
## [1] p-value  =           9.03496288719341e-05

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que podemos decir que el grado de estar de acuerdo con la proposición no es independiente al género de la población.

Tablas de Contingecia de r×c

1._ ¿Qué tan bueno es el servicio que dan las líneas aéreas a sus clientes? En un estudio las evaluaciones dadas por los clientes fueron las siguientes: 3 excelente, 28 bueno, 45 aceptable y 24 malo (BusinessWeek, 11 de septiembre de 2000). En otro estudio sobre las empresas de servicio telefónico, en una muestra de 400 adultos las evaluaciones fueron las siguientes: 24 excelente, 124 bueno, 172 aceptable y 80 malo. ¿La distribución de las evaluaciones a las empresas telefónicas difiere de la distribución de las evaluaciones a las líneas aéreas? Emplee α =5% ¿Cuál es su conclusión?

La prueba a utilizar es Tablas de Contingencia de \(r×c\)

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La distribución de las evaluaciones a las empresas telefónicas es la misma distribución de las evaluaciones a las líneas aéreas}\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de las evaluaciones a las empresas telefónicas difiere de la distribución de las evaluaciones a las líneas aéreas}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
  for (j in 1:4) {
    Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
  for (j in 1:4) {
    Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =  2.25929277287512

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test
## 
## data:  datos[-1]
## X-squared = 2.2593, df = 3, p-value = 0.5204

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 2.25929277287512
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118                                
## [1] p-value  =        0.520364153807474

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir si la distribución de las evaluaciones a las empresas telefónicas difiere de la distribución de las evaluaciones a las líneas aéreas.

2._Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los tres distribuidores que nos sirven el producto comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el número de defectuosos para cada uno de los distribuidores.
\[\begin{array}{|c | c| c|} \hline &\mbox{Componentes Defectuosos}& \mbox{Componentes Correctos}\\ \hline \mbox{Distribuidor 1}& 16& 94 \\ \hline \mbox{ Distribuidor 2}&24&76\\ \hline \mbox{Distribuidor 3}&9&81\\ \hline \end{array}\]

La prueba a utilizar es Tablas de Contingencia de \(r×c\)

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La distribución de cada uno de los tres distribuidores es la misma.}\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de cada uno de los tres distribuidores es distinta al menos de 2 distribuidores}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 3,ncol = 2)
for (i in 1:3) {
  for (j in 1:2) {
    Esperados[i,j]=(datos_2$Totales[i]*datos_2[4,j+1])/datos_2$Totales[4]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 3,ncol = 2)
for (i in 1:3) {
  for (j in 1:2) {
    Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =  7.2001419184117

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,2)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test
## 
## data:  datos[-1]
## X-squared = 7.2001, df = 2, p-value = 0.02732

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 2 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T1 =  7.2001419184117  
## [1] Cuantil Ji-cuadrado con 2 grados de libertad  = 
## [2] 5.99146454710798                                
## [1] p-value  =         0.0273217836464356

Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que la distribución de cada uno de los tres distribuidores es distinta al menos de 2 distribuidores

3._Durante las primeras 13 semanas, se registraron las proporciones siguientes de televidentes los sábados de 8 a 9 de la noche: ABC 29%, CBS 28%, NBC 25% e independientes 18%. Dos semanas después en una muestra de 300 hogares se obtuvieron las audiencias siguientes en sábado por la noche: ABC 95 hogares, CBS 70 hogares, NBC 89 hogares e independientes 46 hogares. Use α=5% para determinar si han variado las proporciones en la audiencia de televidentes.

La prueba a utilizar es Tablas de Contingencia de \(r×c\)

Hipótesis al problema planteado

\[\textbf{H}_0: \ \mbox{La distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es la misma }\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es diferente al menos para 2 canales}\]

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]

1.Tabla con los Totales

Ahora vamos a calcular los valores esperados:

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
  for (j in 1:4) {
    Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)

#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
  for (j in 1:4) {
    Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
  }  
}
data.frame(Totales)

Por lo que nuestro estadístico de prueba es:

T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =  3.45949757559514

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(r-1)(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118

Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value

## 
##  Pearson's Chi-squared test
## 
## data:  datos[-1]
## X-squared = 3.4595, df = 3, p-value = 0.3261

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 3.45949757559514
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118                                
## [1] p-value  =        0.326053266576246

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que la distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es diferente al menos para 2 canales.

Prueba de la Mediana

1.En el campo de entrenamiento 100 reclutas son asignados aleatoriamente en cuatro regimientos con 4 diferentes sargentos. Al final del entrenamiento sólo quedarón 84 reclutas y sus tiempos en el ejercicio de obstáculos fue medido para todos ellos. Los resultados fueron, para el sargento Adams 11 de sus 20 reclutas tuvieron tiempos por arriba de la mediana, para el sargento Baker 8 de sus 22 reclutas tuvieron tiempos por arriba de la mediana, el sargento Callahan 8 de sus 20 reclutas tuvieron tiempos por encima de la mediana y del sargento Davis 15 de 22 tuvieron tiempos arriba de la mediana. Se puede decir con un nivel de significancia del 5% que existe una diferencia significativa en los tiempos en los ejercicios de obstáculos entre cada uno de los regimientos?

La prueba a utilizar Tablas de contingencia, Prueba de la mediana

Planteamineto de Hipótesis:

\[\textbf{H}_0: \ \mbox{Los cuatro regimientos con 4 diferentes sargentos tuvieron la misma mediana en el tiempo que tardaron en realizar el ejercicio de obstáculos}\] \[vs\]

\[\textbf{H}_a: \ \mbox{Los cuatro regimientos con 4 diferentes sargentos difieren con respecto al rendimiento medio(mediana), respecto al tiempo que tardaron en realizar el ejercicio de obstáculos.}\]

Observados=matrix(c(11,8,8,15,9,14,12,7), nrow = 2, ncol = 4, byrow = T)
rownames(Observados)=c('> Mediana','≤ Mediana')
colnames(Observados)=c('Sargento Adams','Sargento Baker','Sargento Callahan','Sargento Davis')
Observados
##           Sargento Adams Sargento Baker Sargento Callahan Sargento Davis
## > Mediana             11              8                 8             15
## ≤ Mediana              9             14                12              7

Ya que se tiene la tabla se le puede aplicar la prueba Ji-Cuadrada, ya que los datos son mayores a 5

T1 <- chisq.test(Observados)
T1
## 
##  Pearson's Chi-squared test
## 
## data:  Observados
## X-squared = 5.5455, df = 3, p-value = 0.1359

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\frac{N^2}{ab}*\sum^{c}_{i=1}\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\]

1.Tabla con los Totales

Ahora calculamos \(\frac{n_{i}a}{N}\)

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 1,ncol = 4)
for (i in 1:1) {
  for (j in 1:4) {
    Esperados[i,j] =(datos_2$Totales[1]*datos_2[3,j+1])/datos_2$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\)

mayor_med = c(11,8,8,15)
Totales_1 = c(20,22,20,22)
#Ahora sí, vamos a calcular el estadístico completo
Totales_2=matrix(nrow = 1,ncol = 4)
for (i in 1:1) {
  for (j in 1:4) {
    Totales_2[i,j]=((mayor_med[j]-Esperados[j])^2)/(Totales_1[j])
  }  
}
data.frame(Totales_2)

Por lo que nuestro estadístico es:

#ESTADÍSTICO DE PRUEBA

T = ((Totales[3])^2/(Totales[1]*Totales[2]))*sum(Totales_2)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T =  5.54545454545455

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", T1$p.value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 3 grados de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ",T1$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 5.54545454545455
## [1] Cuantil Ji-cuadrado con 3 grados de libertad  = 
## [2] 7.81472790325118                                
## [1] p-value  =        0.135945068575853

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los cuatro regimientos con 4 diferentes sargentos difieren con respecto al rendimiento medio(mediana), respecto al tiempo que tardaron en realizar el ejercicio de obstáculos.

2.Se subastaron varios contratos de explotación de petróleo al mejor postor. Para cada contrato se recibieron una o más ofertas selladas. Pruebe la hipótesis de que los contratos que eventualmente se convirtieron en productores de petróleo tuvieron la misma mediana de ofertas que los contratos que no produjeron petróleo. A continuación se muestra una muestra aleatoria de cada tipo de contrato.
\[\begin{array}{|c | c |} \hline &\mbox{Número de ofertas en cada contrato de arrendamiento} \\ \hline \mbox{Productores}& 6, 3, 1, 14, 8, 9, 12, 1, 3, 2, 1, 7 \\ \hline \mbox{No productores}&6, 2, 1, 1, 3, 1, 2, 4, 8, 1, 2\\ \hline \end{array}\]

La prueba a utilizar Tablas de contingencia, Prueba de la mediana

Planteamineto de Hipótesis:

\[\textbf{H}_0: \ \mbox{Los contratos que eventualmente se convirtieron en productores de petróleo tuvieron la misma mediana de ofertas que los contratos que no produjeron petróleo}\] \[vs\]

\[\textbf{H}_a: \ \mbox{Los contratos que eventualmente se convirtieron en productores de petróleo difieren con respecto al rendimiento medio(mediana), que los contratos que no produjeron petróleo.}\]

Primero calculamos la mediana de los Productores y No Productores

#Datos
Productores =c( 6, 3, 1, 14, 8, 9, 12, 1, 3, 2, 1, 7)

No_Productores =c(6, 2, 1, 1, 3, 1, 2, 4, 8, 1, 2)

Ofertas = c(Productores,No_Productores)
Tipo_P =c(rep('Productores',12),rep('No Productores',11)) 

#Calcular la mediana
mediana=median(Ofertas)
mediana
## [1] 3

Después de calcular la mediana, contamos cuantas observaciones hay por método por arriba y por abajo de la mediana y con dichas frecuencias construimos la tabla de contingencia.

#Construir la tabla de contingencia
table(Tipo_P[which(Ofertas>mediana)])
## 
## No Productores    Productores 
##              3              6
table(Tipo_P[which(Ofertas<=mediana)])
## 
## No Productores    Productores 
##              8              6

Realizamos la tabla correspondiente:

Observados=matrix(c(6,3,6,8), nrow = 2, ncol = 2, byrow = T)
rownames(Observados)=c('> Mediana','≤ Mediana')
colnames(Observados)=c('Productores','No Productores')
Observados
##           Productores No Productores
## > Mediana           6              3
## ≤ Mediana           6              8

Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\frac{N^2}{ab}*\sum^{c}_{i=1}\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\]

1.Tabla con los Totales

Ahora calculamos \(\frac{n_{i}a}{N}\)

#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 1,ncol = 2)
for (i in 1:1) {
  for (j in 1:2) {
    Esperados[i,j] =(datos$Totales[1]*datos[3,j+1])/datos$Totales[3]
  }  
}
data.frame(Esperados)

Ahora calculamos \(\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\)

mayor_med = c(6,3)
Totales_1 = c(12,11)
#Ahora sí, vamos a calcular el estadístico completo
Totales_2=matrix(nrow = 1,ncol = 2)
for (i in 1:1) {
  for (j in 1:2) {
    Totales_2[i,j]=((mayor_med[j]-Esperados[j])^2)/(Totales_1[j])
  }  
}
data.frame(Totales_2)

Por lo que nuestro estadístico es:

#ESTADÍSTICO DE PRUEBA

T = ((Totales[3])^2/(Totales[1]*Totales[2]))*sum(Totales_2)
T 
## [1] 1.244589

Sabemos que:

  1. \(α = 5\% = 0.05\) el nivel de significancia

  2. Confianza \(=1-α =95\%\)

  3. La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.

Es decir,

\[T\sim \chi^2_{(c-1)}\]

Entonces:

alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,1)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 3.84145882069412
  1. Calculo del P-value
p_value <- pchisq(T,df=1,lower.tail = F)

Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]

if(T>cuantil){
  print("Se rechaza H_0",quote = FALSE)
  print(c("Estadístico T1 = ", T),quote = FALSE)
  print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
  print(c("p-value  = ", p_value),quote = FALSE)
}else {
 print("No hay información suficiente para rechazar H_0",quote = FALSE)
 print(c("Estadístico T1 =" , T),quote = FALSE)
 print(c("Cuantil Ji-cuadrado con 1 grado de libertad  = ", cuantil),quote = FALSE)
 print(c("p-value  = ",p_value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 1.24458874458874
## [1] Cuantil Ji-cuadrado con 1 grado de libertad  = 
## [2] 3.84145882069412                               
## [1] p-value  =        0.264588520057451

Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los contratos que eventualmente se convirtieron en productores de petróleo difieren con respecto al rendimiento medio(mediana), que los contratos que no produjeron petróleo.