La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{La preferencia del tipo de deporte es independiente al género de la población}\] \[vs\] \[\textbf{H}_α: \ \mbox{La preferencia del tipo de deporte no es independiente al género de la población}\]
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]
1.Tabla con los Totales
Ahora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados = matrix(nrow = 2,ncol = 3)
for (i in 1:2) {
for (j in 1:3) {
Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 3)
for (i in 1:2) {
for (j in 1:3) {
Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T =sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T =", T),quote = FALSE)
## [1] Estadístico T = 19.7979797979798
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\] Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,2)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad = ", cuantil),quote=FALSE)
## [1] Cuantil Ji-cuadrado con 2 grados de libertad =
## [2] 5.99146454710798
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test
##
## data: datos[-1]
## X-squared = 19.798, df = 2, p-value = 5.023e-05
## [1] 5.022539e-05
Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad = ",cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar $H_0$",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ",cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T = 19.7979797979798
## [1] Cuantil Ji-cuadrado con 2 grados de libertad =
## [2] 5.99146454710798
## [1] p-value = 5.0225389158538e-05
Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que la preferencia del tipo de deporte no es independiente al tipo de género de la población.
\[\begin{array}{|c|c c c c c c c|} \hline X_{2}&X_{1}&&&&&&\\ \hline SI & PRI & PRI & PRI & PRI & PRI & PRI & PRI\\ NO & PRI & PRI & PRI & PRI & PRI & PRI & PRI\\ \hline SI & PRI & PAN & PAN & PAN & PAN & PAN &PAN\\ NO & PRI & PAN & PAN & PAN & PAN & PAN & PAN\\ \hline SI & PAN & PAN & PAN & PAN & PAN & PAN & PAN\\ NO & PAN & PAN & PAN & PAN & PAN & PAN&\\ \hline \end{array}\]
Considere \(X_1\)= Partido por el cual votó, \(X_2\) =tiene o no estudios universitarios.
Se desea probar si existe asociación entre el partido por el cual votó y si tienen o no estudios universitarios. Plantee, en el contexto del problema, las hipótesis, estadística de prueba y obtenga su conclusión con un nivel de significancia del 5%La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{La preferencia del partido político es independiente si los ciudadanos tienen o no estudios universitarios}\] \[vs\] \[\textbf{H}_α: \ \mbox{La preferencia del partido político no es independiente si los ciudadanos tienen o no estudios universitarios}\]
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]
1.Tabla con los Totales
Ahora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 2)
for (i in 1:2) {
for (j in 1:2) {
Esperados[i,j] =(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 2)
for (i in 1:2) {
for (j in 1:2) {
Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T=sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 0.0156190476190474
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,1)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 1 grado de libertad =
## [2] 3.84145882069412
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: datos[-1]
## X-squared = 0, df = 1, p-value = 1
Regla de decisión Rechazamos \(H_0\)a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 0.0156190476190474
## [1] Cuantil Ji-cuadrado con 1 grado de libertad =
## [2] 3.84145882069412
## [1] p-value = 1
Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no se puede decir si la preferencia del partido político no es independiente si los ciudadanos tienen o no estudios universitarios.
La prueba a utilizar Tablas de Contingencia rxc prueba de Independencia
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{El grado de estar de acuerdo con la proposición es independiente al género de la población}\] \[vs\] \[\textbf{H}_α: \ \mbox{El grado de estar de acuerdo con la proposición no es independiente al género de la población}\]Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{O_{ij}^{2}}{E_{ij}}-N\]
1.Tabla con los Totales
Ahora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 5)
for (i in 1:2) {
for (j in 1:5) {
Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{O_{ij}^{2}}{E_{ij}}\) para después sumarlos y restarlo con N
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 5)
for (i in 1:2) {
for (j in 1:5) {
Totales[i,j]=(datos_2[i,j+1]^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T =sum(Totales)-datos_2$Totales[3]
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 23.7328930539158
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,4)
print(c("Cuantil Ji-cuadrado con 4 grados de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 4 grados de libertad =
## [2] 9.48772903678115
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test
##
## data: datos[-1]
## X-squared = 23.733, df = 4, p-value = 9.035e-05
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 4 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 4 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T1 = 23.7328930539158
## [1] Cuantil Ji-cuadrado con 4 grados de libertad =
## [2] 9.48772903678115
## [1] p-value = 9.03496288719341e-05
Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que podemos decir que el grado de estar de acuerdo con la proposición no es independiente al género de la población.
La prueba a utilizar es Tablas de Contingencia de \(r×c\)
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{La distribución de las evaluaciones a las empresas telefónicas es la misma distribución de las evaluaciones a las líneas aéreas}\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de las evaluaciones a las empresas telefónicas difiere de la distribución de las evaluaciones a las líneas aéreas}\]
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]
1.Tabla con los Totales
Ahora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
for (j in 1:4) {
Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
for (j in 1:4) {
Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 2.25929277287512
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test
##
## data: datos[-1]
## X-squared = 2.2593, df = 3, p-value = 0.5204
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 2.25929277287512
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
## [1] p-value = 0.520364153807474
Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir si la distribución de las evaluaciones a las empresas telefónicas difiere de la distribución de las evaluaciones a las líneas aéreas.
La prueba a utilizar es Tablas de Contingencia de \(r×c\)
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{La distribución de cada uno de los tres distribuidores es la misma.}\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de cada uno de los tres distribuidores es distinta al menos de 2 distribuidores}\]
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]
1.Tabla con los Totales
Ahora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 3,ncol = 2)
for (i in 1:3) {
for (j in 1:2) {
Esperados[i,j]=(datos_2$Totales[i]*datos_2[4,j+1])/datos_2$Totales[4]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 3,ncol = 2)
for (i in 1:3) {
for (j in 1:2) {
Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 7.2001419184117
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,2)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 2 grados de libertad =
## [2] 5.99146454710798
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test
##
## data: datos[-1]
## X-squared = 7.2001, df = 2, p-value = 0.02732
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 2 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] Se rechaza H_0
## [1] Estadístico T1 = 7.2001419184117
## [1] Cuantil Ji-cuadrado con 2 grados de libertad =
## [2] 5.99146454710798
## [1] p-value = 0.0273217836464356
Conclusión Tenemos información suficiente para rechazar \(H_0\) por lo que la distribución de cada uno de los tres distribuidores es distinta al menos de 2 distribuidores
La prueba a utilizar es Tablas de Contingencia de \(r×c\)
Hipótesis al problema planteado
\[\textbf{H}_0: \ \mbox{La distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es la misma }\] \[vs\] \[\textbf{H}_a: \ \mbox{La distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es diferente al menos para 2 canales}\]
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\sum_{i=1}^{r}\sum_{j=1}^{c}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\]
1.Tabla con los TotalesAhora vamos a calcular los valores esperados:
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
for (j in 1:4) {
Esperados[i,j]=(datos_2$Totales[i]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{(O_{ij}-E_{ij})^2}{E_{ij}}, \ \ \ Donde\ \ E_{ij}=\frac{n_{i}C_{j}}{N}\)
#Ahora sí, vamos a calcular el estadístico completo
Totales=matrix(nrow = 2,ncol = 4)
for (i in 1:2) {
for (j in 1:4) {
Totales[i,j]=((datos_2[i,j+1]-Esperados[i,j])^2)/(Esperados[i,j])
}
}
data.frame(Totales)
Por lo que nuestro estadístico de prueba es:
T=sum(Totales)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 3.45949757559514
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((r-1)\times(c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(r-1)(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
Ocupando Pearson’s Chi-squared test para comprobar que mi estadístico esta bien y el cálculo de mi p-value
##
## Pearson's Chi-squared test
##
## data: datos[-1]
## X-squared = 3.4595, df = 3, p-value = 0.3261
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 3.45949757559514
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
## [1] p-value = 0.326053266576246
Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que la distribución de las proporciones respecto a los 4 canales que ven los televidentes los 2 sábados por la noche es diferente al menos para 2 canales.
La prueba a utilizar Tablas de contingencia, Prueba de la mediana
Planteamineto de Hipótesis:
\[\textbf{H}_0: \ \mbox{Los cuatro regimientos con 4 diferentes sargentos tuvieron la misma mediana en el tiempo que tardaron en realizar el ejercicio de obstáculos}\] \[vs\]
\[\textbf{H}_a: \ \mbox{Los cuatro regimientos con 4 diferentes sargentos difieren con respecto al rendimiento medio(mediana), respecto al tiempo que tardaron en realizar el ejercicio de obstáculos.}\]
Observados=matrix(c(11,8,8,15,9,14,12,7), nrow = 2, ncol = 4, byrow = T)
rownames(Observados)=c('> Mediana','≤ Mediana')
colnames(Observados)=c('Sargento Adams','Sargento Baker','Sargento Callahan','Sargento Davis')
Observados
## Sargento Adams Sargento Baker Sargento Callahan Sargento Davis
## > Mediana 11 8 8 15
## ≤ Mediana 9 14 12 7
Ya que se tiene la tabla se le puede aplicar la prueba Ji-Cuadrada, ya que los datos son mayores a 5
T1 <- chisq.test(Observados)
T1
##
## Pearson's Chi-squared test
##
## data: Observados
## X-squared = 5.5455, df = 3, p-value = 0.1359
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\frac{N^2}{ab}*\sum^{c}_{i=1}\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\]
1.Tabla con los TotalesAhora calculamos \(\frac{n_{i}a}{N}\)
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 1,ncol = 4)
for (i in 1:1) {
for (j in 1:4) {
Esperados[i,j] =(datos_2$Totales[1]*datos_2[3,j+1])/datos_2$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\)
mayor_med = c(11,8,8,15)
Totales_1 = c(20,22,20,22)
#Ahora sí, vamos a calcular el estadístico completo
Totales_2=matrix(nrow = 1,ncol = 4)
for (i in 1:1) {
for (j in 1:4) {
Totales_2[i,j]=((mayor_med[j]-Esperados[j])^2)/(Totales_1[j])
}
}
data.frame(Totales_2)
Por lo que nuestro estadístico es:
#ESTADÍSTICO DE PRUEBA
T = ((Totales[3])^2/(Totales[1]*Totales[2]))*sum(Totales_2)
print(c("Estadístico T = ", T),quote = FALSE)
## [1] Estadístico T = 5.54545454545455
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,3)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", T1$p.value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 3 grados de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ",T1$p.value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 5.54545454545455
## [1] Cuantil Ji-cuadrado con 3 grados de libertad =
## [2] 7.81472790325118
## [1] p-value = 0.135945068575853
Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los cuatro regimientos con 4 diferentes sargentos difieren con respecto al rendimiento medio(mediana), respecto al tiempo que tardaron en realizar el ejercicio de obstáculos.
La prueba a utilizar Tablas de contingencia, Prueba de la mediana
Planteamineto de Hipótesis:
\[\textbf{H}_0: \ \mbox{Los contratos que eventualmente se convirtieron en productores de petróleo tuvieron la misma mediana de ofertas que los contratos que no produjeron petróleo}\] \[vs\]
\[\textbf{H}_a: \ \mbox{Los contratos que eventualmente se convirtieron en productores de petróleo difieren con respecto al rendimiento medio(mediana), que los contratos que no produjeron petróleo.}\]
Primero calculamos la mediana de los Productores y No Productores
#Datos
Productores =c( 6, 3, 1, 14, 8, 9, 12, 1, 3, 2, 1, 7)
No_Productores =c(6, 2, 1, 1, 3, 1, 2, 4, 8, 1, 2)
Ofertas = c(Productores,No_Productores)
Tipo_P =c(rep('Productores',12),rep('No Productores',11))
#Calcular la mediana
mediana=median(Ofertas)
mediana
## [1] 3
Después de calcular la mediana, contamos cuantas observaciones hay por método por arriba y por abajo de la mediana y con dichas frecuencias construimos la tabla de contingencia.
#Construir la tabla de contingencia
table(Tipo_P[which(Ofertas>mediana)])
##
## No Productores Productores
## 3 6
table(Tipo_P[which(Ofertas<=mediana)])
##
## No Productores Productores
## 8 6
Realizamos la tabla correspondiente:
Observados=matrix(c(6,3,6,8), nrow = 2, ncol = 2, byrow = T)
rownames(Observados)=c('> Mediana','≤ Mediana')
colnames(Observados)=c('Productores','No Productores')
Observados
## Productores No Productores
## > Mediana 6 3
## ≤ Mediana 6 8
Estadístico de prueba El estadístico de prueba \(T\) es obtenido de la siguiente manera: \[T=\frac{N^2}{ab}*\sum^{c}_{i=1}\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\]
1.Tabla con los TotalesAhora calculamos \(\frac{n_{i}a}{N}\)
#Primero calcularemos los valores esperados
Esperados=matrix(nrow = 1,ncol = 2)
for (i in 1:1) {
for (j in 1:2) {
Esperados[i,j] =(datos$Totales[1]*datos[3,j+1])/datos$Totales[3]
}
}
data.frame(Esperados)
Ahora calculamos \(\frac{(O_{1i}-\frac{n_{i}a}{N})^2}{n_i}\)
mayor_med = c(6,3)
Totales_1 = c(12,11)
#Ahora sí, vamos a calcular el estadístico completo
Totales_2=matrix(nrow = 1,ncol = 2)
for (i in 1:1) {
for (j in 1:2) {
Totales_2[i,j]=((mayor_med[j]-Esperados[j])^2)/(Totales_1[j])
}
}
data.frame(Totales_2)
Por lo que nuestro estadístico es:
#ESTADÍSTICO DE PRUEBA
T = ((Totales[3])^2/(Totales[1]*Totales[2]))*sum(Totales_2)
T
## [1] 1.244589
Sabemos que:
\(α = 5\% = 0.05\) el nivel de significancia
Confianza \(=1-α =95\%\)
La distribución nula de \(T\) es obtenida aproximadamente por la Distribución \(\chi^2\) con \((c-1)\) grados de libertad, cuyos cuantiles se encuentran en las tablas de dicha distribución.
Es decir,
\[T\sim \chi^2_{(c-1)}\]
Entonces:
alpha=.05
#Ahora vamos a calcular nuestro cuantil
cuantil=qchisq(1-alpha,1)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
## [1] Cuantil Ji-cuadrado con 1 grado de libertad =
## [2] 3.84145882069412
p_value <- pchisq(T,df=1,lower.tail = F)
Regla de decisión Rechazamos \(H_0\) a un nivel de significancia α si \(p-value<0.05\), o con \[T > t\]
if(T>cuantil){
print("Se rechaza H_0",quote = FALSE)
print(c("Estadístico T1 = ", T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ", p_value),quote = FALSE)
}else {
print("No hay información suficiente para rechazar H_0",quote = FALSE)
print(c("Estadístico T1 =" , T),quote = FALSE)
print(c("Cuantil Ji-cuadrado con 1 grado de libertad = ", cuantil),quote = FALSE)
print(c("p-value = ",p_value),quote = FALSE)
}
## [1] No hay información suficiente para rechazar H_0
## [1] Estadístico T1 = 1.24458874458874
## [1] Cuantil Ji-cuadrado con 1 grado de libertad =
## [2] 3.84145882069412
## [1] p-value = 0.264588520057451
Conclusión No tenemos información suficiente para rechazar \(H_0\) por lo que no podemos decir que los contratos que eventualmente se convirtieron en productores de petróleo difieren con respecto al rendimiento medio(mediana), que los contratos que no produjeron petróleo.