De acuerdo con un estudio de cierta universidad con relación a cierta especie animal, se analizó la sobrevivencia de 100 machos y 100 hembras en invierno.
observados <- matrix(
c(42, 33, 25, # Macho
40, 21, 39), # Hembra
nrow = 3, byrow = FALSE,
dimnames = list(
"Tiempo" = c("Menos de 10 días", "De 10 a 20 días", "Más de 20 días"),
"Sexo" = c("Macho", "Hembra")
)
)
observados
## Sexo
## Tiempo Macho Hembra
## Menos de 10 días 42 40
## De 10 a 20 días 33 21
## Más de 20 días 25 39
##Totales por fila, columna y total general
fila_totales <- rowSums(observados)
col_totales <- colSums(observados)
total_general <- sum(observados)
fila_totales
## Menos de 10 días De 10 a 20 días Más de 20 días
## 82 54 64
col_totales
## Macho Hembra
## 100 100
total_general
## [1] 200
##Valores esperados bajo H0
esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general)
dimnames(esperados) <- dimnames(observados)
esperados
## Sexo
## Tiempo Macho Hembra
## Menos de 10 días 41 41
## De 10 a 20 días 27 27
## Más de 20 días 32 32
##Estadístico chi-cuadrado
chi_cuadrado <- sum((observados - esperados)^2 / esperados)
chi_cuadrado
## [1] 5.777947
##Grados de libertad
df <- (nrow(observados) - 1) * (ncol(observados) - 1)
df
## [1] 2
##Valor crítico al 5%
alfa <- 0.05
valor_critico <- qchisq(1 - alfa, df)
valor_critico
## [1] 5.991465
##Decision y P-valor
rechaza_H0 <- chi_cuadrado > valor_critico
valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE)
rechaza_H0
## [1] FALSE
valor_p
## [1] 0.05563329
##Verificación con chisq.test
chisq.test(observados)
##
## Pearson's Chi-squared test
##
## data: observados
## X-squared = 5.7779, df = 2, p-value = 0.05563
#Ejercicio 2 |
Se calificó una muestra de universidades según el número de doctores investigadores que tenían y según si éstos tenían o no un proyecto de trabajo social. |
##Datos observados
observados <- matrix(c(13, 18, 32,
10, 12, 6),
nrow = 3, byrow = FALSE,
dimnames = list(
Doctores = c("Menos de 5", "Entre 5 y 8", "Más de 8"),
Proyecto = c("Con proyecto", "Sin proyecto")
))
observados
## Proyecto
## Doctores Con proyecto Sin proyecto
## Menos de 5 13 10
## Entre 5 y 8 18 12
## Más de 8 32 6
##Totales por fila, columna y total general
fila_totales <- rowSums(observados)
col_totales <- colSums(observados)
total_general <- sum(observados)
fila_totales
## Menos de 5 Entre 5 y 8 Más de 8
## 23 30 38
col_totales
## Con proyecto Sin proyecto
## 63 28
total_general
## [1] 91
##Valores esperados bajo H0
esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general)
dimnames(esperados) <- dimnames(observados)
esperados
## Proyecto
## Doctores Con proyecto Sin proyecto
## Menos de 5 15.92308 7.076923
## Entre 5 y 8 20.76923 9.230769
## Más de 8 26.30769 11.692308
##Estadístico chi-cuadrado
chi_cuadrado <- sum((observados - esperados)^2 / esperados)
chi_cuadrado
## [1] 6.946885
##Grados de libertad
df <- (nrow(observados) - 1) * (ncol(observados) - 1)
df
## [1] 2
##Valor critico al 5%
alfa <- 0.05
valor_critico <- qchisq(1 - alfa, df)
valor_critico
## [1] 5.991465
##Decisión
rechaza_H0 <- chi_cuadrado > valor_critico
rechaza_H0
## [1] TRUE
##p-valor
valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE)
valor_p
## [1] 0.03101009
##Verificación con chisq.test
chisq.test(observados)
##
## Pearson's Chi-squared test
##
## data: observados
## X-squared = 6.9469, df = 2, p-value = 0.03101
#Ejercicio 3 |
Como parte de un determinado cuestionario, se preguntó a muestras aleatorias de estudiantes universitarios lo siguiente: ¿Se acuesta antes de las 10:00 p.m.? |
##Datos observados
observados <- matrix(c(5, 70, 121,
4, 45, 169),
nrow = 3, byrow = FALSE,
dimnames = list(
Respuesta = c("Siempre", "A veces", "Nunca"),
Sexo = c("Hombres", "Mujeres")
))
observados
## Sexo
## Respuesta Hombres Mujeres
## Siempre 5 4
## A veces 70 45
## Nunca 121 169
##Totales por fila, columna y total general
fila_totales <- rowSums(observados)
col_totales <- colSums(observados)
total_general <- sum(observados)
fila_totales
## Siempre A veces Nunca
## 9 115 290
col_totales
## Hombres Mujeres
## 196 218
total_general
## [1] 414
##Valores esperados bajo H0
esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general)
dimnames(esperados) <- dimnames(observados)
esperados
## Sexo
## Respuesta Hombres Mujeres
## Siempre 4.26087 4.73913
## A veces 54.44444 60.55556
## Nunca 137.29469 152.70531
##Estadístico chi-cuadrado
chi_cuadrado <- sum((observados - esperados)^2 / esperados)
chi_cuadrado
## [1] 12.35653
##Grados de libertad
df <- (nrow(observados) - 1) * (ncol(observados) - 1)
df
## [1] 2
##Valor crítico al 5%
alfa <- 0.05
valor_critico <- qchisq(1 - alfa, df)
valor_critico
## [1] 5.991465
##Decisión
rechaza_H0 <- chi_cuadrado > valor_critico
rechaza_H0
## [1] TRUE
##p-valor
valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE)
valor_p
## [1] 0.002074021
##Verificación con chisq.test
chisq.test(observados)
## Warning in chisq.test(observados): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: observados
## X-squared = 12.357, df = 2, p-value = 0.002074
##Ejercicio 4 En un experimento para estudiar la dependencia entre los problemas de la vista y los hábitos de trabajar en el computador, se tomaron los siguientes datos de 180 personas. Pruebe la hipótesis de que los problemas visuales son independientes de los hábitos de trabajar en el computador. Utilice un nivel de significancia de 0,05. |
---|
#Datos observados |
r observados <- matrix(c(19, 26, 48, 30, 36, 21), nrow = 2, byrow = TRUE, dimnames = list( Vista = c("Con problemas", "Sin problemas"), Computador = c("Nunca", "A veces", "Siempre") )) observados |
## Computador ## Vista Nunca A veces Siempre ## Con problemas 19 26 48 ## Sin problemas 30 36 21 |
#Totales por fila, columna y total general |
``` r fila_totales <- rowSums(observados) col_totales <- colSums(observados) total_general <- sum(observados) |
fila_totales ``` |
## Con problemas Sin problemas ## 93 87 |
r col_totales |
## Nunca A veces Siempre ## 49 62 69 |
r total_general |
## [1] 180 |
#Valores esperados bajo H0 |
r esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general) dimnames(esperados) <- dimnames(observados) esperados |
## Computador ## Vista Nunca A veces Siempre ## Con problemas 25.31667 32.03333 35.65 ## Sin problemas 23.68333 29.96667 33.35 |
#Estadístico chi-cuadrado |
r chi_cuadrado <- sum((observados - esperados)^2 / esperados) chi_cuadrado |
## [1] 14.46358 |
#Grados de libertad |
r df <- (nrow(observados) - 1) * (ncol(observados) - 1) df |
## [1] 2 |
#Valor crítico al 5% |
r alfa <- 0.05 valor_critico <- qchisq(1 - alfa, df) valor_critico |
## [1] 5.991465 |
#Decisión |
r rechaza_H0 <- chi_cuadrado > valor_critico rechaza_H0 |
## [1] TRUE |
#p-valor |
r valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE) valor_p |
## [1] 0.0007232255 |
#Verificación con chisq.test |
r chisq.test(observados) |
## ## Pearson's Chi-squared test ## ## data: observados ## X-squared = 14.464, df = 2, p-value = 0.0007232 |
##Ejercicio 5 Una muestra de 200 estudiantes universitarios se clasifica de acuerdo con el estrato y el número de hermanos (hembras y varones) que tienen. Pruebe la hipótesis, con un nivel de significancia de 0,05, de que el número de hermanos es independiente del estrato. ————————-
#Datos observados
observados <- matrix(c(12, 17, 10,
14, 37, 32,
19, 42, 17),
nrow = 3, byrow = TRUE,
dimnames = list(
Estrato = c("Bajo", "Medio", "Alto"),
Hermanos = c("0-1", "2-3", "Más de 3")
))
observados
## Hermanos
## Estrato 0-1 2-3 Más de 3
## Bajo 12 17 10
## Medio 14 37 32
## Alto 19 42 17
#Totales por fila, columna y total general
fila_totales <- rowSums(observados)
col_totales <- colSums(observados)
total_general <- sum(observados)
fila_totales
## Bajo Medio Alto
## 39 83 78
col_totales
## 0-1 2-3 Más de 3
## 45 96 59
total_general
## [1] 200
#Valores esperados bajo H0
esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general)
dimnames(esperados) <- dimnames(observados)
esperados
## Hermanos
## Estrato 0-1 2-3 Más de 3
## Bajo 8.775 18.72 11.505
## Medio 18.675 39.84 24.485
## Alto 17.550 37.44 23.010
#Estadístico chi-cuadrado
chi_cuadrado <- sum((observados - esperados)^2 / esperados)
chi_cuadrado
## [1] 7.464393
#Grados de libertad
df <- (nrow(observados) - 1) * (ncol(observados) - 1)
df
## [1] 4
#Valor crítico al 5%
alfa <- 0.05
valor_critico <- qchisq(1 - alfa, df)
valor_critico
## [1] 9.487729
#Decisión
rechaza_H0 <- chi_cuadrado > valor_critico
rechaza_H0
## [1] FALSE
#p-valor
valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE)
valor_p
## [1] 0.1132897
#Verificación con chisq.test
chisq.test(observados)
##
## Pearson's Chi-squared test
##
## data: observados
## X-squared = 7.4644, df = 4, p-value = 0.1133
##Ejercicio 6 |
El departamento de medicina de una universidad realiza un experimento para determinar el grado de alivio que proporcionan tres remedios para la fiebre. Cada remedio es tratado en 50 estudiantes y se registran los datos. Pruebe la hipótesis, con un nivel de significancia de 0,05, de que los tres remedios para la fiebre son igualmente efectivos. |
#Datos observados
observados <- matrix(c(7, 9, 14,
11, 13, 9,
32, 28, 27),
nrow = 3, byrow = TRUE,
dimnames = list(
Alivio = c("Sin alivio", "Cierto alivio", "Alivio completo"),
Remedio = c("Remedio 1", "Remedio 2", "Remedio 3")
))
observados
## Remedio
## Alivio Remedio 1 Remedio 2 Remedio 3
## Sin alivio 7 9 14
## Cierto alivio 11 13 9
## Alivio completo 32 28 27
#Totales por fila, columna y total general
fila_totales <- rowSums(observados)
col_totales <- colSums(observados)
total_general <- sum(observados)
fila_totales
## Sin alivio Cierto alivio Alivio completo
## 30 33 87
col_totales
## Remedio 1 Remedio 2 Remedio 3
## 50 50 50
total_general
## [1] 150
#Valores esperados bajo H0
esperados <- outer(fila_totales, col_totales, FUN = function(f, c) f * c / total_general)
dimnames(esperados) <- dimnames(observados)
esperados
## Remedio
## Alivio Remedio 1 Remedio 2 Remedio 3
## Sin alivio 10 10 10
## Cierto alivio 11 11 11
## Alivio completo 29 29 29
#Estadístico chi-cuadrado
chi_cuadrado <- sum((observados - esperados)^2 / esperados)
chi_cuadrado
## [1] 3.810031
#Grados de libertad
df <- (nrow(observados) - 1) * (ncol(observados) - 1)
df
## [1] 4
#Valor crítico al 5%
alfa <- 0.05
valor_critico <- qchisq(1 - alfa, df)
valor_critico
## [1] 9.487729
#Decisión
rechaza_H0 <- chi_cuadrado > valor_critico
rechaza_H0
## [1] FALSE
#p-valor
valor_p <- pchisq(chi_cuadrado, df, lower.tail = FALSE)
valor_p
## [1] 0.4323253
#Verificación con chisq.test
chisq.test(observados)
##
## Pearson's Chi-squared test
##
## data: observados
## X-squared = 3.81, df = 4, p-value = 0.4323