La compañía de dulces Mars publica en su sitio web información relacionada con los porcentajes de los distintos colores de sus dulces M|M para la variedad de chocolate con leche.
Color contenido en la bolsa
café amarillo rojo azul naranja verde Porcentaje (%) 13 14 13 24 20 16
Con el fin de validar los publicado por la compañia en su página web, se compra una bolsa de dulces y se cuentan las frecuencias de los colores contenidos en la bolsa
Se podria afirmar que los datos anteriores respaldan la información suministrada por la compañía en su sitio web? Sustente su respuesta.
# Porcentajes esperados para cada color proporcionados por Mars
porcentajes_esperados <- c(13, 14, 13, 24, 20, 16) # Porcentajes para café, amarillo, rojo, azul, naranja, verde
# Datos observados (frecuencias de cada color en la bolsa)
datos_observados <- c(130, 140, 130, 240, 200, 160) # Ejemplo de frecuencias observadas para cada color
# Calcular las frecuencias esperadas
total_mms <- sum(datos_observados)
frecuencias_esperadas <- total_mms * (porcentajes_esperados / 100)
# Realizar el test chi-cuadrado
test_chi <- chisq.test(x = datos_observados, p = porcentajes_esperados / 100, rescale.p = TRUE)
# Mostrar el valor estadístico chi-cuadrado y el valor p
test_chi$statistic
## X-squared
## 0
test_chi$p.value
## [1] 1
En una línea de producción los artículos se inspeccionan en forma periódica con el fin de detectar defectos. La siguiente secuencia de artículos defectuosos (D) y no defectuosos (N) corresponde a la producción de uno de los turnos.
[1] “N” “D” “D” “N” “N” “D” “N” “N” “N” “D” “N” “D” “D” “N” “D” “N” “N” “N” “D” [20] “D” “N” “N” “D” “D” “N” “N” “N” “N” “N” “D” “D” “D” “N” “D” “D” “D” “N” “D” [39] “N” “D” “N” “D” “D” “N” “N” “D” “D” “D” “D” “N” Se puede afirmar que los datos no presentan patrón alguno y que la generación de artículos defectuosos se debe al azar? . Utilice un α=0.05.
# Secuencia de artículos defectuosos (D) y no defectuosos (N)
secuencia <- c("N", "D", "D", "N", "N", "D", "N", "N", "N", "D", "N", "D", "D", "N", "D", "N", "N", "N", "D",
"D", "N", "N", "D", "D", "N", "N", "N", "N", "N", "D", "D", "D", "N", "D", "D", "D", "N", "D",
"N", "D", "N", "D", "D", "N", "N", "D", "D", "D", "D", "N")
# Convertir la secuencia a valores binarios (D=1, N=0)
secuencia_binaria <- as.numeric(secuencia == "D")
# Calcular rachas
calcular_rachas <- function(secuencia) {
rachas <- 1
for (i in 2:length(secuencia)) {
if (secuencia[i] != secuencia[i-1]) {
rachas <- rachas + 1
}
}
return(rachas)
}
# Número de rachas
num_rachas <- calcular_rachas(secuencia_binaria)
# Número total de elementos, número de unos (D) y ceros (N)
n_total <- length(secuencia_binaria)
n_unos <- sum(secuencia_binaria)
n_ceros <- n_total - n_unos
# Cálculo de las estadísticas para el test de rachas
R_exp <- (2 * n_unos * n_ceros / n_total) + 1
Var_R <- (2 * n_unos * n_ceros * (2 * n_unos * n_ceros - n_total)) / (n_total^2 * (n_total - 1))
# Calcular el Z-score
Z <- (num_rachas - R_exp) / sqrt(Var_R)
# Calcular el p-valor
p_valor <- 2 * (1 - pnorm(abs(Z)))
# Imprimir resultados
cat("Número de rachas observadas:", num_rachas, "\n")
## Número de rachas observadas: 27
cat("Número esperado de rachas (R_exp):", R_exp, "\n")
## Número esperado de rachas (R_exp): 26
cat("Varianza esperada de rachas (Var_R):", Var_R, "\n")
## Varianza esperada de rachas (Var_R): 12.2449
cat("Z-score:", Z, "\n")
## Z-score: 0.2857738
cat("P-valor:", p_valor, "\n")
## P-valor: 0.7750514
En una planta ensambladora de camiones la supervisión diaria de las soldaduras generó la siguiente información :
alta moderada baja
dia 470 191 42 tarde 445 171 28 noche 257 139 17 ¿Se puede concluir que la calidad varia con los turnos?, en otras palabras se puede concluir que la calidad de las soldaduras es independiente de los turnos? . Utilice un nivel de significancia α=0.05.
# Crear una matriz con los datos observados
datos <- matrix(c(470, 191, 42,
445, 171, 28,
257, 139, 17),
nrow = 3, ncol = 3, byrow = TRUE,
dimnames = list(c("dia", "tarde", "noche"),
c("alta", "moderada", "baja")))
# Realizar el test Chi-cuadrado de independencia
test_chi <- chisq.test(datos)
# Mostrar los resultados
print(test_chi)
##
## Pearson's Chi-squared test
##
## data: datos
## X-squared = 9.4939, df = 4, p-value = 0.04987
# Evaluar la significancia
if (test_chi$p.value < 0.05) {
cat("Se rechaza la hipótesis nula: Existe una relación significativa entre la calidad de las soldaduras y los turnos de trabajo.\n")
} else {
cat("No se rechaza la hipótesis nula: La calidad de las soldaduras parece ser independiente de los turnos de trabajo.\n")
}
## Se rechaza la hipótesis nula: Existe una relación significativa entre la calidad de las soldaduras y los turnos de trabajo.
Los siguientes datos corresponde a las notas obtenidas por un grupo de estudiantes de la asignatura Matemáticas Fundamentales. Si la distribución de los datos es normal, podría afirmar que la prueba realizada es una prueba normalizada. En caso contrario serviría para estudiar problemas relacionados con su aprendizaje. Para un α=0;05 , se podría afirmar que los datos proceden de una distribución normal? . Si se requiere realizar una prueba de hipótesis sobre la media de la nota Ho:μ≤3.3 vs Ha:μ>3.3 , ¿Que prueba se realizaría?
[1] 3.4 2.8 4.2 2.1 2.8 2.4 3.5 4.2 3.1 4.1 2.4 3.4 4.1 4.0 2.4 4.1 3.4 4.4 3.8 [20] 3.7 2.2 3.6 2.3 3.7 2.8 4.1 2.3 4.6 4.6 5.2 2.4 2.4 2.7 3.8 4.6 4.4 4.2 4.4 [39] 2.4 3.3 3.8 2.9 3.1 2.7 3.6 3.8 4.4 3.9 2.8 3.7
# Datos de las notas
notas <- c(3.4, 2.8, 4.2, 2.1, 2.8, 2.4, 3.5, 4.2, 3.1, 4.1, 2.4, 3.4, 4.1, 4.0, 2.4, 4.1, 3.4, 4.4, 3.8,
3.7, 2.2, 3.6, 2.3, 3.7, 2.8, 4.1, 2.3, 4.6, 4.6, 5.2, 2.4, 2.4, 2.7, 3.8, 4.6, 4.4, 4.2, 4.4,
2.4, 3.3, 3.8, 2.9, 3.1, 2.7, 3.6, 3.8, 4.4, 3.9, 2.8, 3.7)
# Realizar el test de Shapiro-Wilk para evaluar la normalidad
test_normalidad <- shapiro.test(notas)
# Mostrar resultados del test de normalidad
print(test_normalidad)
##
## Shapiro-Wilk normality test
##
## data: notas
## W = 0.95071, p-value = 0.03649
# Si los datos son normales, realizar una prueba t de una muestra para la hipótesis sobre la media
if (test_normalidad$p.value > 0.05) {
# Los datos no se desvían significativamente de una distribución normal, realizar prueba t
test_media <- t.test(notas, alternative = "greater", mu = 3.3)
# Mostrar resultados de la prueba t
print(test_media)
} else {
cat("Los datos no siguen una distribución normal. Considere usar pruebas no paramétricas o revisar la naturaleza de la distribución.\n")
}
## Los datos no siguen una distribución normal. Considere usar pruebas no paramétricas o revisar la naturaleza de la distribución.
Una muestra aleatoria de 90 adultos se clasifica de acuerdo al genero y el núumero de horas que dedica a ver el celular durante una semana:
Horas diarias dedicadas a ver televisión género Masculino Femenino más de 25 horas 29 19 menos de 25 horas 15 27 Utilice un nivel de significancia del 0 . 05 y pruebe la hipótesis de que el tiempo dedicado a ver televisión es independiente de si el espectador es hombre o mujer.
# Crear la tabla de contingencia con los datos proporcionados
datos <- matrix(c(29, 19, 15, 27),
nrow = 2,
byrow = TRUE,
dimnames = list(genero = c("Masculino", "Femenino"),
horas_tv = c("más de 25 horas", "menos de 25 horas")))
# Realizar el test de Chi-cuadrado de independencia
test_chi <- chisq.test(datos)
# Mostrar los resultados del test
print(test_chi)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: datos
## X-squared = 4.5262, df = 1, p-value = 0.03338
# Interpretar el resultado
if (test_chi$p.value < 0.05) {
cat("Se rechaza la hipótesis nula: Existe una asociación significativa entre el tiempo dedicado a ver televisión y el género del espectador.\n")
} else {
cat("No se rechaza la hipótesis nula: El tiempo dedicado a ver televisión parece ser independiente del género del espectador.\n")
}
## Se rechaza la hipótesis nula: Existe una asociación significativa entre el tiempo dedicado a ver televisión y el género del espectador.
Realiza un mapa mental sobre las pruebas de hipótesis, que incluya: nombre de la prueba, Ho, Ha, su estadístico de prueba, la distribución que sigue el estadístico de prueba y en que casos se utiliza.
# Resumen de Pruebas de Hipotesis
# Prueba Z para una media
# H0: mu = mu0
# Ha: mu != mu0 (dos colas), mu > mu0 o mu < mu0 (una cola)
# Estadistico de prueba: Z = (x̄ - mu0) / (sigma / sqrt(n))
# Distribucion: Normal estándar Z
# Uso: Comparar la media de una muestra grande (n > 30) con una media poblacional conocida, desviación estándar poblacional conocida.
# Prueba t para una media
# H0: mu = mu0
# Ha: mu != mu0 (dos colas), mu > mu0 o mu < mu0 (una cola)
# Estadistico de prueba: t = (x̄ - mu0) / (s / sqrt(n))
# Distribucion: t de Student
# Uso: Comparar la media de una muestra pequeña (n <= 30) con una media poblacional conocida, desviación estándar poblacional desconocida.
# Prueba Chi-cuadrado para la independencia
# H0: Las variables son independientes.
# Ha: Las variables no son independientes.
# Estadistico de prueba: χ^2 = sum((Oi - Ei)^2 / Ei)
# Distribucion: Chi-cuadrado χ^2
# Uso: Determinar si hay una asociación entre dos variables categóricas.
# Prueba ANOVA (Análisis de Varianza)
# H0: Todas las medias de los grupos son iguales.
# Ha: Al menos una media de grupo es diferente.
# Estadistico de prueba: F = variabilidad entre grupos / variabilidad dentro de los grupos
# Distribucion: F de Fisher
# Uso: Comparar las medias de tres o más grupos para determinar si al menos una de ellas es significativamente diferente.
# Prueba de Shapiro-Wilk para normalidad
# H0: Los datos siguen una distribución normal.
# Ha: Los datos no siguen una distribución normal.
# Estadistico de prueba: Basado en la correlación entre los datos y los valores esperados de una distribución normal.
# Distribucion: Específica del test.
# Uso: Determinar si una muestra proviene de una población normalmente distribuida.