🎓 Licenciatura

📘 Eje de Negocios

🔹 Problema 1: Análisis de ventas trimestrales por categoría de producto

Contexto: Una empresa de comercio electrónico desea analizar sus ventas trimestrales de tres líneas de productos: Electrónica, Hogar y Deportes.

set.seed(101)
ventas <- data.frame(
  categoria = rep(c("Electrónica", "Hogar", "Deportes"), each = 4),
  ventas_trimestrales = c(rnorm(4, 150000, 10000), rnorm(4, 120000, 15000), rnorm(4, 90000, 12000))
)
aggregate(ventas_trimestrales ~ categoria, data = ventas, summary)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
ggplot(ventas, aes(x = categoria, y = ventas_trimestrales)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué categoría tiene mayores ventas promedio?
  • ¿Cuál categoría muestra mayor variabilidad?
  • ¿Qué decisiones comerciales podrían derivarse?

🔹 Problema 2: Comparación de ingresos semanales en sucursales

Contexto: Se desea comparar los ingresos semanales de tres sucursales de una cadena comercial durante un mes.

set.seed(102)
ingresos <- data.frame(
  sucursal = rep(c("Norte", "Centro", "Sur"), each = 4),
  ingreso_semanal = c(rnorm(4, 48000, 5000), rnorm(4, 50000, 4000), rnorm(4, 47000, 6000))
)
aggregate(ingreso_semanal ~ sucursal, data = ingresos, summary)
library(ggplot2)
ggplot(ingresos, aes(x = sucursal, y = ingreso_semanal)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Cuál sucursal presenta ingresos más estables?
  • ¿Hay alguna diferencia significativa en la mediana?
  • ¿Qué gráfica adicional apoyarías para la interpretación?

🔹 Problema 3: Satisfacción del cliente en tres servicios

Contexto: Una empresa midió la satisfacción del cliente en tres tipos de servicio: venta, postventa y soporte técnico.

set.seed(103)
satisfaccion <- data.frame(
  servicio = rep(c("Venta", "Postventa", "Soporte"), each = 10),
  puntaje = c(rnorm(10, 8.2, 0.5), rnorm(10, 7.5, 0.8), rnorm(10, 7.8, 0.6))
)
aggregate(puntaje ~ servicio, data = satisfaccion, summary)
library(ggplot2)
ggplot(satisfaccion, aes(x = servicio, y = puntaje)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Cuál servicio tiene menor dispersión en satisfacción?
  • ¿Hay valores extremos? ¿Qué representan?
  • ¿Qué servicio debería priorizar mejoras?

🔹 Problema 4: Tiempo de atención al cliente

Contexto: Se mide el tiempo de atención (en minutos) de 10 empleados en una semana de operaciones.

set.seed(104)
tiempos <- data.frame(
  empleado = paste0("E", 1:10),
  tiempo_atencion = rnorm(10, 12, 2)
)
summary(tiempos$tiempo_atencion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.91   11.50   12.90   12.68   13.28   14.90
boxplot(tiempos$tiempo_atencion, main="Tiempo de atención", ylab="Minutos")

❓ Preguntas de análisis:

  • ¿Cuál es el tiempo promedio de atención?
  • ¿Existen tiempos atípicos?
  • ¿Qué implicaciones tiene la dispersión observada?

🔹 Problema 5: Frecuencia de compras por día de la semana

Contexto: Una tienda registró el número de compras realizadas cada día durante 4 semanas.

compras <- data.frame(
  dia = rep(c("Lunes", "Martes", "Miércoles", "Jueves", "Viernes", "Sábado", "Domingo"), times = 4),
  cantidad = sample(80:160, 28, replace = TRUE)
)
aggregate(cantidad ~ dia, data = compras, mean)
barplot(tapply(compras$cantidad, compras$dia, mean), main="Promedio de compras por día", col="lightblue")

❓ Preguntas de análisis:

  • ¿Qué día tiene mayor número promedio de compras?
  • ¿Qué visualización alternativa sería útil?
  • ¿Qué sugiere esto para la planificación operativa?

🔹 Problema 6: Número de devoluciones por categoría

Contexto: Una tienda desea conocer las categorías con mayor número de devoluciones para reducir pérdidas.

set.seed(105)
devoluciones <- data.frame(
  categoria = rep(c("Ropa", "Electrónica", "Hogar"), each = 6),
  cantidad = rpois(18, lambda = c(5, 7, 4))
)
aggregate(cantidad ~ categoria, data = devoluciones, summary)
library(ggplot2)
ggplot(devoluciones, aes(x = categoria, y = cantidad)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué categoría presenta mayor dispersión?
  • ¿Cuál sería una estrategia basada en estos datos?
  • ¿Qué otros factores deberían considerarse?

🔹 Problema 7: Horas trabajadas por semana en áreas operativas

Contexto: Se comparan las horas trabajadas por semana en 3 áreas operativas de una empresa.

set.seed(106)
horas <- data.frame(
  area = rep(c("Producción", "Logística", "Ventas"), each = 8),
  horas_trabajadas = c(rnorm(8, 42, 3), rnorm(8, 45, 2), rnorm(8, 40, 4))
)
aggregate(horas_trabajadas ~ area, data = horas, summary)
library(ggplot2)
ggplot(horas, aes(x = area, y = horas_trabajadas)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué área trabaja más horas en promedio?
  • ¿Cuál muestra mayor consistencia?
  • ¿Cómo se puede mejorar el balance laboral?

🔹 Problema 8: Rotación de personal por departamento

Contexto: Se analiza la rotación mensual de personal en cuatro departamentos durante seis meses.

set.seed(107)
rotacion <- data.frame(
  departamento = rep(c("Ventas", "RH", "TI", "Producción"), each = 6),
  rotacion_mensual = rpois(24, lambda = c(3, 2, 1, 4))
)
aggregate(rotacion_mensual ~ departamento, data = rotacion, summary)
library(ggplot2)
ggplot(rotacion, aes(x = departamento, y = rotacion_mensual)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué departamento presenta mayor rotación?
  • ¿Hay alguno con valores extremos?
  • ¿Qué decisiones de gestión se pueden tomar?

🔹 Problema 9: Número de productos vendidos por tipo de cliente

Contexto: Una empresa compara el comportamiento de compra entre clientes nuevos y recurrentes.

set.seed(108)
ventas <- data.frame(
  cliente = rep(c("Nuevo", "Recurrente"), each = 20),
  cantidad = c(rpois(20, 3), rpois(20, 6))
)
aggregate(cantidad ~ cliente, data = ventas, summary)
library(ggplot2)
ggplot(ventas, aes(x = cliente, y = cantidad)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Cuál tipo de cliente compra más productos?
  • ¿Qué tan homogéneo es el comportamiento por grupo?
  • ¿Cómo podrían usarse estos datos para fidelización?

🔹 Problema 10: Tiempo promedio de resolución de incidencias

Contexto: El área de soporte registra el tiempo (en horas) para resolver casos reportados por usuarios.

set.seed(109)
tiempos <- data.frame(
  caso = 1:25,
  resolucion_horas = rnorm(25, 6, 1.5)
)
summary(tiempos$resolucion_horas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.062   5.394   5.848   6.391   7.622  10.662
hist(tiempos$resolucion_horas, main="Tiempo de resolución de incidencias", xlab="Horas")

❓ Preguntas de análisis:

  • ¿Cuál es el tiempo promedio de resolución?
  • ¿Hay casos con resolución inusualmente lenta?
  • ¿Cómo podría optimizarse el proceso con base en estos datos?

📘 Eje Economía

🔹 Problema 1: Comparación del ingreso per cápita entre regiones

Contexto: Se desea comparar el ingreso per cápita entre cinco regiones del país para estudiar la desigualdad económica.

set.seed(201)
ingresos <- data.frame(
  region = rep(c("Norte", "Centro", "Sur", "Occidente", "Sureste"), each = 10),
  ingreso_pc = c(rnorm(10, 18000, 2000), rnorm(10, 16500, 1800), rnorm(10, 14000, 2200),
                 rnorm(10, 16000, 1500), rnorm(10, 13500, 2500))
)
aggregate(ingreso_pc ~ region, data = ingresos, summary)
library(ggplot2)
ggplot(ingresos, aes(x = region, y = ingreso_pc)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué región muestra mayor ingreso promedio?
  • ¿Dónde se observa más desigualdad interna?
  • ¿Qué acciones podrían tomarse desde la política pública?

🔹 Problema 2: Tasa de inflación anual por estado

Contexto: Se analizan los niveles de inflación anual en ocho estados con el fin de identificar zonas con mayor variabilidad.

set.seed(202)
inflacion <- data.frame(
  estado = rep(c("A", "B", "C", "D", "E", "F", "G", "H"), each = 6),
  tasa = rnorm(48, mean = 5, sd = 1.2)
)
aggregate(tasa ~ estado, data = inflacion, summary)
library(ggplot2)
ggplot(inflacion, aes(x = estado, y = tasa)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué estado tiene menor tasa promedio de inflación?
  • ¿Cuál muestra mayor dispersión?
  • ¿Cómo influye esto en decisiones económicas locales?

🔹 Problema 3: Distribución del PIB sectorial

Contexto: Se comparan los valores del PIB en tres sectores: agrícola, industrial y servicios.

set.seed(203)
pib <- data.frame(
  sector = rep(c("Agrícola", "Industrial", "Servicios"), each = 8),
  valor = c(rnorm(8, 200, 50), rnorm(8, 500, 80), rnorm(8, 1000, 100))
)
aggregate(valor ~ sector, data = pib, summary)
library(ggplot2)
ggplot(pib, aes(x = sector, y = valor)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué sector genera más valor económico?
  • ¿Existe algún valor atípico importante?
  • ¿Qué implicaciones tiene para la inversión sectorial?

🔹 Problema 4: Comparación del salario mínimo por región

Contexto: Se analizan los datos del salario mínimo diario promedio en distintas zonas geográficas.

set.seed(204)
salarios <- data.frame(
  zona = rep(c("Frontera", "Centro", "Sur", "Occidente"), each = 6),
  salario_minimo = c(rnorm(6, 250, 10), rnorm(6, 200, 15), rnorm(6, 180, 20), rnorm(6, 210, 12))
)
aggregate(salario_minimo ~ zona, data = salarios, summary)
library(ggplot2)
ggplot(salarios, aes(x = zona, y = salario_minimo)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué zona presenta el salario más alto?
  • ¿Cuál muestra mayor variabilidad?
  • ¿Qué políticas podrían corregir desequilibrios?

🔹 Problema 5: Índice de desempleo por entidad

Contexto: Se examina el comportamiento del desempleo en 10 entidades federativas.

set.seed(205)
desempleo <- data.frame(
  entidad = rep(paste("Entidad", 1:10), each = 1),
  tasa = rnorm(10, 4.5, 1.1)
)
barplot(desempleo$tasa, names.arg = desempleo$entidad, las=2)

summary(desempleo$tasa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.614   4.195   4.484   4.561   4.846   6.778

❓ Preguntas de análisis:

  • ¿Qué entidad tiene la tasa más alta de desempleo?
  • ¿Cuál tiene la menor?
  • ¿Qué factores podrían explicar estas diferencias?

🔹 Problema 6: Nivel de deuda pública como porcentaje del PIB

Contexto: Se comparan los niveles de deuda pública respecto al PIB de 6 países latinoamericanos.

set.seed(206)
deuda <- data.frame(
  pais = c("México", "Brasil", "Chile", "Colombia", "Argentina", "Perú"),
  porcentaje_pib = c(52, 88, 33, 61, 90, 34)
)
barplot(deuda$porcentaje_pib, names.arg = deuda$pais, col="skyblue")

❓ Preguntas de análisis:

  • ¿Qué país muestra mayor nivel de endeudamiento?
  • ¿Qué país tiene menor exposición?
  • ¿Qué políticas podrían aplicar los más endeudados?

🔹 Problema 7: Tasa de crecimiento económico interanual

Contexto: Se observan las tasas de crecimiento económico durante 5 años recientes en un país.

set.seed(207)
crecimiento <- data.frame(
  año = 2018:2022,
  tasa = c(2.3, -0.1, -8.3, 4.8, 3.1)
)
plot(crecimiento$año, crecimiento$tasa, type="b", col="blue", pch=19, main="Crecimiento Económico Anual")

❓ Preguntas de análisis:

  • ¿En qué año se registró el menor crecimiento?
  • ¿Cuántos años hubo crecimiento positivo?
  • ¿Qué eventos podrían explicar los cambios abruptos?

🔹 Problema 8: Ingreso promedio según nivel educativo

Contexto: Se comparan ingresos promedio entre personas con secundaria, preparatoria y universidad.

set.seed(208)
educacion <- data.frame(
  nivel = rep(c("Secundaria", "Preparatoria", "Universidad"), each = 15),
  ingreso = c(rnorm(15, 8000, 1000), rnorm(15, 10000, 1200), rnorm(15, 15000, 1500))
)
library(ggplot2)
ggplot(educacion, aes(x = nivel, y = ingreso)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el mayor ingreso promedio?
  • ¿Existe mayor variabilidad en alguno?
  • ¿Cómo se relaciona esto con movilidad social?

🔹 Problema 9: Consumo energético per cápita por país

Contexto: Se comparan los niveles de consumo energético en distintos países.

energia <- data.frame(
  pais = c("México", "EE.UU", "Brasil", "Canadá", "Argentina"),
  consumo_pc = c(1700, 12000, 2500, 15000, 2000)
)
barplot(energia$consumo_pc, names.arg = energia$pais, col="orange")

❓ Preguntas de análisis:

  • ¿Qué país tiene mayor consumo energético?
  • ¿Cuál es el más eficiente?
  • ¿Qué implicaciones tiene para la sostenibilidad?

🔹 Problema 10: Variación del tipo de cambio mensual

Contexto: Se estudia la evolución del tipo de cambio USD-MXN durante un año.

set.seed(209)
meses <- month.abb[1:12]
tipo_cambio <- data.frame(
  mes = meses,
  tasa = round(runif(12, 18.5, 21.0), 2)
)
library(ggplot2)

ggplot(tipo_cambio, aes(x = mes, y = tasa, group = 1)) +
  geom_line(color = "darkgreen") +
  geom_point(color = "darkgreen") +
  labs(title = "Tipo de cambio USD-MXN", x = "Mes", y = "Tasa")

❓ Preguntas de análisis:

  • ¿Cuál fue el mes con mayor tipo de cambio?
  • ¿Dónde se presentó la menor tasa?
  • ¿Qué factores pueden influir en esta variabilidad?

📘 Área: Comportamiento Alimentario

🔹 Problema 1: Frecuencia de consumo de frutas

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(301)
grupo_edad <- data.frame(
  grupo = rep(c("Adolescentes", "Adultos", "Adultos Mayores"), each = 2),
  porciones = c(rpois(10, 10), rpois(10, 8), rpois(10, 6))
)
library(ggplot2)
ggplot(grupo_edad, aes(x = grupo, y = porciones)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Cuál grupo consume más frutas?
  • ¿Qué grupo muestra más variabilidad?

🔹 Problema 2: Preferencia de desayuno

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(302)
tipo <- data.frame(
  grupo = rep(c("Tradicional", "Rápido", "Saludable"), each = 2),
  tipo = c(sample(c("Tradicional", "Rápido", "Saludable"), 90, replace=TRUE, prob=c(0.3,0.4,0.3)))
)
library(ggplot2)
ggplot(tipo, aes(x = grupo, y = tipo)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Cuál es el desayuno más elegido?
  • ¿Cómo fomentar elecciones más saludables?

🔹 Problema 3: Nivel de saciedad por tipo de comida

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(303)
tipo_comida <- data.frame(
  grupo = rep(c("Casera", "Procesada", "Mixta"), each = 3),
  nivel = c(rnorm(12, 8, 1), rnorm(12, 6, 1.5), rnorm(12, 7, 1))
)
library(ggplot2)
ggplot(tipo_comida, aes(x = grupo, y = nivel)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué tipo produce mayor saciedad?
  • ¿Qué tipo muestra mayor dispersión?

🔹 Problema 4: IMC por carrera

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(304)
carrera <- data.frame(
  grupo = rep(c("Nutrición", "Psicología", "Administración"), each = 10),
  valor = c(rnorm(10, 22, 15), rnorm(10, 24, 2), rnorm(10, 25, 25))
)
library(ggplot2)
ggplot(carrera, aes(x = grupo, y = valor)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué grupo tiene menor IMC promedio?
  • ¿Cuál tiene mayor variabilidad?

🔹 Problema 5: Horas de sueño y consumo calórico

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(305)
sueño <- data.frame(
  horas_sueno = rnorm(30, 7, 1.5),
  calorias_noche = rnorm(30, 600, 150)
)
plot(sueño$horas_sueno, sueño$calorias_noche)

❓ Preguntas de análisis:

  • ¿Existe relación entre sueño y consumo?
  • ¿Qué otras variables podrían intervenir?

🔹 Problema 6: Bebidas azucaradas por género

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(306)
genero <- data.frame(
  grupo = rep(c("Hombre", "Mujer"), each = 15),
  cantidad = c(rpois(15, 5), rpois(15, 3))
)
library(ggplot2)
ggplot(genero, aes(x = grupo, y = cantidad)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué género consume más bebidas?
  • ¿Qué estrategias de reducción aplicar?

🔹 Problema 7: Preferencia por snacks

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(307)
tipo <- data.frame(
  grupo = rep(c("Saludable", "No saludable"), each = 3),
  tipo = c(sample(c("Saludable", "No saludable"), 60, replace=TRUE, prob=c(0.4,0.6)))
)
library(ggplot2)
ggplot(tipo, aes(x = grupo, y = tipo)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué tipo prefieren los estudiantes?
  • ¿Qué papel juega la educación nutricional?

🔹 Problema 8: Ansiedad alimentaria

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(308)
ansiedad <- data.frame(
  estudiante = paste('Est', 1:30),
  nivel = rnorm(30, 7.5, 1.2)
)
hist(ansiedad$nivel)

❓ Preguntas de análisis:

  • ¿Cuál es el nivel promedio?
  • ¿Qué intervenciones se podrían sugerir?

🔹 Problema 9: Estrés vs antojos

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(309)
estres <- data.frame(
  estres = rnorm(30, 6, 1.5),
  antojos = rnorm(30, 4, 1.2)
)
plot(estres$estres, estres$antojos)

❓ Preguntas de análisis:

  • ¿Existe correlación visual?
  • ¿Qué programas podrían mitigar este patrón?

🔹 Problema 10: Número de comidas por estilo de vida

Contexto: Se presenta una situación simulada relacionada con el comportamiento alimentario.

set.seed(310)
estilo <- data.frame(
  grupo = rep(c("Sedentario", "Activo", "Atleta"), each = 10),
  num_comidas = c(rnorm(10, 3, 0.5), rnorm(10, 4, 0.4), rnorm(10, 5, 0.6))
)
library(ggplot2)
ggplot(estilo, aes(x = grupo, y = num_comidas)) + geom_boxplot()

❓ Preguntas de análisis:

  • ¿Qué estilo presenta mayor número de comidas?

🧠 Nivel Posgrado

📘 Área: Negocios (Posgrado)

🔹 Problema 1: Análisis de ingresos por departamento

Contexto: Una empresa multinacional desea comparar el desempeño de ingresos de tres departamentos clave para determinar si la asignación de recursos ha sido eficiente.

set.seed(401)
ingresos <- data.frame(
  grupo = rep(c("Ventas", "Marketing", "Producción"), each = 10),
  monto = c(rnorm(10, 70000, 8000), rnorm(10, 65000, 7000), rnorm(10, 60000, 6000))
)
library(ggplot2)
ggplot(ingresos, aes(x = grupo, y = monto)) + geom_boxplot() + labs(title = 'Análisis de ingresos por departamento')

summary(ingresos)
##     grupo               monto      
##  Length:30          Min.   :53585  
##  Class :character   1st Qu.:61926  
##  Mode  :character   Median :66161  
##                     Mean   :66077  
##                     3rd Qu.:69147  
##                     Max.   :80027

❓ Preguntas de análisis:

  • ¿Cuál departamento muestra mayor promedio de ingresos?
  • ¿Qué dice la dispersión sobre la estabilidad financiera de cada área?
  • ¿Cómo podrían usarse estos resultados para asignar presupuesto?

🔹 Problema 2: Tiempo de entrega promedio por región

Contexto: La dirección logística está evaluando el desempeño en la entrega de pedidos según la región geográfica, con el objetivo de optimizar su red de distribución.

set.seed(402)
region <- data.frame(
  grupo = rep(c("Norte", "Centro", "Sur"), each = 10),
  tiempo = c(rnorm(10, 3, 0.5), rnorm(10, 4, 0.6), rnorm(10, 5, 0.7))
)
library(ggplot2)
ggplot(region, aes(x = grupo, y = tiempo)) + geom_boxplot() + labs(title = 'Tiempo de entrega promedio por región')

summary(region)
##     grupo               tiempo     
##  Length:30          Min.   :2.661  
##  Class :character   1st Qu.:3.463  
##  Mode  :character   Median :4.083  
##                     Mean   :4.146  
##                     3rd Qu.:4.842  
##                     Max.   :6.203

❓ Preguntas de análisis:

  • ¿Qué región tiene el menor tiempo promedio de entrega?
  • ¿Qué implicaciones operativas se derivan de estos resultados?
  • ¿Cómo se relaciona la dispersión con eficiencia logística?

🔹 Problema 3: Nivel de satisfacción del cliente por sucursal

Contexto: Se ha realizado una encuesta de satisfacción a clientes frecuentes en tres sucursales, y la gerencia busca identificar diferencias sustanciales en la experiencia ofrecida.

set.seed(403)
sucursal <- data.frame(
  grupo = rep(c("Sucursal A", "Sucursal B", "Sucursal C"), each = 10),
  satisfaccion = c(rnorm(10, 8.5, 0.7), rnorm(10, 7.8, 0.9), rnorm(10, 8.1, 0.8))
)
library(ggplot2)
ggplot(sucursal, aes(x = grupo, y = satisfaccion)) + geom_boxplot() + labs(title = 'Nivel de satisfacción del cliente por sucursal')

summary(sucursal)
##     grupo            satisfaccion   
##  Length:30          Min.   : 6.633  
##  Class :character   1st Qu.: 7.635  
##  Mode  :character   Median : 8.026  
##                     Mean   : 8.179  
##                     3rd Qu.: 8.726  
##                     Max.   :10.337

❓ Preguntas de análisis:

  • ¿Qué sucursal presenta el mayor nivel medio de satisfacción?
  • ¿Qué tan homogénea es la experiencia del cliente entre sucursales?
  • ¿Cómo puede esta información guiar un rediseño del servicio?

🔹 Problema 4: Utilidad mensual por tipo de producto

Contexto: El área financiera está comparando las utilidades mensuales generadas por diferentes líneas de productos, como parte del análisis para redefinir su catálogo estratégico.

set.seed(404)
producto <- data.frame(
  grupo = rep(c("Electrónica", "Ropa", "Alimentos"), each = 10),
  utilidad = c(rnorm(10, 10000, 2000), rnorm(10, 8000, 2500), rnorm(10, 9000, 1500))
)
library(ggplot2)
ggplot(producto, aes(x = grupo, y = utilidad)) + geom_boxplot() + labs(title = 'Utilidad mensual por tipo de producto')

summary(producto)
##     grupo              utilidad    
##  Length:30          Min.   : 4416  
##  Class :character   1st Qu.: 7533  
##  Mode  :character   Median : 9011  
##                     Mean   : 8958  
##                     3rd Qu.:10290  
##                     Max.   :13273

❓ Preguntas de análisis:

  • ¿Qué línea de productos aporta más utilidad?
  • ¿Qué conclusiones estratégicas se pueden derivar de la dispersión?
  • ¿Cómo usar estos datos para planificar lanzamientos?

🔹 Problema 5: Comparativa de salarios por nivel de experiencia

Contexto: Recursos Humanos necesita evaluar las diferencias salariales por nivel de experiencia para diseñar una política de compensaciones más equitativa y competitiva.

set.seed(405)
experiencia <- data.frame(
  grupo = rep(c("Junior", "Semi-senior", "Senior"), each = 10),
  salario = c(rnorm(10, 25000, 2000), rnorm(10, 35000, 2500), rnorm(10, 45000, 3000))
)
library(ggplot2)
ggplot(experiencia, aes(x = grupo, y = salario)) + geom_boxplot() + labs(title = 'Comparativa de salarios por nivel de experiencia')

summary(experiencia)
##     grupo              salario     
##  Length:30          Min.   :22089  
##  Class :character   1st Qu.:26020  
##  Mode  :character   Median :36120  
##                     Mean   :35074  
##                     3rd Qu.:43685  
##                     Max.   :47166

❓ Preguntas de análisis:

  • ¿Existe una brecha salarial clara entre niveles?
  • ¿Qué dice la dispersión sobre la equidad interna?
  • ¿Cómo comunicar estas estadísticas a Recursos Humanos?

🔹 Problema 6: Rotación de personal por trimestre

Contexto: El departamento de talento humano está monitoreando la rotación trimestral de personal con el fin de identificar patrones estacionales y reducir costos de reclutamiento.

set.seed(406)
trimestre <- data.frame(
  grupo = rep(c("Q1", "Q2", "Q3", "Q4"), each = 10),
  salidas = c(rpois(4, 5))
)
library(ggplot2)
ggplot(trimestre, aes(x = grupo, y = salidas)) + geom_boxplot() + labs(title = 'Rotación de personal por trimestre')

summary(trimestre)
##     grupo              salidas    
##  Length:40          Min.   : 3.0  
##  Class :character   1st Qu.: 4.5  
##  Mode  :character   Median : 6.5  
##                     Mean   : 6.5  
##                     3rd Qu.: 8.5  
##                     Max.   :10.0

❓ Preguntas de análisis:

  • ¿En qué trimestre hay mayor rotación?
  • ¿Qué acciones pueden asociarse a estos cambios?
  • ¿Qué estrategias podrían implementarse para disminuirla?

🔹 Problema 7: Gastos de capacitación por área

Contexto: La gerencia de capacitación busca analizar la inversión hecha por distintas áreas para evaluar el retorno esperado de las actividades formativas implementadas.

set.seed(407)
area <- data.frame(
  grupo = rep(c("Comercial", "Técnica", "Administrativa"), each = 10),
  gasto = c(rnorm(10, 15000, 2000), rnorm(10, 18000, 1500), rnorm(10, 13000, 1000))
)
library(ggplot2)
ggplot(area, aes(x = grupo, y = gasto)) + geom_boxplot() + labs(title = 'Gastos de capacitación por área')

summary(area)
##     grupo               gasto      
##  Length:30          Min.   :10491  
##  Class :character   1st Qu.:13226  
##  Mode  :character   Median :14794  
##                     Mean   :14915  
##                     3rd Qu.:16408  
##                     Max.   :20565

❓ Preguntas de análisis:

  • ¿Qué área tiene mayor inversión en capacitación?
  • ¿Es proporcional el gasto a la especialización requerida?
  • ¿Qué decisiones estratégicas podrían tomarse?

🔹 Problema 8: Tasa de conversión por canal de ventas

Contexto: El equipo de ventas realiza un estudio comparativo de la efectividad de cada canal de venta en función de su tasa de conversión para rediseñar su estrategia comercial.

set.seed(408)
canal <- data.frame(
  grupo = rep(c("Presencial", "Web", "Teléfono"), each = 10),
  conversion = c(rnorm(10, 12, 1.5), rnorm(10, 15, 2), rnorm(10, 10, 1))
)
library(ggplot2)
ggplot(canal, aes(x = grupo, y = conversion)) + geom_boxplot() + labs(title = 'Tasa de conversión por canal de ventas')

summary(canal)
##     grupo             conversion    
##  Length:30          Min.   : 7.486  
##  Class :character   1st Qu.:10.140  
##  Mode  :character   Median :11.345  
##                     Mean   :11.895  
##                     3rd Qu.:13.207  
##                     Max.   :17.901

❓ Preguntas de análisis:

  • ¿Qué canal es más eficaz para convertir ventas?
  • ¿Qué dice la dispersión sobre la consistencia del canal?
  • ¿Cómo reestructurar campañas con estos resultados?

🔹 Problema 9: Volumen de ventas por segmento de cliente

Contexto: Marketing está evaluando el volumen de ventas por tipo de cliente para reorientar los recursos hacia los segmentos más rentables y potenciales.

set.seed(409)
segmento <- data.frame(
  grupo = rep(c("Corporativo", "Pymes", "Freelance"), each = 10),
  ventas = c(rnorm(10, 80000, 7000), rnorm(10, 50000, 5000), rnorm(10, 30000, 4000))
)
library(ggplot2)
ggplot(segmento, aes(x = grupo, y = ventas)) + geom_boxplot() + labs(title = 'Volumen de ventas por segmento de cliente')

summary(segmento)
##     grupo               ventas     
##  Length:30          Min.   :23713  
##  Class :character   1st Qu.:32562  
##  Mode  :character   Median :51945  
##                     Mean   :54537  
##                     3rd Qu.:78448  
##                     Max.   :92900

❓ Preguntas de análisis:

  • ¿Qué segmento genera mayor volumen de ventas?
  • ¿Qué variabilidad se observa en cada uno?
  • ¿Cómo enfocar campañas de fidelización?

🔹 Problema 10: Duración de procesos internos por área

Contexto: El área de mejora continua está interesada en conocer cuánto tiempo toman distintos departamentos para completar sus procesos internos clave, como base para automatizaciones.

set.seed(410)
area <- data.frame(
  grupo = rep(c("Finanzas", "Recursos Humanos", "IT"), each = 10),
  duracion = c(rnorm(10, 5, 0.5), rnorm(10, 6, 0.7), rnorm(10, 4, 0.4))
)
library(ggplot2)
ggplot(area, aes(x = grupo, y = duracion)) + geom_boxplot() + labs(title = 'Duración de procesos internos por área')

summary(area)
##     grupo              duracion    
##  Length:30          Min.   :3.178  
##  Class :character   1st Qu.:4.268  
##  Mode  :character   Median :5.036  
##                     Mean   :4.921  
##                     3rd Qu.:5.427  
##                     Max.   :6.877

❓ Preguntas de análisis:

  • ¿Qué área tarda más en completar sus procesos?
  • ¿Qué indica la variabilidad de tiempos?
  • ¿Qué procesos deben optimizarse primero?

📊 Área: Economía (Posgrado)

🔹 Problema 1: Tasa de crecimiento económico anual por región

Contexto: Se desea comparar el crecimiento económico regional para analizar la efectividad de políticas de desarrollo regional.

set.seed(501)
region <- data.frame(
  grupo = rep(c("Norte", "Centro", "Sur"), each = 10),
  crecimiento = c(rnorm(10, 2.5, 0.4), rnorm(10, 2.8, 0.5), rnorm(10, 2.1, 0.3))
)
library(ggplot2)
ggplot(region, aes(x = grupo, y = crecimiento)) + geom_boxplot() + labs(title = 'Tasa de crecimiento económico anual por región')

summary(region)
##     grupo            crecimiento   
##  Length:30          Min.   :1.704  
##  Class :character   1st Qu.:2.168  
##  Mode  :character   Median :2.544  
##                     Mean   :2.530  
##                     3rd Qu.:2.819  
##                     Max.   :3.349

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 2: Índice de inflación mensual en diferentes países

Contexto: Un análisis comparativo de la inflación busca entender el impacto de las políticas monetarias en tres países latinoamericanos.

set.seed(502)
pais <- data.frame(
  grupo = rep(c("México", "Chile", "Argentina"), each = 10),
  inflacion = c(rnorm(10, 4.2, 0.5), rnorm(10, 3.6, 0.3), rnorm(10, 7.5, 1))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = inflacion)) + geom_boxplot() + labs(title = 'Índice de inflación mensual en diferentes países')

summary(pais)
##     grupo             inflacion    
##  Length:30          Min.   :3.065  
##  Class :character   1st Qu.:3.634  
##  Mode  :character   Median :4.189  
##                     Mean   :5.052  
##                     3rd Qu.:6.734  
##                     Max.   :8.693

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 3: Exportaciones de alta tecnología por sector

Contexto: Se analiza la contribución por sector a las exportaciones tecnológicas en economías emergentes.

set.seed(503)
sector <- data.frame(
  grupo = rep(c("Electrónica", "Farmacéutica", "Automotriz"), each = 10),
  exportaciones = c(rnorm(10, 500, 50), rnorm(10, 450, 60), rnorm(10, 700, 80))
)
library(ggplot2)
ggplot(sector, aes(x = grupo, y = exportaciones)) + geom_boxplot() + labs(title = 'Exportaciones de alta tecnología por sector')

summary(sector)
##     grupo           exportaciones  
##  Length:30          Min.   :406.9  
##  Class :character   1st Qu.:461.3  
##  Mode  :character   Median :516.0  
##                     Mean   :575.8  
##                     3rd Qu.:669.8  
##                     Max.   :906.7

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 4: Tasa de desempleo por nivel educativo

Contexto: Un estudio del desempleo por nivel educativo busca sustentar propuestas de política laboral.

set.seed(504)
educacion <- data.frame(
  grupo = rep(c("Básico", "Medio", "Superior"), each = 10),
  desempleo = c(rnorm(10, 6.8, 0.6), rnorm(10, 5.2, 0.5), rnorm(10, 3.1, 0.4))
)
library(ggplot2)
ggplot(educacion, aes(x = grupo, y = desempleo)) + geom_boxplot() + labs(title = 'Tasa de desempleo por nivel educativo')

summary(educacion)
##     grupo             desempleo    
##  Length:30          Min.   :2.500  
##  Class :character   1st Qu.:3.378  
##  Mode  :character   Median :5.586  
##                     Mean   :5.199  
##                     3rd Qu.:6.593  
##                     Max.   :8.719

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 5: Ingreso per cápita anual por país

Contexto: Se comparan niveles de ingreso per cápita para evaluar avances en equidad y desarrollo.

set.seed(505)
pais <- data.frame(
  grupo = rep(c("Colombia", "Perú", "Brasil"), each = 10),
  ingreso = c(rnorm(10, 8500, 700), rnorm(10, 9100, 600), rnorm(10, 10500, 900))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = ingreso)) + geom_boxplot() + labs(title = 'Ingreso per cápita anual por país')

summary(pais)
##     grupo              ingreso     
##  Length:30          Min.   : 7072  
##  Class :character   1st Qu.: 8201  
##  Mode  :character   Median : 8966  
##                     Mean   : 9257  
##                     3rd Qu.:10148  
##                     Max.   :11820

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 6: Gasto público en educación como % del PIB

Contexto: Un análisis del esfuerzo fiscal en educación permite valorar prioridades nacionales.

set.seed(506)
pais <- data.frame(
  grupo = rep(c("Costa Rica", "Uruguay", "Paraguay"), each = 10),
  gasto = c(rnorm(10, 5.8, 0.4), rnorm(10, 6.2, 0.3), rnorm(10, 4.9, 0.5))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = gasto)) + geom_boxplot() + labs(title = 'Gasto público en educación como % del PIB')

summary(pais)
##     grupo               gasto      
##  Length:30          Min.   :3.759  
##  Class :character   1st Qu.:5.157  
##  Mode  :character   Median :5.879  
##                     Mean   :5.720  
##                     3rd Qu.:6.299  
##                     Max.   :6.644

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 7: Variación del tipo de cambio en contextos inflacionarios

Contexto: Se estudia la relación entre inflación y tipo de cambio en países con diferente estabilidad macroeconómica.

set.seed(507)
pais <- data.frame(
  grupo = rep(c("México", "Argentina", "Brasil"), each = 10),
  cambio = c(rnorm(10, 0.5, 0.1), rnorm(10, 2.0, 0.4), rnorm(10, 1.1, 0.2))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = cambio)) + geom_boxplot() + labs(title = 'Variación del tipo de cambio en contextos inflacionarios')

summary(pais)
##     grupo               cambio      
##  Length:30          Min.   :0.3799  
##  Class :character   1st Qu.:0.5975  
##  Mode  :character   Median :1.1129  
##                     Mean   :1.2502  
##                     3rd Qu.:1.9196  
##                     Max.   :2.7717

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 8: Producción agrícola por entidad federativa

Contexto: El análisis regional de la producción agrícola busca orientar subsidios e inversión pública.

set.seed(508)
estado <- data.frame(
  grupo = rep(c("Sinaloa", "Jalisco", "Veracruz"), each = 10),
  produccion = c(rnorm(10, 1200, 150), rnorm(10, 1000, 100), rnorm(10, 1100, 130))
)
library(ggplot2)
ggplot(estado, aes(x = grupo, y = produccion)) + geom_boxplot() + labs(title = 'Producción agrícola por entidad federativa')

summary(estado)
##     grupo             produccion    
##  Length:30          Min.   : 760.6  
##  Class :character   1st Qu.: 989.2  
##  Mode  :character   Median :1082.6  
##                     Mean   :1073.7  
##                     3rd Qu.:1152.5  
##                     Max.   :1361.9

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 9: Tasa de inversión extranjera directa (IED) como % del PIB

Contexto: La comparación de IED busca evaluar la capacidad de atracción de capital externo en economías con distinta apertura comercial.

set.seed(509)
pais <- data.frame(
  grupo = rep(c("México", "Vietnam", "Corea del Sur"), each = 10),
  ied = c(rnorm(10, 2.4, 0.5), rnorm(10, 6.5, 1), rnorm(10, 3.2, 0.6))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = ied)) + geom_boxplot() + labs(title = 'Tasa de inversión extranjera directa (IED) como % del PIB')

summary(pais)
##     grupo                ied       
##  Length:30          Min.   :1.423  
##  Class :character   1st Qu.:2.580  
##  Mode  :character   Median :3.322  
##                     Mean   :3.999  
##                     3rd Qu.:5.965  
##                     Max.   :7.845

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🔹 Problema 10: Número de artículos científicos en economía por país

Contexto: El análisis de publicaciones busca entender las capacidades de investigación económica en América Latina.

set.seed(510)
pais <- data.frame(
  grupo = rep(c("Chile", "México", "Colombia"), each = 10),
  articulos = c(rnorm(10, 500, 60), rnorm(10, 800, 70), rnorm(10, 600, 65))
)
library(ggplot2)
ggplot(pais, aes(x = grupo, y = articulos)) + geom_boxplot() + labs(title = 'Número de artículos científicos en economía por país')

summary(pais)
##     grupo             articulos    
##  Length:30          Min.   :364.6  
##  Class :character   1st Qu.:509.1  
##  Mode  :character   Median :618.4  
##                     Mean   :639.0  
##                     3rd Qu.:770.3  
##                     Max.   :882.2

❓ Preguntas de análisis:

  • ¿Qué grupo muestra el valor medio más alto y qué implicaciones tiene?
  • ¿La variabilidad observada es significativa entre los grupos?
  • ¿Cómo se podrían aplicar estos resultados para toma de decisiones en política económica?

🍽 Área: Comportamiento Alimentario (Posgrado)

🔹 Problema 1: Consumo de frutas por día según tipo de dieta

Contexto: Se desea conocer cómo varía el consumo promedio de frutas en diferentes tipos de dieta como parte de un estudio longitudinal de hábitos saludables.

set.seed(601)
dieta <- data.frame(
  grupo = rep(c("Omnívoro", "Vegetariano", "Vegano"), each = 10),
  frutas = c(rnorm(10, 1.8, 0.4), rnorm(10, 2.3, 0.3), rnorm(10, 2.6, 0.5))
)
library(ggplot2)
ggplot(dieta, aes(x = grupo, y = frutas)) + geom_boxplot() + labs(title = 'Consumo de frutas por día según tipo de dieta')

summary(dieta)
##     grupo               frutas     
##  Length:30          Min.   :1.102  
##  Class :character   1st Qu.:1.804  
##  Mode  :character   Median :2.180  
##                     Mean   :2.144  
##                     3rd Qu.:2.461  
##                     Max.   :2.891

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 2: Horas de ayuno intermitente según edad

Contexto: Un grupo de investigación analiza si el patrón de ayuno intermitente varía por edad para evaluar adherencia y tolerancia.

set.seed(602)
edad_grupo <- data.frame(
  grupo = rep(c("18-30", "31-50", "51-70"), each = 10),
  ayuno_horas = c(rnorm(10, 14, 1), rnorm(10, 15, 1.2), rnorm(10, 16, 0.8))
)
library(ggplot2)
ggplot(edad_grupo, aes(x = grupo, y = ayuno_horas)) + geom_boxplot() + labs(title = 'Horas de ayuno intermitente según edad')

summary(edad_grupo)
##     grupo            ayuno_horas   
##  Length:30          Min.   :11.60  
##  Class :character   1st Qu.:13.45  
##  Mode  :character   Median :15.01  
##                     Mean   :14.82  
##                     3rd Qu.:16.07  
##                     Max.   :17.35

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 3: Porciones promedio de alimentos ultraprocesados por semana

Contexto: Estudio enfocado en el consumo de ultraprocesados en relación al estilo de vida físico y sus implicaciones metabólicas.

set.seed(603)
grupo <- data.frame(
  grupo = rep(c("Sedentario", "Activo", "Atleta"), each = 10),
  porciones = c(rnorm(10, 7, 1), rnorm(10, 5.5, 0.8), rnorm(10, 4, 1))
)
library(ggplot2)
ggplot(grupo, aes(x = grupo, y = porciones)) + geom_boxplot() + labs(title = 'Porciones promedio de alimentos ultraprocesados por semana')

summary(grupo)
##     grupo             porciones    
##  Length:30          Min.   :2.895  
##  Class :character   1st Qu.:4.337  
##  Mode  :character   Median :5.444  
##                     Mean   :5.710  
##                     3rd Qu.:6.920  
##                     Max.   :9.695

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 4: Nivel de saciedad reportado tras una comida estandarizada

Contexto: Se compara el nivel de saciedad subjetiva en función del tipo de macronutriente predominante en la comida.

set.seed(604)
tipo_comida <- data.frame(
  grupo = rep(c("Alta proteína", "Mixta", "Alta carbohidrato"), each = 10),
  saciedad = c(rnorm(10, 7.8, 1), rnorm(10, 6.9, 0.9), rnorm(10, 5.5, 1.2))
)
library(ggplot2)
ggplot(tipo_comida, aes(x = grupo, y = saciedad)) + geom_boxplot() + labs(title = 'Nivel de saciedad reportado tras una comida estandarizada')

summary(tipo_comida)
##     grupo              saciedad    
##  Length:30          Min.   :3.417  
##  Class :character   1st Qu.:5.985  
##  Mode  :character   Median :7.134  
##                     Mean   :6.869  
##                     3rd Qu.:7.706  
##                     Max.   :9.659

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 5: Calorías ingeridas en cenas fuera de casa según día de la semana

Contexto: Investigación sobre patrones de sobreconsumo calórico en fines de semana para diseñar intervenciones educativas.

set.seed(605)
dia <- data.frame(
  grupo = rep(c("Viernes", "Sábado", "Domingo"), each = 10),
  calorias = c(rnorm(10, 1100, 150), rnorm(10, 1300, 200), rnorm(10, 900, 180))
)
library(ggplot2)
ggplot(dia, aes(x = grupo, y = calorias)) + geom_boxplot() + labs(title = 'Calorías ingeridas en cenas fuera de casa según día de la semana')

summary(dia)
##     grupo              calorias     
##  Length:30          Min.   : 678.8  
##  Class :character   1st Qu.: 922.1  
##  Mode  :character   Median :1110.1  
##                     Mean   :1079.5  
##                     3rd Qu.:1189.6  
##                     Max.   :1543.7

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 6: Frecuencia semanal de consumo de snacks por tipo de jornada laboral

Contexto: Análisis de consumo de snacks en trabajadores con horarios distintos, orientado a prevenir el síndrome metabólico.

set.seed(606)
jornada <- data.frame(
  grupo = rep(c("Diurna", "Mixta", "Nocturna"), each = 10),
  snacks = c(rpois(10, 4), rpois(10, 6), rpois(10, 8))
)
library(ggplot2)
ggplot(jornada, aes(x = grupo, y = snacks)) + geom_boxplot() + labs(title = 'Frecuencia semanal de consumo de snacks por tipo de jornada laboral')

summary(jornada)
##     grupo               snacks      
##  Length:30          Min.   : 2.000  
##  Class :character   1st Qu.: 4.000  
##  Mode  :character   Median : 6.000  
##                     Mean   : 5.833  
##                     3rd Qu.: 7.750  
##                     Max.   :12.000

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 7: Índice de alimentación saludable (IAS) por nivel socioeconómico

Contexto: Se busca identificar desigualdades estructurales en la calidad de la dieta con base en el nivel socioeconómico.

set.seed(607)
nivel <- data.frame(
  grupo = rep(c("Bajo", "Medio", "Alto"), each = 10),
  ias = c(rnorm(10, 45, 5), rnorm(10, 55, 6), rnorm(10, 62, 7))
)
library(ggplot2)
ggplot(nivel, aes(x = grupo, y = ias)) + geom_boxplot() + labs(title = 'Índice de alimentación saludable (IAS) por nivel socioeconómico')

summary(nivel)
##     grupo                ias       
##  Length:30          Min.   :36.55  
##  Class :character   1st Qu.:50.24  
##  Mode  :character   Median :54.06  
##                     Mean   :54.07  
##                     3rd Qu.:58.19  
##                     Max.   :73.80

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 8: Niveles de hambre emocional según estado civil

Contexto: Evaluación del hambre emocional como variable de riesgo en distintos contextos afectivos.

set.seed(608)
estado <- data.frame(
  grupo = rep(c("Soltero", "Casado", "Separado"), each = 10),
  hambre = c(rnorm(10, 4.5, 0.6), rnorm(10, 3.8, 0.7), rnorm(10, 5.2, 0.8))
)
library(ggplot2)
ggplot(estado, aes(x = grupo, y = hambre)) + geom_boxplot() + labs(title = 'Niveles de hambre emocional según estado civil')

summary(estado)
##     grupo               hambre     
##  Length:30          Min.   :2.482  
##  Class :character   1st Qu.:4.159  
##  Mode  :character   Median :4.743  
##                     Mean   :4.484  
##                     3rd Qu.:4.989  
##                     Max.   :5.721

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 9: Calificación subjetiva de calidad de dieta según nivel educativo

Contexto: Encuesta nacional busca correlacionar percepción de calidad dietética con escolaridad.

set.seed(609)
educacion <- data.frame(
  grupo = rep(c("Primaria", "Media", "Superior"), each = 10),
  calidad = c(rnorm(10, 4.2, 0.7), rnorm(10, 5.5, 0.6), rnorm(10, 6.8, 0.5))
)
library(ggplot2)
ggplot(educacion, aes(x = grupo, y = calidad)) + geom_boxplot() + labs(title = 'Calificación subjetiva de calidad de dieta según nivel educativo')

summary(educacion)
##     grupo              calidad     
##  Length:30          Min.   :2.934  
##  Class :character   1st Qu.:4.326  
##  Mode  :character   Median :5.434  
##                     Mean   :5.314  
##                     3rd Qu.:6.325  
##                     Max.   :7.317

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?

🔹 Problema 10: Nivel de ansiedad alimentaria según tipo de intervención recibida

Contexto: Comparación del impacto de distintas intervenciones sobre la ansiedad alimentaria en pacientes con trastornos de la conducta alimentaria.

set.seed(610)
intervencion <- data.frame(
  grupo = rep(c("Psicoterapia", "Educación nutricional", "Combinada"), each = 10),
  ansiedad = c(rnorm(10, 6.2, 0.9), rnorm(10, 5.4, 0.7), rnorm(10, 4.1, 0.6))
)
library(ggplot2)
ggplot(intervencion, aes(x = grupo, y = ansiedad)) + geom_boxplot() + labs(title = 'Nivel de ansiedad alimentaria según tipo de intervención recibida')

summary(intervencion)
##     grupo              ansiedad    
##  Length:30          Min.   :2.871  
##  Class :character   1st Qu.:4.186  
##  Mode  :character   Median :5.028  
##                     Mean   :5.138  
##                     3rd Qu.:6.256  
##                     Max.   :7.236

❓ Preguntas de análisis:

  • ¿Qué grupo muestra los valores más extremos y qué explicación clínica puede tener?
  • ¿Cómo se distribuyen los datos? ¿Es posible identificar outliers?
  • ¿Qué recomendaciones de intervención o investigación se derivan del análisis descriptivo?