🎓 Licenciatura

📘 Eje de Negocios

🔹 Problema 1: Análisis de ventas trimestrales por categoría de producto

Contexto: Una empresa de comercio electrónico desea analizar sus ventas trimestrales de tres líneas de productos: Electrónica, Hogar y Deportes.

set.seed(101)
ventas <- data.frame(
  categoria = rep(c("Electrónica", "Hogar", "Deportes"), each = 4),
  ventas_trimestrales = c(rnorm(4, 150000, 10000), rnorm(4, 120000, 15000), rnorm(4, 90000, 12000))
)
aggregate(ventas_trimestrales ~ categoria, data = ventas, summary)

library(ggplot2)

## Warning: package 'ggplot2' was built under R version 4.4.3

ggplot(ventas, aes(x = categoria, y = ventas_trimestrales)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué categoría tiene mayores ventas promedio?
¿Cuál categoría muestra mayor variabilidad?
¿Qué decisiones comerciales podrían derivarse?

🔹 Problema 2: Comparación de ingresos semanales en sucursales

Contexto: Se desea comparar los ingresos semanales de tres sucursales de una cadena comercial durante un mes.

set.seed(102)
ingresos <- data.frame(
  sucursal = rep(c("Norte", "Centro", "Sur"), each = 4),
  ingreso_semanal = c(rnorm(4, 48000, 5000), rnorm(4, 50000, 4000), rnorm(4, 47000, 6000))
)
aggregate(ingreso_semanal ~ sucursal, data = ingresos, summary)

library(ggplot2)
ggplot(ingresos, aes(x = sucursal, y = ingreso_semanal)) + geom_boxplot()

❓ Preguntas de análisis:

¿Cuál sucursal presenta ingresos más estables?
¿Hay alguna diferencia significativa en la mediana?
¿Qué gráfica adicional apoyarías para la interpretación?

🔹 Problema 3: Satisfacción del cliente en tres servicios

Contexto: Una empresa midió la satisfacción del cliente en tres tipos de servicio: venta, postventa y soporte técnico.

set.seed(103)
satisfaccion <- data.frame(
  servicio = rep(c("Venta", "Postventa", "Soporte"), each = 10),
  puntaje = c(rnorm(10, 8.2, 0.5), rnorm(10, 7.5, 0.8), rnorm(10, 7.8, 0.6))
)
aggregate(puntaje ~ servicio, data = satisfaccion, summary)

library(ggplot2)
ggplot(satisfaccion, aes(x = servicio, y = puntaje)) + geom_boxplot()

❓ Preguntas de análisis:

¿Cuál servicio tiene menor dispersión en satisfacción?
¿Hay valores extremos? ¿Qué representan?
¿Qué servicio debería priorizar mejoras?

🔹 Problema 4: Tiempo de atención al cliente

Contexto: Se mide el tiempo de atención (en minutos) de 10 empleados en una semana de operaciones.

set.seed(104)
tiempos <- data.frame(
  empleado = paste0("E", 1:10),
  tiempo_atencion = rnorm(10, 12, 2)
)
summary(tiempos$tiempo_atencion)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.91   11.50   12.90   12.68   13.28   14.90

boxplot(tiempos$tiempo_atencion, main="Tiempo de atención", ylab="Minutos")

❓ Preguntas de análisis:

¿Cuál es el tiempo promedio de atención?
¿Existen tiempos atípicos?
¿Qué implicaciones tiene la dispersión observada?

🔹 Problema 5: Frecuencia de compras por día de la semana

Contexto: Una tienda registró el número de compras realizadas cada día durante 4 semanas.

compras <- data.frame(
  dia = rep(c("Lunes", "Martes", "Miércoles", "Jueves", "Viernes", "Sábado", "Domingo"), times = 4),
  cantidad = sample(80:160, 28, replace = TRUE)
)
aggregate(cantidad ~ dia, data = compras, mean)

barplot(tapply(compras$cantidad, compras$dia, mean), main="Promedio de compras por día", col="lightblue")

❓ Preguntas de análisis:

¿Qué día tiene mayor número promedio de compras?
¿Qué visualización alternativa sería útil?
¿Qué sugiere esto para la planificación operativa?

🔹 Problema 6: Número de devoluciones por categoría

Contexto: Una tienda desea conocer las categorías con mayor número de devoluciones para reducir pérdidas.

set.seed(105)
devoluciones <- data.frame(
  categoria = rep(c("Ropa", "Electrónica", "Hogar"), each = 6),
  cantidad = rpois(18, lambda = c(5, 7, 4))
)
aggregate(cantidad ~ categoria, data = devoluciones, summary)

library(ggplot2)
ggplot(devoluciones, aes(x = categoria, y = cantidad)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué categoría presenta mayor dispersión?
¿Cuál sería una estrategia basada en estos datos?
¿Qué otros factores deberían considerarse?

🔹 Problema 7: Horas trabajadas por semana en áreas operativas

Contexto: Se comparan las horas trabajadas por semana en 3 áreas operativas de una empresa.

set.seed(106)
horas <- data.frame(
  area = rep(c("Producción", "Logística", "Ventas"), each = 8),
  horas_trabajadas = c(rnorm(8, 42, 3), rnorm(8, 45, 2), rnorm(8, 40, 4))
)
aggregate(horas_trabajadas ~ area, data = horas, summary)

library(ggplot2)
ggplot(horas, aes(x = area, y = horas_trabajadas)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué área trabaja más horas en promedio?
¿Cuál muestra mayor consistencia?
¿Cómo se puede mejorar el balance laboral?

🔹 Problema 8: Rotación de personal por departamento

Contexto: Se analiza la rotación mensual de personal en cuatro departamentos durante seis meses.

set.seed(107)
rotacion <- data.frame(
  departamento = rep(c("Ventas", "RH", "TI", "Producción"), each = 6),
  rotacion_mensual = rpois(24, lambda = c(3, 2, 1, 4))
)
aggregate(rotacion_mensual ~ departamento, data = rotacion, summary)

library(ggplot2)
ggplot(rotacion, aes(x = departamento, y = rotacion_mensual)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué departamento presenta mayor rotación?
¿Hay alguno con valores extremos?
¿Qué decisiones de gestión se pueden tomar?

🔹 Problema 9: Número de productos vendidos por tipo de cliente

Contexto: Una empresa compara el comportamiento de compra entre clientes nuevos y recurrentes.

set.seed(108)
ventas <- data.frame(
  cliente = rep(c("Nuevo", "Recurrente"), each = 20),
  cantidad = c(rpois(20, 3), rpois(20, 6))
)
aggregate(cantidad ~ cliente, data = ventas, summary)

library(ggplot2)
ggplot(ventas, aes(x = cliente, y = cantidad)) + geom_boxplot()

❓ Preguntas de análisis:

¿Cuál tipo de cliente compra más productos?
¿Qué tan homogéneo es el comportamiento por grupo?
¿Cómo podrían usarse estos datos para fidelización?

🔹 Problema 10: Tiempo promedio de resolución de incidencias

Contexto: El área de soporte registra el tiempo (en horas) para resolver casos reportados por usuarios.

set.seed(109)
tiempos <- data.frame(
  caso = 1:25,
  resolucion_horas = rnorm(25, 6, 1.5)
)
summary(tiempos$resolucion_horas)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.062   5.394   5.848   6.391   7.622  10.662

hist(tiempos$resolucion_horas, main="Tiempo de resolución de incidencias", xlab="Horas")

❓ Preguntas de análisis:

¿Cuál es el tiempo promedio de resolución?
¿Hay casos con resolución inusualmente lenta?
¿Cómo podría optimizarse el proceso con base en estos datos?

📘 Eje Economía

🔹 Problema 1: Comparación del ingreso per cápita entre regiones

Contexto: Se desea comparar el ingreso per cápita entre cinco regiones del país para estudiar la desigualdad económica.

set.seed(201)
ingresos <- data.frame(
  region = rep(c("Norte", "Centro", "Sur", "Occidente", "Sureste"), each = 10),
  ingreso_pc = c(rnorm(10, 18000, 2000), rnorm(10, 16500, 1800), rnorm(10, 14000, 2200),
                 rnorm(10, 16000, 1500), rnorm(10, 13500, 2500))
)
aggregate(ingreso_pc ~ region, data = ingresos, summary)

library(ggplot2)
ggplot(ingresos, aes(x = region, y = ingreso_pc)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué región muestra mayor ingreso promedio?
¿Dónde se observa más desigualdad interna?
¿Qué acciones podrían tomarse desde la política pública?

🔹 Problema 2: Tasa de inflación anual por estado

Contexto: Se analizan los niveles de inflación anual en ocho estados con el fin de identificar zonas con mayor variabilidad.

set.seed(202)
inflacion <- data.frame(
  estado = rep(c("A", "B", "C", "D", "E", "F", "G", "H"), each = 6),
  tasa = rnorm(48, mean = 5, sd = 1.2)
)
aggregate(tasa ~ estado, data = inflacion, summary)

library(ggplot2)
ggplot(inflacion, aes(x = estado, y = tasa)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué estado tiene menor tasa promedio de inflación?
¿Cuál muestra mayor dispersión?
¿Cómo influye esto en decisiones económicas locales?

🔹 Problema 3: Distribución del PIB sectorial

Contexto: Se comparan los valores del PIB en tres sectores: agrícola, industrial y servicios.

set.seed(203)
pib <- data.frame(
  sector = rep(c("Agrícola", "Industrial", "Servicios"), each = 8),
  valor = c(rnorm(8, 200, 50), rnorm(8, 500, 80), rnorm(8, 1000, 100))
)
aggregate(valor ~ sector, data = pib, summary)

library(ggplot2)
ggplot(pib, aes(x = sector, y = valor)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué sector genera más valor económico?
¿Existe algún valor atípico importante?
¿Qué implicaciones tiene para la inversión sectorial?

🔹 Problema 4: Comparación del salario mínimo por región

Contexto: Se analizan los datos del salario mínimo diario promedio en distintas zonas geográficas.

set.seed(204)
salarios <- data.frame(
  zona = rep(c("Frontera", "Centro", "Sur", "Occidente"), each = 6),
  salario_minimo = c(rnorm(6, 250, 10), rnorm(6, 200, 15), rnorm(6, 180, 20), rnorm(6, 210, 12))
)
aggregate(salario_minimo ~ zona, data = salarios, summary)

library(ggplot2)
ggplot(salarios, aes(x = zona, y = salario_minimo)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué zona presenta el salario más alto?
¿Cuál muestra mayor variabilidad?
¿Qué políticas podrían corregir desequilibrios?

🔹 Problema 5: Índice de desempleo por entidad

Contexto: Se examina el comportamiento del desempleo en 10 entidades federativas.

set.seed(205)
desempleo <- data.frame(
  entidad = rep(paste("Entidad", 1:10), each = 1),
  tasa = rnorm(10, 4.5, 1.1)
)
barplot(desempleo$tasa, names.arg = desempleo$entidad, las=2)

summary(desempleo$tasa)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.614   4.195   4.484   4.561   4.846   6.778

❓ Preguntas de análisis:

¿Qué entidad tiene la tasa más alta de desempleo?
¿Cuál tiene la menor?
¿Qué factores podrían explicar estas diferencias?

🔹 Problema 6: Nivel de deuda pública como porcentaje del PIB

Contexto: Se comparan los niveles de deuda pública respecto al PIB de 6 países latinoamericanos.

set.seed(206)
deuda <- data.frame(
  pais = c("México", "Brasil", "Chile", "Colombia", "Argentina", "Perú"),
  porcentaje_pib = c(52, 88, 33, 61, 90, 34)
)
barplot(deuda$porcentaje_pib, names.arg = deuda$pais, col="skyblue")

❓ Preguntas de análisis:

¿Qué país muestra mayor nivel de endeudamiento?
¿Qué país tiene menor exposición?
¿Qué políticas podrían aplicar los más endeudados?

🔹 Problema 7: Tasa de crecimiento económico interanual

Contexto: Se observan las tasas de crecimiento económico durante 5 años recientes en un país.

set.seed(207)
crecimiento <- data.frame(
  año = 2018:2022,
  tasa = c(2.3, -0.1, -8.3, 4.8, 3.1)
)
plot(crecimiento$año, crecimiento$tasa, type="b", col="blue", pch=19, main="Crecimiento Económico Anual")

❓ Preguntas de análisis:

¿En qué año se registró el menor crecimiento?
¿Cuántos años hubo crecimiento positivo?
¿Qué eventos podrían explicar los cambios abruptos?

🔹 Problema 8: Ingreso promedio según nivel educativo

Contexto: Se comparan ingresos promedio entre personas con secundaria, preparatoria y universidad.

set.seed(208)
educacion <- data.frame(
  nivel = rep(c("Secundaria", "Preparatoria", "Universidad"), each = 15),
  ingreso = c(rnorm(15, 8000, 1000), rnorm(15, 10000, 1200), rnorm(15, 15000, 1500))
)
library(ggplot2)
ggplot(educacion, aes(x = nivel, y = ingreso)) + geom_boxplot()

❓ Preguntas de análisis:

¿Qué grupo muestra el mayor ingreso promedio?
¿Existe mayor variabilidad en alguno?
¿Cómo se relaciona esto con movilidad social?

🔹 Problema 9: Consumo energético per cápita por país

Contexto: Se comparan los niveles de consumo energético en distintos países.

energia <- data.frame(
  pais = c("México", "EE.UU", "Brasil", "Canadá", "Argentina"),
  consumo_pc = c(1700, 12000, 2500, 15000, 2000)
)
barplot(energia$consumo_pc, names.arg = energia$pais, col="orange")

❓ Preguntas de análisis:

¿Qué país tiene mayor consumo energético?
¿Cuál es el más eficiente?
¿Qué implicaciones tiene para la sostenibilidad?

🔹 Problema 10: Variación del tipo de cambio mensual

Contexto: Se estudia la evolución del tipo de cambio USD-MXN durante un año.

set.seed(209)
meses <- month.abb[1:12]
tipo_cambio <- data.frame(
  mes = meses,
  tasa = round(runif(12, 18.5, 21.0), 2)
)
library(ggplot2)

ggplot(tipo_cambio, aes(x = mes, y = tasa, group = 1)) +
  geom_line(color = "darkgreen") +
  geom_point(color = "darkgreen") +
  labs(title = "Tipo de cambio USD-MXN", x = "Mes", y = "Tasa")