library(tidyverse)
library(readxl)
library(ggplot2)
library(dplyr)
library(tidyr)

Introducción

En la actualidad, la toma de decisiones informadas en el ámbito de la educación y el empleo depende del acceso a datos relevantes, confiables y actualizados. En Colombia, el Servicio Nacional de Aprendizaje (SENA) ofrece una amplia gama de programas de formación en diferentes niveles, que incluyen Auxiliar, Curso Especial, Operario, Profundización Técnica, Técnico, Tecnólogo, Especialización Tecnológica y Eventos, los cuales contribuyen al desarrollo de habilidades laborales en diversos sectores productivos. Sin embargo, no existe un repositorio centralizado que permita analizar de manera eficiente esta información para apoyar la toma de decisiones estratégicas. Este informe tiene como objetivo presentar una solución digital que facilite la visualización y análisis de los datos relacionados con los programas formativos del SENA, con el fin de optimizar los procesos de toma de decisiones a nivel institucional y regional.

Objetivo general

Desarrollar un informe detallado que presente el panorama de los programas de formación del SENA, abarcando los siguientes niveles: Auxiliar, Curso Especial, Operario, Profundización Técnica, Técnico, Tecnólogo, Especialización Tecnológica y Eventos. El informe se enfocará en el análisis de los datos relacionados con estos programas, destacando su evolución en los años 2023-2024 y proporcionando información clave para apoyar la toma de decisiones estratégicas a nivel institucional y regional.

Objetivos específicos

Recolectar y seleccionar las bases de datos abiertas del Ministerio de Educación Nacional y del SENA que contengan información relevante sobre graduados y certificados en los programas de formación, correspondientes a los años 2023-2024 disponibles.

  • Estandarizar y parametrizar los datos recopilados para asegurar la comparabilidad entre los programas del SENA, modalidades, niveles de formación y regiones, garantizando una correcta interpretación y análisis.

  • Realizar análisis estadísticos de los datos recopilados, utilizando herramientas de análisis como R, para generar reportes técnicos en formato R Markdown y exportarlos a PDF, documentando los hallazgos y resultados clave en relación a la evolución de los programas del SENA.

  • Desarrollar informes técnicos que resuman los hallazgos y proporcionen recomendaciones relevantes sobre la pertinencia y desempeño de los programas del SENA en los años 2023-2024, con énfasis en la formación técnica y tecnológica.

  • Identificar tendencias y patrones en los datos para ofrecer un análisis sobre la evolución y relevancia de los programas de formación del SENA, especialmente en los niveles de Auxiliar, Curso Especial, Operario, Profundización Técnica, Técnico, Tecnólogo, Especialización Tecnológica y Eventos.

Análisis Nacional Comparativo de Certificación del Servicio Nacional de Aprendizaje - SENA durante los años 2023–2024

Total de certificados por nivel de formación 2023 y 2024 (SENA)

La siguiente gráfica presenta el total de certificados emitidos por el Servicio Nacional de Aprendizaje (SENA) durante los años 2023 y 2024, clasificados según el nivel de formación. El propósito de esta visualización es comparar el comportamiento anual en la emisión de certificaciones, permitiendo identificar tendencias, variaciones y posibles áreas de fortalecimiento dentro de la oferta educativa del SENA. Los niveles de formación incluidos abarcan desde programas cortos como cursos especiales y eventos, hasta niveles más avanzados como formación técnica, tecnológica y especializaciones. Esta información resulta clave para evaluar el alcance y la cobertura del sistema de formación para el trabajo en Colombia durante el período analizado.

# Convertir los datos a formato largo
base_datos_largo <- base_datos_filtrada %>%
  pivot_longer(cols = c(TOTAL_2023, TOTAL_2024),  # Seleccionar las columnas de 2023 y 2024
               names_to = "Año",  # Crear una columna llamada "Año"
               values_to = "Total")  # Crear una columna llamada "Total"

# Crear gráfico de barras normales
ggplot(base_datos_largo, aes(x = reorder(NIVEL_DE_FORMACIÓN, Total), y = Total, fill = Año)) +
  geom_bar(stat = "identity", position = "dodge") +  # Barras normales (separadas)
  geom_text(aes(label = scales::label_comma(decimal.mark = ",", big.mark = ".")(Total)), 
            position = position_dodge(width = 0.8),  # Alineación de las etiquetas
            vjust = 0.5, size = 2.5) +  # Ajuste de la posición y tamaño de la etiqueta
  labs(title = "Totales de certificados por nivel de formación en 2023 y 2024",
       x = "Nivel de Formación",
       y = "Total",
       fill = "Año") +
  theme_minimal() + coord_flip() + 
  scale_y_continuous(labels = scales::label_comma(decimal.mark = ",", big.mark = "."))

La gráfica presenta los totales de certificados emitidos por el SENA (Servicio Nacional de Aprendizaje) en los años 2023 y 2024, clasificados por nivel de formación. En todos los niveles analizados se evidencia una disminución en la cantidad de certificados entregados en 2024 con respecto al año anterior. El nivel “Curso Especial” registra el mayor número de certificados en ambos años: 3.332.263 en 2023 y 3.210.941 en 2024, lo que representa una reducción de 121.322 certificados, equivalente a una caída del 3,64%. Aunque esta disminución es leve, mantiene a este nivel como el de mayor cobertura y masividad en la oferta del SENA. Le sigue el nivel “Evento”, que pasó de 328.955 certificados en 2023 a 270.963 en 2024, con una disminución de 57.992 certificados (caida del 17,63%). El nivel “Técnico” también muestra una reducción significativa, bajando de 248.932 a 180.623 certificados (bajó un 27,44%). El nivel “Tecnólogo” disminuyó de 72.984 a 62.487 certificados, lo que representa una reducción del 14,38%. En niveles operativos y auxiliares también se registran caídas: el nivel “Operario” descendió de 6.898 a 5.924 certificados (bajó un 14,12%), y “Auxiliar” bajó de 2.387 a 2.125 certificados (se redujó un 10,97%). Los niveles más especializados sufrieron las mayores reducciones relativas: “Profundización Técnica” pasó de 843 a 598 certificados (reducción dev29,07%) y “Especialización Tecnológica” registró una caída casi total, de 339 a solo 19 certificados en 2024, lo que equivale a una disminución del 94,10%. En resumen, el análisis muestra que en 2024 el SENA emitió menos certificados en todos los niveles de formación en comparación con 2023. La disminución fue más leve en los programas de formación corta y masiva, pero muy marcada en los niveles avanzados, lo cual podría reflejar ajustes en la oferta institucional, recorte presupuestal, cambios en políticas de formación o una menor demanda en programas de mayor duración o complejidad.

Variación en la Emisión de Certificados del SENA en las 10 Regionales con Mayor Desempeño (2023 vs. 2024)

La siguiente gráfica presenta el Top 10 de regionales del SENA con mayor cantidad de certificados emitidos durante los años 2023 y 2024. La comparación se realiza con barras agrupadas que muestran los totales anuales por regional, diferenciando cada año mediante colores (rojo para 2023 y azul para 2024). Esta información permite identificar con precisión las regionales que han mostrado mayor desempeño en la certificación de formación, así como los cambios ocurridos de un año a otro.

# Reorganizar los datos de formato ancho a largo
base_datos_filtrada2_largo <- base_datos_filtrada2 %>%
  pivot_longer(cols = starts_with("TOTAL"), 
               names_to = "Año", 
               values_to = "Total")

# Filtrar las filas que no tengan NA en TOTAL__2023 o TOTAL__2024
# También excluimos las filas con los valores "Total REGIONAL", "Total CIUDADANIA DIGITAL" y "TOTAL NACIONAL" en la columna REGIONAL
base_datos_filtrada2_clean <- base_datos_filtrada2 %>%
  filter(TOTAL__2023 != 0 & TOTAL__2024 != 0)  # Excluir ceros si lo deseas

# Filtrar las 10 regiones con mayores totales en 2023
base_datos_filtrada2_top <- base_datos_filtrada2_clean %>%
  arrange(desc(TOTAL__2023)) %>%
  head(10)

# Reorganizar los datos de formato ancho a largo
base_datos_filtrada2_top_long <- base_datos_filtrada2_top %>%
  pivot_longer(cols = c("TOTAL__2023", "TOTAL__2024"), 
               names_to = "Año", 
               values_to = "Total")

# Crear gráfico de barras para comparar los totales de 2023 y 2024
ggplot(base_datos_filtrada2_top_long, aes(x = reorder(REGIONAL, Total), y = Total, fill = Año)) +
  geom_bar(stat = "identity", position = "dodge") +  # Usamos "dodge" para separar las barras
  labs(title = "Top 10 regionales con más certificados en 2023 y 2024",
       x = "Regional",
       y = "Total de Certificados") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  + coord_flip() + 
  scale_y_continuous(labels = scales::label_comma(decimal.mark = ",", big.mark = ".")) + 
  geom_text(aes(label = scales::label_comma(decimal.mark = ",", big.mark = ".")(Total)), 
            position = position_dodge(width = 0.8))

En 2024, la Regional Antioquia registró 412.705 certificados, lo que representa un aumento de 25.456 frente a los 387.249 certificados de 2023, equivalente a un crecimiento del 6,57%. La Regional Distrito Capital incrementó su total de certificados de 336.577 en 2023 a 399.409 en 2024, con una diferencia absoluta de 62.832 certificados, lo que corresponde a un crecimiento porcentual del 18,67%, siendo el más alto entre las regionales analizadas. Regional Bolívar mostró un leve aumento de 304.745 a 307.480 certificados, equivalente a 2.735 certificados adicionales, con un crecimiento del 0,90%. En el caso de la Regional Cundinamarca, se presentó un aumento de 268.706 certificados en 2023 a 280.931 en 2024, con una diferencia de 12.225 certificados, lo que representa un crecimiento del 4,55%. La Regional Atlántico disminuyó de 266.257 a 255.702 certificados, con una reducción de 10.555 certificados, equivalente a una caída del 3,96%. La Regional Tolima mostró una reducción importante al pasar de 267.788 certificados en 2023 a 246.677 en 2024, lo que representa 21.111 certificados menos, equivalente a una caída del 7,88%. La Regional Valle tuvo la mayor caída porcentual, pasando de 252.435 certificados a 225.360, con una reducción absoluta de 27.075 certificados, equivalente a un descenso del 10,73%. En el caso de la Regional Santander, el crecimiento fue casi nulo, aumentando de 194.046 a 194.439 certificados, con apenas 393 certificados más, lo que representa un crecimiento del 0,20%. Regional Norte de Santander disminuyó de 147.449 a 141.014 certificados, con 6.435 certificados menos, lo que equivale a una caída del 4,36%. Finalmente, la Regional Cesar creció de 133.860 a 143.252 certificados, con una variación absoluta de 9.392 certificados, equivalente a un crecimiento del 7,02%. Estos datos evidencian que, aunque algunas regionales lograron incrementos importantes en certificación, otras sufrieron retrocesos considerables, lo cual refleja un comportamiento desigual en el desempeño de las regionales del SENA entre 2023 y 2024.

Reducción en la Certificación de Técnicos y Tecnólogos en Atlántico por el SENA (2023 vs. 2024)

La gráfica compara el total de certificados emitidos por el SENA en el departamento del Atlántico para los niveles de formación Técnico y Tecnólogo durante los años 2023 y 2024. La visualización permite observar la evolución de la certificación en estos dos niveles clave para la formación del talento humano, facilitando la identificación de variaciones entre los dos periodos analizados.

# Paso 1: Filtrar la regional ATLÁNTICO y seleccionar solo las columnas necesarias
base_tt <- base_datos2 %>%
  filter(REGIONAL == "REGIONAL ATLÁNTICO") %>%
  select(REGIONAL, TÉCNICO_2023, TÉCNICO_2024, TECNÓLOGO_2023, TECNÓLOGO_2024)

# Paso 2: Convertir los datos a formato largo
base_tt_long <- base_tt %>%
  pivot_longer(
    cols = -REGIONAL,
    names_to = "Categoria",
    values_to = "Total"
  ) %>%
  # Separar la columna 'Categoria' en dos: Nivel y Año
  separate(Categoria, into = c("NIVEL", "AÑO"), sep = "_") %>%
  mutate(AÑO = as.character(AÑO))

# Paso 3: Crear el gráfico comparativo
ggplot(base_tt_long, aes(x = NIVEL, y = Total, fill = AÑO)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(
    title = "COMPARACIÓN DE TÉCNICOS Y TECNÓLOGOS CERTIFICADOS EN ATLÁNTICO (2023 Y 2024) POR EL SENA",
    x = "Nivel de Formación",
    y = "Total de Certificados"
  ) +
  theme_minimal() +
  scale_fill_manual(values = c("2023" = "steelblue", "2024" = "orange")) + 
  geom_text(aes(label = scales::label_comma(decimal.mark = ",", big.mark = ".")(Total)), 
            position = position_dodge(width = 0.8))  # Colores personalizados

En el nivel técnico, el total de certificados en el departamento del Atlántico pasó de 18.190 en 2023 a 14.531 en 2024, lo que representa una disminución absoluta de 3.659 certificados. Esta caída equivale a una reducción del 20,12% respecto al año anterior. En el nivel tecnólogo, se registró una disminución de 4.609 certificados en 2023 a 4.239 en 2024, con una diferencia de 370 certificados, lo que representa una caída del 8,03%. En conjunto, ambas categorías evidencian un retroceso en el número de certificaciones en 2024 frente al año anterior, siendo más acentuado en el nivel técnico. Estos datos reflejan una baja generalizada en los procesos de certificación en la regional Atlántico del SENA, con mayor impacto en la formación técnica.

Variaciones en la Certificación de Técnicos y Tecnólogos en el Centro Colombo Alemán (2023 vs. 2024)

La gráfica muestra la cantidad de técnicos y tecnólogos certificados por el SENA en el Centro Colombo Alemán durante los años 2023 y 2024. Al segmentar por nivel de formación y comparar ambos años, se identifican los cambios en la dinámica de certificación de este centro, permitiendo analizar el comportamiento de la oferta formativa en estos dos niveles clave.

# Paso 1: Filtrar el centro de formación Colombo Alemán y seleccionar columnas relevantes
base_colombo <- base_datos3 %>%
  filter(CENTRO_DE_FORMACION == "CENTRO NACIONAL COLOMBO ALEMAN") %>%
  select(CENTRO_DE_FORMACION, TÉCNICO_2023, TÉCNICO_2024, TECNÓLOGO_2023, TECNÓLOGO_2024)

# Paso 2: Convertir a formato largo para graficar fácilmente
base_colombo_long <- base_colombo %>%
  pivot_longer(cols = -CENTRO_DE_FORMACION,
               names_to = "Categoria",
               values_to = "Total") %>%
  separate(Categoria, into = c("NIVEL", "AÑO"), sep = "_") %>%
  mutate(AÑO = as.character(AÑO))

# Paso 3: Crear el gráfico comparativo
ggplot(base_colombo_long, aes(x = NIVEL, y = Total, fill = AÑO)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(
    title = "TÉCNICOS Y TECNÓLOGOS CERTIFICADOS EN EL CENTRO COLOMBO ALEMÁN (2023 Y 2024)",
    x = "Nivel de Formación",
    y = "Total de Certificados"
  ) +
  theme_minimal() +
  scale_fill_manual(values = c("2023" = "steelblue", "2024" = "orange")) + 
  geom_text(aes(label = scales::label_comma(decimal.mark = ",", big.mark = ".")(Total)), 
            position = position_dodge(width = 0.8))  # Colores personalizados

En el nivel técnico, el número de certificados emitidos en 2023 fue de 3.771, mientras que en 2024 descendió a 2.139, lo que representa una reducción de 1.632 certificados. Esta disminución equivale a un 43,29% menos con respecto al año anterior, siendo la caída más significativa entre ambos niveles. En contraste, en el nivel tecnólogo se evidencia un crecimiento: en 2023 se emitieron 757 certificados y en 2024 la cifra subió a 932, con un incremento de 175 certificados, lo que equivale a un 23,11% de aumento. En resumen, mientras la formación técnica muestra un fuerte retroceso en certificaciones, la formación tecnológica experimenta un crecimiento considerable, lo que puede reflejar un cambio en la demanda o en la focalización del centro hacia programas de mayor nivel.

Top 10 Centros del SENA con Mayor Número de Certificados Emitidos (2023–2024) por regional

La gráfica presenta los diez centros de formación del SENA con mayor cantidad de certificados emitidos entre los años 2023 y 2024, discriminados por regional. Este ranking permite identificar cuáles centros concentraron la mayor actividad certificadora en el periodo analizado y en qué regiones se ubican, aportando una visión clara sobre el desempeño institucional a nivel nacional.

# Paso 1: Crear una columna TOTAL sumando 2023 + 2024
base_datos3_totales <- base_datos3 %>%
  mutate(
    TOTAL = TOTAL_CENTROS_DE_FORMACION_2023 + TOTAL_CENTROS_DE_FORMACION_2024
  )

# Paso 2: Para cada regional, identificar el centro con más certificados
centros_top_por_regional <- base_datos3_totales %>%
  group_by(REGIONAL) %>%
  slice_max(order_by = TOTAL, n = 1, with_ties = FALSE) %>%  # 1 por regional
  ungroup()

# Paso 3: De esos centros top por regional, sacar el top 10 general
centros_top10 <- centros_top_por_regional %>%
  arrange(desc(TOTAL)) %>%
  slice_head(n = 10)

# Paso 4: Crear gráfico del top 10
ggplot(centros_top10, aes(x = reorder(CENTRO_DE_FORMACION, TOTAL), y = TOTAL, fill = REGIONAL)) +
  geom_bar(stat = "identity") +
  labs(
    title = "Top 10 centros con más certificados (2023–2024) por regional",
    x = "Centro de Formación",
    y = "Total de Certificados"
  ) +
  theme_minimal() +
  coord_flip() +
  geom_text(aes(label = scales::label_comma(decimal.mark = ",", big.mark = ".")(TOTAL)), 
            position = position_dodge(width = 0.8))

El centro con mayor número de certificados fue el Centro Agropecuario La Granja (Regional Tolima), con un total de 209.871 certificados, seguido por el Centro de Comercio y Servicios (Regional Atlántico), con 199.184 certificados, y el Centro Agrope empresarial y Minero (Regional Bolívar), con 194.276 certificados. En cuarta posición se encuentra el Centro de la Industria, la Empresa y los Servicios (Regional Antioquia), con 146.168 certificados, seguido por el Centro de la Innovación, la Tecnología y los Servicios (Regional Norte de Santander), que alcanzó 137.462 certificados. El Centro de Biotecnología Agropecuaria (Regional Cundinamarca) ocupa la sexta posición con 133.891 certificados, mientras que el Centro de Formación Turística Gente de Mar y de Servicios (Regional San Andrés) figura con 113.875 certificados. Luego se encuentran el Complejo Tecnológico Agroindustrial, Pecuario y Turístico (Regional Sucre) con 106.280 certificados, el Centro de Operación y Mantenimiento Minero (Regional Cesar) con 106.026 certificados, y finalmente el Centro de Servicios Financieros (Regional Distrito Capital), con 104.906 certificados. Este análisis muestra una distribución diversa entre las regiones, donde centros tanto rurales como urbanos han logrado destacarse en el proceso de certificación, con una notable participación de Tolima, Atlántico y Bolívar en los primeros lugares.

Conclusión

El análisis de los datos de certificación del SENA entre 2023 y 2024 muestra una tendencia general a la disminución en la mayoría de niveles de formación, especialmente en los programas más avanzados como Especialización Tecnológica y Profundización Técnica. Aunque los cursos cortos siguen siendo los más masivos, también presentan ligeras caídas. A nivel regional, se observa un comportamiento desigual: mientras Antioquia, Distrito Capital y Cesar incrementan sus cifras, otras como Valle, Atlántico y Cundinamarca presentan retrocesos. En los centros de formación ocurre algo similar, con casos destacados como el Centro Agropecuario La Granja (Tolima), que lidera en número de certificados. El caso de Atlántico refleja una caída general en técnicos y tecnólogos, y en el Centro Colombo Alemán se evidencia una fuerte baja en técnicos, compensada por un alza en tecnólogos. En conjunto, los datos sugieren la necesidad de revisar y ajustar la estrategia institucional del SENA para garantizar una oferta formativa más equilibrada y sostenible en todos los niveles y regiones.