# Cargar las librerías necesarias
library(ggplot2)  # Para las visualizaciones
library(dplyr)    # Para manipulación de datos
library(readxl)   # Leer archivo excel
library(DT)       # Para las tablas interactivas

# Cargar los datos desde el archivo
df <- read_excel("Enfoque analisis de datos.xlsx", sheet = 3)
df2 <- read_excel("Enfoque analisis de datos.xlsx", sheet = 2)

Introducción

En la actualidad, la toma de decisiones informadas en el ámbito de la educación superior en el Departamento del Atlántico requiere de datos precisos y actualizados sobre la formación académica de los estudiantes y los programas ofrecidos por las Instituciones de Educación Superior (IES) y el SENA (Centro Nacional Colombo Alemán).

Este informe tiene como objetivo realizar un análisis comparativo entre los graduados de las IES y los certificados por el SENA en el Atlántico en programas relacionados con analítica de datos, cubriendo el periodo de 2022 a 2024, con una proyección hasta 2027 basada exclusivamente en los datos del SENA (Centro Nacional Colombo Alemán). Esta proyección es importante, ya que algunos programas del SENA se extienden hasta el año 2027, lo que permitirá observar las tendencias y la evolución de la formación en el campo de los datos en el Atlántico. El análisis proporcionará una visión clara sobre la alineación de los programas educativos y las necesidades del mercado laboral.

Objetivo General

Realizar un análisis comparativo entre los graduados de las Instituciones de Educación Superior (IES) y los certificados por el SENA (Centro Nacional Colombo Alemán) en programas de analítica de datos y áreas afines, enfocado en el periodo de 2022 a 2024, con una proyección hasta 2027, para evaluar su evolución y tendencias en la formación de analítica de datos en el Atlántico.

Objetivos Especificos

  • Recolectar y seleccionar bases de datos: Obtener las bases de datos de los graduados de las IES y los certificados del SENA en todos los niveles de formación (Técnico, Tecnólogo, Universitario, Maestría, Doctorado, etc.) durante el periodo 2022-2024, con una proyección hasta 2027 basada en los datos del SENA (Centro Nacional Colombo Alemán).

  • Estandarización y parametrización de datos: Estandarizar los datos recopilados para garantizar la comparabilidad entre programas académicos, modalidades de formación, niveles educativos (Técnico, Tecnólogo, Universitario, Maestría, Doctorado), regiones y años, con un enfoque especial en los programas relacionados con analítica de datos.

  • Análisis comparativo de la evolución de graduados: Realizar un análisis comparativo entre los graduados de las IES y los certificados por el SENA en todos los niveles de formación, con especial énfasis en la evolución de los graduados en analítica de datos.

  • Documentación de hallazgos: Generar informes técnicos detallados en R Markdown, exportados a PDF, que documenten los hallazgos clave sobre las tendencias de formación y la evolución de los programas de analítica de datos en todos los niveles educativos (desde Técnico hasta Doctorado) en el Atlántico.

Análisis Comparativo de los Programas Académicos: Graduados de las IES y Certificados del Centro Nacional Colombo Alemán en el Atlántico (2022-2027)

Cantidad Total de Graduados por Programa Académico

La tabla muestra los programas académicos con más graduados, destacando especialmente aquellos relacionados con analítica de datos y áreas afines.

# Agrupar los datos por "Programa Académico" y calcular el total de graduados
graduados_por_programa <- df %>%
  group_by(`Programa Académico`) %>%    # Agrupar por el campo "Programa Académico"
  summarise(Total_Graduados = sum(Graduados, na.rm = TRUE)) %>%  # Sumar los graduados para cada programa
  arrange(desc(Total_Graduados))  # Ordenar los programas por el número de graduados en orden descendente
# Filtrar los datos para mostrar solo los años 2022, 2023 y 2024
graduados_por_programa <- df %>%
  filter(Año %in% c(2022, 2023, 2024)) %>%  # Filtrar por los años específicos
  group_by(Año, `Programa Académico`) %>%    # Agrupar por "Año" y "Programa Académico"
  summarise(Total_Graduados = sum(`Graduados`, na.rm = TRUE)) %>%  # Sumar el número total de graduados por programa académico
  arrange(Año, desc(Total_Graduados))  # Ordenar por Año y luego por el número de graduados de mayor a menor

# Formatear los valores de "Total_Graduados" con punto como separador de miles
graduados_por_programa$Total_Graduados <- scales::number(graduados_por_programa$Total_Graduados, big.mark = ".", decimal.mark = ",")

# Mostrar la tabla interactiva con formato de miles
datatable(graduados_por_programa, 
          options = list(pageLength = 10),  # Número de filas por página
          rownames = FALSE)  # No mostrar los números de fila

Los programas de Sistemas, Programación de Software y Análisis y Desarrollo de Software lideran, reflejando la alta demanda en áreas clave para el desarrollo de analítica de datos. Además, el programa de Programación para Analítica de Datos, con 138 graduados, muestra un creciente interés en este campo. Aunque los programas en tecnologías de software siguen predominando, es evidente un crecimiento en los programas especializados en datos, lo que apunta a una tendencia futura de mayor especialización en esta área.

A continuación se visualiza de forma grafica el top 10 de programas con mayor cantidad de graduados siguiendo la información tabulada en la tabla anterior.

# Filtrar los datos para mostrar solo los años 2022, 2023 y 2024
graduados_por_programa <- df %>%
  filter(Año %in% c(2022, 2023, 2024)) %>%  # Filtrar por los años 2022, 2023 y 2024
  group_by(`Programa Académico`) %>%    # Agrupar los datos por "Programa Académico"
  summarise(Total_Graduados = sum(`Graduados`, na.rm = TRUE)) %>%  # Sumar el número total de graduados por programa académico
  arrange(desc(Total_Graduados))  # Ordenar los programas de mayor a menor según el número de graduados

# Visualización: Graduados por Programa Académico
ggplot(graduados_por_programa[1:10,], aes(x = reorder(`Programa Académico`, -Total_Graduados), y = Total_Graduados)) +
  geom_bar(stat = "identity", fill = "steelblue") +   # Crear gráfico de barras con los datos
  labs(title = "Top 10 Programas Académicos con más Graduados (2022-2024)", x = "Programa Académico", y = "Total de Graduados") +
  scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",")) +  # Formatear el eje Y con punto como miles y coma como decimales
  geom_text(aes(label = scales::number(Total_Graduados, big.mark = ".", decimal.mark = ",")),  # Agregar etiquetas de datos con el formato adecuado
            position = position_stack(vjust = 0.5), size = 4, color = "black") +  # Colocar etiquetas en el medio de las barras
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  # Rotar etiquetas del eje X para mejor visualización

En resumen, los programas relacionados con analítica de datos y tecnologías de la información dominan, con una tendencia creciente hacia la especialización en datos en los próximos años.

Cantidad de Graduados por Modalidad

El siguiente gráfico muestra la distribución de graduados en función de la modalidad de formación (presencial y virtual). Esta visualización permite observar cómo se distribuyen los graduados según el tipo de modalidad ofrecido.

# Filtrar los datos para los años 2022, 2023 y 2024
df_filtrado <- df %>%
  filter(Año %in% c(2022, 2023, 2024))  # Filtrar por los años 2022, 2023 y 2024

# Agrupar los datos por modalidad y calcular el total de graduados
graduados_por_modalidad <- df_filtrado %>%
  group_by(Modalidad) %>%
  summarise(Total_Graduados = sum(Graduados, na.rm = TRUE))  # Sumar los graduados para cada modalidad

# Visualización: Graduados por Modalidad
ggplot(graduados_por_modalidad, aes(x = Modalidad, y = Total_Graduados, fill = Modalidad)) +
  geom_bar(stat = "identity") +   # Crear gráfico de barras para la modalidad
  labs(title = "Distribución de Graduados por Modalidad", x = "Modalidad", y = "Total de Graduados") +
  scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",")) +  # Formatear el eje Y con punto como miles y coma como decimales
  geom_text(aes(label = scales::number(Total_Graduados, big.mark = ".", decimal.mark = ",")),  # Etiquetas con formato adecuado
            position = position_stack(vjust = 0.5), size = 4) +  # Colocar las etiquetas en el centro de las barras
  theme_minimal()  # Aplicar tema minimalista para el gráfico

La modalidad presencial lidera con 6.540 graduados, representando una gran mayoría de los graduados. Esto refleja la preferencia tradicional por la educación presencial, que sigue siendo la opción predominante, especialmente en programas técnicos y profesionales donde la interacción directa con instructores y compañeros es fundamental. Mientras que la modalidad virtual tiene 204 graduados, lo que indica que aunque es un número considerable, representa una proporción menor (el 3% sobre el total) en comparación con la presencial. Sin embargo, esta modalidad sigue mostrando crecimiento, lo que sugiere una tendencia creciente hacia la educación a distancia.

Graduados por Nivel de Formación

Se muestra la distribución de graduados según el nivel de formación, que abarca desde Doctorado hasta Técnico. El análisis permite observar cómo se distribuyen los graduados según el nivel educativo alcanzado.

# Filtrar los datos para los años 2022, 2023 y 2024
df_filtrado <- df %>%
  filter(Año %in% c(2022, 2023, 2024))  # Filtrar por los años 2022, 2023 y 2024

# Agrupar los datos por "Nivel de Formación" y calcular el total de graduados para cada nivel
graduados_por_nivel <- df_filtrado %>%
  group_by(`Nivel de Formación`) %>%  # Agrupar por el campo "Nivel de Formación"
  summarise(Total_Graduados = sum(Graduados, na.rm = TRUE))  # Sumar el número de graduados para cada nivel de formación

# Visualización: Graduados por Nivel de Formación
ggplot(graduados_por_nivel, aes(x = `Nivel de Formación`, y = Total_Graduados, fill = `Nivel de Formación`)) +
  geom_bar(stat = "identity") +   # Crear gráfico de barras para comparar los graduados en cada nivel
  labs(title = "Graduados por Nivel de Formación (2022-2024)", x = "Nivel de Formación", y = "Total de Graduados") +
  scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",")) +   # Formatear el eje Y con punto como miles y coma como decimales
  geom_text(aes(label = scales::number(Total_Graduados, big.mark = ".", decimal.mark = ",")),  # Etiquetas con formato adecuado
            position = position_stack(vjust = 0.5), size = 4) +  # Colocar las etiquetas en el centro de las barras
  theme_minimal() +  # Aplicar un tema minimalista al gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  # Rotar las etiquetas del eje X en diagonal para mejor legibilidad

El nivel técnico lidera con 4.600 graduados, lo que refleja la alta demanda por programas con habilidades prácticas y directamente aplicables en áreas tecnológicas. Los programas universitarios siguen con 929 graduados, representando una proporción menor en comparación con los niveles técnicos. Los programas de Tecnólogo tienen 749 graduados, ofreciendo una especialización mayor que los programas técnicos, pero con una cantidad de graduados menor. Finalmente, los posgrados muestran cifras bajas, con 7 graduados en Doctorado y 231 en Maestría, lo que indica que los estudiantes prefieren la formación técnica antes de optar por estudios más avanzados. Este análisis subraya la preferencia por programas técnicos y tecnológicos, mientras que los posgrados siguen siendo una opción menos frecuente.

Nota: Es importante tener en cuenta que la elección de los programas académicos, especialmente en niveles técnicos y tecnológicos, está influenciada no solo por la demanda del mercado laboral, sino también por factores como costos de matrícula y accesibilidad económica. Los programas de formación técnica suelen tener costos más bajos en comparación con los programas de nivel universitario y posgrado, lo que puede hacerlos más accesibles para un mayor número de estudiantes. Esto puede explicar la alta participación en programas de nivel técnico y tecnológico, ya que ofrecen una educación de alta calidad a un costo más accesible, permitiendo una entrada más rápida al mercado laboral. En cambio, los programas de posgrado como Doctorados y Maestrías requieren mayores inversiones económicas y, por lo tanto, tienen una participación más baja en comparación.

Evolución y Proyección de Graduados

El gráfico muestra la evolución de graduados entre los años 2022 y 2027, con los datos de 2022 a 2024 basados en los graduados de las IES y las proyecciones de 2025 en adelante basadas exclusivamente en los graduados del SENA, ya que solo se dispone de datos de esa institución para esos años.

# Agrupar los datos por Año y calcular el total de graduados por cada año
graduados_por_ano <- df %>%
  group_by(Año) %>%
  summarise(Total_Graduados = sum(Graduados, na.rm = TRUE))  # Sumar los graduados para cada año

# Visualización: Evolución de los Graduados por Año
ggplot(graduados_por_ano, aes(x = Año, y = Total_Graduados)) +
  geom_line(color = "darkgreen", size = 1) +  # Crear gráfico de líneas para mostrar la evolución anual
  geom_point(color = "darkred") +  # Añadir puntos en cada año para visualizar mejor los datos
  labs(title = "Evolución de Graduados por Año", x = "Año", y = "Total de Graduados") +
  scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",")) +  # Formatear el eje Y con punto como miles y coma como decimales
  geom_text(aes(label = scales::number(Total_Graduados, big.mark = ".", decimal.mark = ",")), # Agregar etiquetas de datos con el formato adecuado
            vjust = -0.5, size = 4, color = "black") +  # Colocar las etiquetas por encima de los puntos de la línea
  theme_minimal()  # Aplicar tema minimalista al gráfico

  • 2022-2024: En 2022, el número de graduados es 820, con un aumento significativo en 2023 (2.084 graduados). La cifra alcanza su máximo en 2024 con 3.860 graduados, lo que refleja un crecimiento acelerado en el número de graduados. Este incremento puede ser resultado de una mayor oferta educativa y la expansión de programas en áreas tecnológicas y de analítica de datos.

  • Proyección 2025-2027 (solo SENA - Centro Nacional Colombo Aleman): A partir de 2025, la proyección se basa únicamente en los graduados del SENA, lo que muestra una caída progresiva en el número de graduados: 1.922 graduados en 2025, 499 en 2026, y 105 en 2027. Esta disminución podría estar relacionada con una reducción de programas, menores inscripciones, o cambios en la duración de los programas del SENA. Es importante destacar que estos datos no reflejan la evolución de las IES para esos años, ya que los datos no están disponibles.

En la siguiente tabla se puede detallar los programa ofertados por el SENA - Centro Nacional Colombo Aleman los cuales certificarian a los aprendices desde el presente año 2025 hasta 2027, se desglosa por Nivel de Formación, Año, Semestre, Modalidad, Municipio y la cantidad de graduados.

# Filtrar los datos de 2025 a 2027
programas_sena_2025_2027 <- df %>%
  filter(Año >= 2025) %>%  # Filtrar para obtener solo los años 2025 a 2027
  arrange(Año)  # Ordenar los datos por año

# Mostrar la tabla interactiva
datatable(programas_sena_2025_2027, options = list(pageLength = 10), rownames = FALSE)

Cursos cortos

A continuación, se presenta una tabla que muestra los cursos cortos ofertados por el SENA (Centro Nacional Colombo Alemán), con un enfoque en analítica de datos y tecnologías de la información. Estos cursos son una parte fundamental de la formación técnica y especializada, ofreciendo a los estudiantes la oportunidad de adquirir habilidades prácticas en áreas clave que están en alta demanda en el mercado laboral. La tabla proporciona detalles sobre los cursos y la cantidad de aprendices certificados.

# Agrupar los datos por "Programa Académico" y calcular el total de graduados
programas_y_graduados_agrupados <- df2 %>%
  group_by(`Programa Académico`) %>%
  summarise(Total_Graduados = sum(Graduados, na.rm = TRUE)) %>%
  arrange(desc(Total_Graduados))  # Ordenar por total de graduados de mayor a menor

# Formatear los valores de "Total_Graduados" con punto como separador de miles
programas_y_graduados_agrupados$Total_Graduados <- scales::number(programas_y_graduados_agrupados$Total_Graduados, big.mark = ".", decimal.mark = ",")

# Mostrar la tabla interactiva
datatable(programas_y_graduados_agrupados, 
          options = list(pageLength = 10),  # Limitar filas visibles a 10 por página
          rownames = FALSE)  # No mostrar los números de fila

Conclusión

El análisis de los graduados en el Departamento del Atlántico, tanto de las Instituciones de Educación Superior (IES) como del SENA (Centro Nacional Colombo Alemán), proporciona una visión integral de las tendencias educativas actuales y futuras en la región, especialmente en áreas clave como analítica de datos y tecnologías de la información. Se observa un creciente interés en la formación técnica y tecnológica, con un énfasis claro en programas como Sistemas, Programación de Software y Análisis y Desarrollo de Software, que lideran en términos de graduados.

A partir de 2025, las proyecciones para el SENA muestran una disminución en la cantidad de graduados, lo que refleja la finalización de programas educativos que se iniciaron antes y que culminan en ese periodo. Este descenso no implica una reducción de la oferta educativa, sino que está relacionado con el ciclo natural de estos programas. Es importante destacar que las políticas educativas deben continuar adaptándose a las demandas del mercado laboral y a las tendencias globales en formación tecnológica y analítica, asegurando que los programas ofrecidos sigan siendo relevantes y accesibles para los estudiantes.

El crecimiento de la educación técnica sigue siendo un pilar fundamental para la preparación laboral en el Atlántico, pero será clave mantener el enfoque en las tecnologías emergentes para asegurar que la formación esté alineada con las necesidades del mercado. A medida que se proyecta una mayor especialización en analítica de datos y otros campos tecnológicos, el sistema educativo debe evolucionar para preparar a los estudiantes frente a los desafíos de un entorno laboral cada vez más digitalizado y globalizado.