# Cargar la librería readxl para leer archivos Excel
library(readxl)
# Cargar dplyr para manipulación de datos
library(dplyr)
# Cargar ggplot2 para hacer gráficos
library(ggplot2)
library(stringr)
# Leer archivo excel
df <- read_excel("IES CONSOLIDADO.xlsx")En el ámbito de la educación superior en Colombia, la recopilación y análisis de datos sobre los graduados de las Instituciones de Educación Superior (IES) se ha vuelto crucial para mejorar las políticas educativas y las estrategias institucionales. Este informe se enfoca específicamente en los datos de graduados de las IES, y los niveles de formación técnicos y tecnologos, utilizando herramientas de análisis y visualización desarrolladas en R para facilitar la comprensión y la toma de decisiones.
A través de la solución digital interactiva basada en R, se busca ofrecer una visión clara sobre indicadores clave como el número de graduados por semestre y la distribución entre diversos tipos de formación. Estas visualizaciones permiten detectar patrones, tendencias y diferencias significativas, aportando información valiosa para la toma de decisiones estratégicas a nivel institucional, especialmente en relación a la evolución y cobertura de la oferta académica.
Desarrollar una informe digital visuala basado en R y un descargable PDF, que permita visualizar y comparar de manera estructurada y dinámica los datos académicos de los graduados de las Instituciones de Educación Superior (IES) en Colombia. Esta solución tiene como objetivo analizar las tendencias educativas, y la evaluación de la oferta formativa de las IES durante los años 2022-2023, con el fin de apoyar la toma de decisiones estratégicas dentro del contexto educativo e institucional.
Recolectar y seleccionar bases de datos: Obtener bases de datos abiertas del Ministerio de Educación Nacional que contengan información detallada sobre los graduados de las IES correspondientes a los últimos cuatro años disponibles.
Estandarización y limpieza de datos: Limpiar y estandarizar los datos recopilados para garantizar la comparabilidad entre niveles de formación, tipos de programas y universidades a nivel nacional.
Implementación de análisis en R: Desarrollar un entorno de análisis y visualización en R que permita explorar y comparar indicadores clave de los graduados de las IES a nivel nacional y regional.
Elaboración de visualizaciones interactivas: Crear representaciones gráficas usando paquetes como ggplot2, dplyr y plotly, para ayudar a interpretar las tendencias y patrones observados en los datos.
Generación de informes técnicos en R Markdown: Documentar los resultados del análisis mediante informes detallados exportados a PDF, que proporcionen conclusiones claras y útiles para los tomadores de decisiones en el ámbito educativo.
Análisis comparativo entre programas de las IES: Identificar similitudes y diferencias entre los programas ofrecidos por las IES, permitiendo realizar análisis comparativos sobre su desempeño, cobertura y pertinencia en la oferta educativa.
La siguiente tabla presenta la cantidad total de graduados en programas técnicos profesionales, tecnológicos, especialización técnica y especialización tecnológica, discriminados por región. Este análisis se limita exclusivamente a estos niveles de formación y no considera programas de pregrado universitario, posgrado ni doctorados. El propósito es identificar la concentración territorial de este segmento específico de la educación superior.
# Agrupar por Región y sumar el total de graduados
df %>%
group_by(REGIÓN) %>% # Agrupa el dataset por la columna REGION
summarise(
GRADUADOS = sum(GRADUADOS, na.rm = TRUE) # Suma la cantidad total de graduados por región (ignora valores NA)
) %>%
mutate(
PORCENTAJE = paste0(
format(
round(GRADUADOS / sum(GRADUADOS) * 100, 1), # Calcula el porcentaje que representa cada región sobre el total general
decimal.mark = ",", # Cambia el separador decimal a coma
big.mark = "." # Cambia el separador de miles a punto
),
"%" # Añade el símbolo de porcentaje como texto
)
) %>%
arrange(desc(GRADUADOS)) %>% # Ordena las filas de mayor a menor cantidad de graduados
mutate(
GRADUADOS = scales::comma(GRADUADOS, big.mark = ".", decimal.mark = ",") # Cambia separador de miles a punto
) %>%
knitr::kable() # Crea una tabla limpia en formato Markdown/HTML/PDF| REGIÓN | GRADUADOS | PORCENTAJE |
|---|---|---|
| Región Andina | 260.503 | 88,4% |
| Región Caribe | 21.016 | 7,1% |
| Región Pacífica | 11.663 | 4,0% |
| Región Amazonía | 630 | 0,2% |
| Región Orinoquía | 585 | 0,2% |
| Región Insular | 184 | 0,1% |
La distribución de los graduados en programas de nivel técnico y tecnológico revela un patrón altamente centralizado en el país. Según los datos consolidados, la Región Andina concentra 260.503 graduados, lo que representa el 88,4% del total nacional en este segmento formativo. Este porcentaje evidencia que la oferta y culminación de programas técnicos y tecnológicos se encuentran fuertemente concentradas en esta zona geográfica, que históricamente ha contado con mayor desarrollo económico, infraestructura educativa y presencia de instituciones de formación técnica y tecnológica.
La Región Caribe ocupa un segundo lugar en volumen de egresados, con 21.016 graduados (7,1%), lo que indica que, aunque existe una participación significativa en términos absolutos, la brecha respecto a la Región Andina sigue siendo muy amplia. La diferencia es tan marcada que la Región Andina cuenta con más de doce veces los graduados que la Caribe en estos niveles educativos.
Por su parte, la Región Pacífica reúne un 4% del total (11.663 graduados). Si bien supera en proporción a las regiones más pequeñas, su volumen sigue siendo reducido en comparación con la Región Andina.
En contraste, las regiones Amazonía, Orinoquía e Insular tienen una participación prácticamente marginal, sumando en conjunto menos del 0,5% de todos los graduados de programas técnicos y tecnológicos. Esto podría atribuirse a factores como:
La menor densidad poblacional.
La limitada presencia de instituciones con oferta técnica especializada.
Restricciones de acceso a programas de formación en zonas rurales y de difícil conectividad.
El análisis confirma que la distribución territorial de la formación técnica y tecnológica reproduce desigualdades estructurales en acceso y permanencia, que pueden derivar en oportunidades dispares de inserción laboral. Las regiones periféricas, al contar con un volumen muy bajo de graduados, probablemente requieren políticas de fomento más intensivas, programas de incentivos, y fortalecimiento de la infraestructura educativa.
# Crear un gráfico de barras con cantidad de graduados por Región
df %>%
group_by(REGIÓN) %>% # Agrupa los datos por Región
summarise(
TotalGraduados = sum(GRADUADOS, na.rm = TRUE) # Suma graduados
) %>%
ggplot( # Inicia el objeto gráfico ggplot
aes(
x = reorder(REGIÓN, TotalGraduados), # Ordena de menor a mayor
y = TotalGraduados # Eje Y = graduados
)
) +
geom_col( # Crea columnas (barras) con las cantidades
fill = "#54A676" # Color verde
) +
coord_flip() + # Gira el gráfico horizontal
labs(
title = "Cantidad de Graduados por Región", # Título principal del gráfico
x = "Región", # Etiqueta eje X
y = "Número de Graduados" # Etiqueta eje Y
) +
geom_text( # Agrega etiquetas de texto sobre las barras
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",")), # ← punto para miles
hjust = 0.45, # Posición horizontal del texto
size = 3 # Tamaño del texto
) +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ",") # ← también en eje Y
) +
theme_minimal() + # Aplica un tema visual limpio y minimalista
theme(
plot.title = element_text(hjust = 0.5) # Centra el título
)La gráfica presentada muestra la cantidad total de graduados en programas de nivel técnico profesional, tecnológico y especializaciones técnicas y tecnológicas, desagregados por región geográfica. Se observa que la Región Andina concentra la gran mayoría de egresados, con un 88,4% del total, reflejando una fuerte centralización de la formación técnica y tecnológica en esta área. La Región Caribe representa el 7,1%, mientras que la Región Pacífica alcanza el 4%. Las regiones Amazonía, Orinoquía e Insular, en conjunto, apenas superan el 0,5%, con valores absolutos muy reducidos.
Este patrón de concentración territorial puede estar relacionado con la mayor cantidad de instituciones educativas técnicas y tecnológicas ubicadas en la Región Andina, así como con la densidad poblacional y la infraestructura educativa disponible.
El gráfico permite dimensionar visualmente estas diferencias, mostrando que la barra de la Región Andina sobrepasa con gran margen al resto.
El presente apartado muestra la distribución total de graduados según el sexo declarado por los estudiantes en los programas técnicos, tecnológicos y especializaciones técnicas y tecnológicas, durante el período consolidado. Este análisis permite identificar la composición por género y establecer comparaciones proporcionales que evidencien posibles diferencias de participación y culminación entre hombres y mujeres.
# Agrupar por género y sumar el total de graduados
df %>%
group_by(SEXO) %>% # Agrupa los datos por la columna SEXO
summarise( # Resume cada grupo
GRADUADOS = sum(GRADUADOS, na.rm = TRUE) # Suma la columna GRADUADOS ignorando valores NA
) %>%
mutate( # Crea nueva columna
PORCENTAJE = paste0( # Combina el número con el símbolo %
format(
round(GRADUADOS / sum(GRADUADOS) * 100, 1), # Calcula porcentaje sobre total
decimal.mark = ",", # Cambia el separador decimal a coma
big.mark = "." # Cambia el separador de miles a punto
),
"%" # Añade el símbolo de porcentaje
)
) %>%
mutate( # Crea otra columna transformada
GRADUADOS = scales::comma(GRADUADOS, big.mark = ".", decimal.mark = ",") # Usa punto para miles y coma para decimales
) %>%
knitr::kable() # Crea una tabla limpia en Markdown/HTML/PDF| SEXO | GRADUADOS | PORCENTAJE |
|---|---|---|
| Femenino | 157.463 | 53,5% |
| Masculino | 137.118 | 46,5% |
A partir de los datos tabulados, se observa que el sexo femenino concentra el 53,5% del total de graduados, equivalente a 157.463 registros, mientras que el sexo masculino representa el 46,5%, con 137.118 registros. En términos absolutos, esto significa que hubo 20.345 graduados más mujeres que hombres, lo cual sugiere una participación femenina ligeramente predominante en estos niveles educativos. Esta diferencia de siete puntos porcentuales se considera consistente, aunque no representa una brecha extrema, sino más bien una tendencia sostenida de mayor presencia femenina en programas de formación técnica y tecnológica.
# Cargar la librería patchwork para juntar graficos
library(patchwork)
# Gráfico de columnas: Graduados por Sexo
grafico_barra <- df %>%
group_by(SEXO) %>% # Agrupa los datos por la columna SEXO
summarise(
TotalGraduados = sum(GRADUADOS, na.rm = TRUE) # Suma los graduados de cada grupo (ignora NAs)
) %>%
ggplot( # Inicia la construcción del gráfico
aes(
x = SEXO, # Eje X: categorías de SEXO
y = TotalGraduados, # Eje Y: número total de graduados
fill = SEXO # Asigna color según la variable SEXO
)
) +
geom_col() + # Crea las barras sin color definido
scale_fill_manual( # Asigna colores específicos a cada categoría
values = c("Femenino" = "#54A676", "Masculino" = "#CE3031") # Femenino es verde, Masculino es rojo
) +
labs(
title = "Graduados por Sexo", # Título principal del gráfico
x = "Sexo", # Etiqueta del eje X
y = "Número de Graduados" # Etiqueta del eje Y
) +
geom_text( # Añade etiquetas de texto sobre las barras
aes(
label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",") # ← punto para miles
),
hjust = 0.5, # Centra horizontalmente la etiqueta en la barra
vjust = -0.3, # Ajusta verticalmente: -0.3 las sube sobre la barra
size = 3 # Tamaño del texto de la etiqueta
) +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ".") # Formato para el eje Y
) +
theme_minimal() + # Aplica un estilo visual limpio y minimalista
theme(
plot.title = element_text(hjust = 0.5) # Centra el título del gráfico
) +
guides(fill = guide_legend(title = "Sexo")) # Solo muestra la leyenda en este gráfico
# Gráfico de torta: Distribución porcentual de graduados por sexo
grafico_torta <- df %>%
group_by(SEXO) %>% # Agrupa por Sexo
summarise(
TotalGraduados = sum(GRADUADOS, na.rm = TRUE) # Suma total de graduados por Sexo
) %>%
mutate(
Porcentaje = TotalGraduados / sum(TotalGraduados) * 100 # Calcula porcentaje sobre el total
) %>%
ggplot(
aes(
x = "", # Vacío: no hay eje X en la torta
y = TotalGraduados, # Tamaño de cada porción
fill = SEXO # Rellena cada porción por Sexo
)
) +
geom_col(width = 1) + # Dibuja barras que luego se convertirán en torta
coord_polar(theta = "y") + # Convierte en gráfico circular (torta)
geom_text(
aes(
label = paste0(
format(round(Porcentaje, 1), decimal.mark = ",", big.mark = "."), "%" # Formato con coma para decimales y punto para miles
)
),
position = position_stack(vjust = 0.5), # Centra etiquetas en cada porción
size = 4
) +
labs(
title = "Distribución Porcentual de Graduados por Sexo",
fill = "Distribución porcentual de graduados por sexo"
) +
scale_fill_manual(
values = c("#54A676", "#CE3031") # Colores
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5), # Centra el título
legend.position = "none" # Elimina la leyenda del gráfico de torta
) +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ",") # Usa el formato correcto para el eje Y
)
# Mostrar los gráficos uno al lado del otro (sin combinarlos) y solo mostrar la leyenda en el gráfico de barras
grafico_barra | grafico_torta # El operador '|' se usa para mostrar gráficos lado a ladoEn síntesis, la información evidencia una mayor participación femenina en el total de graduados de programas técnicos, tecnológicos y especializaciones técnicas y tecnológicas, con una diferencia porcentual moderada pero constante respecto al sexo masculino. Este hallazgo es relevante para el diseño de estrategias educativas y de orientación profesional que reconozcan los perfiles predominantes y promuevan la equidad de género, considerando que las mujeres representan una mayoría en este segmento formativo. La visualización refuerza la interpretación cuantitativa, al facilitar la comprensión inmediata de la magnitud relativa entre las categorías.
En la siguiente tabla se presenta el top 10 de los programas academicos con mayor cantidad de graduados según su género:
# Identificar los top 10 programas por graduados
top_programas <- df %>%
group_by(`PROGRAMA_ACADÉMICO`) %>% # Agrupar por programa académico
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular total de graduados por programa, ignorando NAs
arrange(desc(TotalGraduados)) %>% # Ordenar de mayor a menor según total de graduados
slice_head(n = 10) %>% # Seleccionar los 10 programas con más graduados
pull(`PROGRAMA_ACADÉMICO`) # Extraer solo los nombres de los programas (vector)
df %>%
filter(`PROGRAMA_ACADÉMICO` %in% top_programas) %>% # Filtrar solo los registros que pertenezcan al top 10
group_by(`PROGRAMA_ACADÉMICO`, SEXO) %>% # Agrupar por programa académico y sexo
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular total de graduados por programa y sexo
arrange(desc(TotalGraduados)) %>% # Ordenar de mayor a menor según total de graduados
mutate(TotalGraduados = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",")) %>% # Agregar formato de miles
knitr::kable() # Genera una tabla ordenada en Markdown/HTML/PDF| PROGRAMA_ACADÉMICO | SEXO | TotalGraduados |
|---|---|---|
| TECNOLOGÍA EN GESTIÓN ADMINISTRATIVA | Femenino | 10.139 |
| TECNOLOGÍA EN ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN | Masculino | 8.788 |
| TECNOLOGÍA EN GESTIÓN DEL TALENTO HUMANO | Femenino | 7.365 |
| TECNOLOGÍA EN GESTIÓN EMPRESARIAL | Femenino | 7.234 |
| TÉCNICA PROFESIONAL EN SERVICIO DE POLICÍA | Masculino | 6.892 |
| TECNOLOGÍA EN GESTIÓN DE MERCADOS | Femenino | 6.613 |
| TECNOLOGÍA EN GESTIÓN CONTABLE Y FINANCIERA | Femenino | 6.483 |
| TECNOLOGÍA EN GESTIÓN DE LA SEGURIDAD Y SALUD EN EL TRABAJO | Femenino | 6.344 |
| TECNOLOGÍA EN GESTIÓN LOGÍSTICA | Masculino | 5.667 |
| TECNOLOGÍA EN GESTIÓN INTEGRADA DE LA CALIDAD, MEDIO AMBIENTE, SEGURIDAD Y SALUD OCUPACIONAL | Femenino | 5.283 |
| TECNOLOGÍA EN ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN | Femenino | 4.800 |
| TECNOLOGÍA EN GESTIÓN LOGÍSTICA | Femenino | 4.486 |
| TECNOLOGÍA EN GESTIÓN ADMINISTRATIVA | Masculino | 3.762 |
| TECNOLOGÍA EN GESTIÓN EMPRESARIAL | Masculino | 3.556 |
| TÉCNICA PROFESIONAL EN SERVICIO DE POLICÍA | Femenino | 3.272 |
| TECNOLOGÍA EN GESTIÓN DE MERCADOS | Masculino | 3.004 |
| TECNOLOGÍA EN GESTIÓN CONTABLE Y FINANCIERA | Masculino | 2.628 |
| TECNOLOGÍA EN GESTIÓN DEL TALENTO HUMANO | Masculino | 2.422 |
| TECNOLOGÍA EN GESTIÓN DE LA SEGURIDAD Y SALUD EN EL TRABAJO | Masculino | 2.275 |
| TECNOLOGÍA EN GESTIÓN INTEGRADA DE LA CALIDAD, MEDIO AMBIENTE, SEGURIDAD Y SALUD OCUPACIONAL | Masculino | 1.965 |
La tabla presenta las 15 instituciones de educación superior (IES) con mayor cantidad de graduados en programas técnicos y tecnológicos. Se observa que la distribución es altamente concentrada, con una IES que sobresale de manera contundente frente a las demás. El Servicio Nacional de Aprendizaje (SENA) ocupa el primer lugar con 157.881 graduados, representando un 53,6% del total de graduados. Este dato refleja la magnitud y cobertura nacional que tiene el SENA en la formación técnica y tecnológica en Colombia, consolidándose como el principal proveedor de este nivel educativo.
A continuación, se encuentran instituciones como la Dirección de Educación Policial con 17.711 graduados (6%) y la Corporación Unificada Nacional de Educación Superior - CUN con 6.153 graduados (2,1%). Estas cifras, mucho menores en comparación con el SENA, evidencian la diferencia en la escala operativa y la capacidad de formación entre las entidades.
df %>%
group_by(`INSTITUCIÓN_DE_EDUCACIÓN_SUPERIOR`) %>% # Agrupa por institución
summarise(
GRADUADOS = sum(GRADUADOS, na.rm = TRUE) # Suma graduados por institución
) %>%
mutate(
PORCENTAJE = paste0(
format(round(GRADUADOS / sum(GRADUADOS) * 100, 1), decimal.mark = ",", big.mark = "."), # Formato de porcentaje
"%"
)
) %>%
slice_max(
order_by = GRADUADOS, # Selecciona los mayores
n = 15 # Top 15 instituciones
) %>%
arrange(desc(GRADUADOS)) %>% # Reordena en orden descendente
mutate(
GRADUADOS = scales::comma(GRADUADOS, big.mark = ".", decimal.mark = ",") # Formato para graduados
) %>%
knitr::kable() # Crea la tabla limpia| INSTITUCIÓN_DE_EDUCACIÓN_SUPERIOR | GRADUADOS | PORCENTAJE |
|---|---|---|
| SERVICIO NACIONAL DE APRENDIZAJE - SENA | 157.881 | 53,6% |
| DIRECCIÓN DE EDUCACIÓN POLICÍAL | 17.171 | 5,8% |
| CORPORACIÓN UNIFICADA NACIONAL DE EDUCACIÓN SUPERIOR - CUN | 15.233 | 5,2% |
| UNIDADES TECNOLÓGICAS DE SANTANDER | 6.155 | 2,1% |
| ESCUELA MILITAR DE SUBOFICIALES SARGENTO INOCENCIO CHINCA | 4.352 | 1,5% |
| INSTITUCIÓN UNIVERSITARIA DE BARRANQUILLA - IUB | 3.530 | 1,2% |
| INSTITUTO TECNOLÓGICO METROPOLITANO | 3.373 | 1,1% |
| FUNDACIÓN UNIVERSITARIA COMPENSAR | 3.192 | 1,1% |
| UNIVERSIDAD ECCI | 3.191 | 1,1% |
| INSTITUTO TOLIMENSE DE FORMACIÓN TÉCNICA PROFESIONAL | 2.611 | 0,9% |
| POLITÉCNICO GRANCOLOMBIANO | 2.515 | 0,9% |
| CORPORACIÓN UNIVERSITARIA AMERICANA | 2.362 | 0,8% |
| FUNDACIÓN DE EDUCACIÓN SUPERIOR SAN JOSE - FESSANJOSE | 2.194 | 0,7% |
| FUNDACIÓN UNIVERSITARIA TECNOLÓGICO COMFENALCO - CARTAGENA | 2.070 | 0,7% |
| INSTITUTO DE EDUCACIÓN TÉCNICA PROFESIONAL DE ROLDANILLO | 2.019 | 0,7% |
El Top 3 de instituciones concentra aproximadamente el 61,7% del total de graduados, mostrando una estructura altamente concentrada en pocas instituciones. El resto de IES mantiene porcentajes que oscilan entre el 0,7% y el 1,3% cada una, lo que indica una participación marginal en comparación con las entidades líderes. Esta concentración tiene implicaciones relevantes para las políticas públicas y la oferta educativa, ya que gran parte de la formación técnica recae en un solo actor principal.
df %>%
group_by(`INSTITUCIÓN_DE_EDUCACIÓN_SUPERIOR`) %>% # Agrupa los datos por institución
summarise(
TotalGraduados = sum(GRADUADOS, na.rm = TRUE) # Calcula la suma de graduados por institución
) %>%
slice_max(
order_by = TotalGraduados, # Ordena de mayor a menor según TotalGraduados
n = 15 # Toma las 15 instituciones con más graduados
) %>%
mutate(
etiqueta_hjust = ifelse( # Crea columna que define posición horizontal de las etiquetas
row_number() == 1, # Si es la primera fila (la barra más alta)
0.6, # Coloca el texto afuera de la barra hacia la derecha
-0.2 # Para todas las demás, coloca adentro de la barra hacia la izquierda
)
) %>%
ggplot( # Inicia la construcción del gráfico
aes(
x = reorder(`INSTITUCIÓN_DE_EDUCACIÓN_SUPERIOR`, TotalGraduados), # Reordena eje X según cantidad de graduados
y = TotalGraduados # Eje Y es la cantidad de graduados
)
) +
geom_col(fill = "#0F3548") + # Dibuja las barras en color azul oscuro
coord_flip() + # Gira el gráfico horizontalmente
labs(
title = "Top 15 IES con Mayor Número de Graduados", # Título del gráfico
x = "Institución de Educación Superior", # Etiqueta del eje X
y = "Número de Graduados" # Etiqueta del eje Y
) +
geom_text( # Añade etiquetas de texto sobre las barras
aes(
label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = "."), # ← punto para miles, coma para decimales
hjust = etiqueta_hjust
),
size = 3
) +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ".") # ← también en eje Y
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = -1) # Centra o ajusta el título según estilo
)El gráfico de barras refuerza visualmente esta distribución asimétrica. La barra del SENA es notablemente más extensa, superando ampliamente al resto. Esta diferencia permite concluir que cualquier iniciativa que busque impactar de manera significativa la formación técnica y tecnológica en el país debe involucrar al SENA como aliado estratégico prioritario. Asimismo, el grupo de instituciones con menor número de graduados refleja un segmento más especializado o de cobertura localizada y destaca la desigualdad de magnitudes.
df %>% # Toma el data frame llamado df y comienza la cadena de operaciones
group_by(`PROGRAMA_ACADÉMICO`) %>% # Agrupa los datos por el nombre del programa académico
summarise( # Crea una tabla resumen
GRADUADOS = sum(GRADUADOS, na.rm = TRUE) # Suma el total de graduados por programa (ignorando valores NA)
) %>%
arrange(desc(GRADUADOS)) %>% # Ordena los programas de mayor a menor cantidad de graduados
slice_head(n = 20) %>% # Selecciona las primeras 20 filas (Top 20 programas)
mutate(
GRADUADOS = scales::comma(GRADUADOS, big.mark = ".", decimal.mark = ".") # ← punto para miles, coma para decimales
) %>%
knitr::kable() # Genera una tabla ordenada en Markdown/HTML/PDF| PROGRAMA_ACADÉMICO | GRADUADOS |
|---|---|
| TECNOLOGÍA EN GESTIÓN ADMINISTRATIVA | 13.901 |
| TECNOLOGÍA EN ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN | 13.588 |
| TECNOLOGÍA EN GESTIÓN EMPRESARIAL | 10.790 |
| TÉCNICA PROFESIONAL EN SERVICIO DE POLICÍA | 10.164 |
| TECNOLOGÍA EN GESTIÓN LOGÍSTICA | 10.153 |
| TECNOLOGÍA EN GESTIÓN DEL TALENTO HUMANO | 9.787 |
| TECNOLOGÍA EN GESTIÓN DE MERCADOS | 9.617 |
| TECNOLOGÍA EN GESTIÓN CONTABLE Y FINANCIERA | 9.111 |
| TECNOLOGÍA EN GESTIÓN DE LA SEGURIDAD Y SALUD EN EL TRABAJO | 8.619 |
| TECNOLOGÍA EN GESTIÓN INTEGRADA DE LA CALIDAD, MEDIO AMBIENTE, SEGURIDAD Y SALUD OCUPACIONAL | 7.248 |
| TECNOLOGÍA EN GESTIÓN DOCUMENTAL | 5.662 |
| TECNOLOGÍA EN REGENCIA DE FARMACIA | 5.020 |
| TECNOLOGÍA EN NEGOCIACIÓN INTERNACIONAL | 4.917 |
| TECNOLOGÍA EN GESTIÓN CONTABLE Y DE INFORMACIÓN FINANCIERA | 4.762 |
| TECNOLOGÍA EN PRODUCCIÓN AGRÍCOLA | 4.752 |
| TECNOLOGÍA EN GESTIÓN BANCARIA Y DE ENTIDADES FINANCIERAS | 3.888 |
| TECNOLOGÍA EN ENTRENAMIENTO DEPORTIVO | 3.514 |
| TECNOLOGÍA EN GESTIÓN DE RECURSOS NATURALES | 3.348 |
| TECNOLOGÍA EN GESTIÓN DE EMPRESAS AGROPECUARIAS | 3.288 |
| TECNOLOGÍA EN ELÉCTRICIDAD INDUSTRIAL | 3.182 |
La tabla presenta los veinte programas académicos con mayor cantidad de graduados en el periodo analizado, destacándose una fuerte orientación hacia la formación tecnológica y de gestión. De manera predominante, los programas de nivel tecnológico asociados a procesos administrativos, logísticos y de tecnologías de la información concentran la mayoría de graduados.
El programa con mayor número de graduados corresponde a Tecnología en Gestión Administrativa con 13.901 titulados, seguido de Tecnología en Análisis y Desarrollo de Sistemas de Información con 13.588, y Tecnología en Gestión Empresarial con 10.790. Estos tres programas por sí solos representan aproximadamente un tercio del total de graduados de este ranking, evidenciando una marcada preferencia de los estudiantes por carreras relacionadas con administración y tecnologías de soporte organizacional.
Entre los programas más demandados también se encuentran Técnica Profesional en Servicio de Policía y Tecnología en Gestión Logística, con más de 10.000 graduados cada uno, lo cual muestra que la seguridad y la logística siguen siendo sectores de alta importancia.
# Agrupar, sumar y seleccionar top 20
df %>%
group_by(`PROGRAMA_ACADÉMICO`) %>% # Agrupar por programa académico
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Sumar graduados por programa
arrange(desc(TotalGraduados)) %>% # Ordenar de mayor a menor
slice_head(n = 20) %>% # Top 20 programas
ggplot(
aes(
x = reorder(`PROGRAMA_ACADÉMICO`, TotalGraduados), # Reordenar eje X
y = TotalGraduados # Eje Y
)
) +
geom_col(fill = "#6BBCC0") + # Barras con color
geom_text( # Números sobre las barras
aes(
label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ".") # Punto para miles
),
hjust = -0.1, # Posición a la derecha de la barra
size = 3
) +
coord_flip() + # Girar gráfico horizontal
labs(
title = "Top 20 Programas Académicos (Graduados)", # Título
x = "Programa Académico", # Eje X
y = "Número de Graduados" # Eje Y
) +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = "."), # Eje Y con punto como miles
expand = expansion(mult = c(0, 0.1)) # Agrega espacio al final para que las etiquetas no se corten
) +
theme_minimal() + # Tema limpio
theme(
plot.title = element_text(hjust = 0.5) # Centrar título
)En un análisis por áreas temáticas, se identifican tres tendencias principales:
Formación administrativa y de gestión: una gran parte de los programas destacados llevan en su denominación la palabra “Gestión”, abarcando desde la logística y el talento humano, hasta las áreas contable, financiera y de mercados.
Enfoque tecnológico e informático: el segundo programa más relevante está directamente ligado al desarrollo de software, reafirmando la importancia de las competencias digitales.
Campos especializados y productivos: aunque en menor proporción, aparecen programas vinculados a sectores estratégicos como la producción agrícola, la electricidad industrial, los recursos naturales y el entrenamiento deportivo, todos con cifras superiores a 3.000 graduados.
La dispersión entre el primer y el último programa de la lista es amplia, ya que mientras el primero supera los 13.900 graduados, el último del ranking alcanza 3.182, reflejando un patrón de concentración en las áreas con mayor proyección laboral.
En términos estratégicos, estos resultados permiten inferir que la oferta académica y las preferencias estudiantiles están alineadas con las demandas de modernización empresarial, digitalización de procesos y fortalecimiento de servicios especializados. Esta información resulta clave para comprender la evolución de la educación técnica y tecnológica, así como para orientar políticas de formación que respondan a las necesidades del mercado laboral colombiano.
Se presentan los datos de los total de graduados por año:
df %>%
group_by(AÑO) %>% # Agrupar los datos por año
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular el total de graduados por año, ignorando valores NA
mutate(
TotalGraduados = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = "."))%>% #Formato de miles y decimales
knitr::kable() # Genera una tabla ordenada en Markdown/HTML/PDF| AÑO | TotalGraduados |
|---|---|
| 2022 | 153.086 |
| 2023 | 141.495 |
El gráfico que sigue debajo y la tabla anterior muestran una disminución en el número de graduados en 2023 en comparación con 2022. En 2022, el total de graduados fue de 153.086, mientras que en 2023 la cifra descendió a 141.495, lo que implica una reducción de 11.591 graduados.
df %>%
group_by(AÑO) %>% # Agrupar por año
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Sumar graduados por año
ggplot(aes(x = factor(AÑO), y = TotalGraduados, fill = factor(AÑO))) + # Estética: barras por año
geom_col(width = 0.6) + # Gráfico de barras
geom_text(
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",")), # Etiquetas con punto
vjust = -0.3,
size = 4
) +
labs(
title = "Comparativo de Graduados por Año", # Título
x = "Año", # Eje X
y = "Total de Graduados", # Eje Y
fill = "Año"
) +
theme_minimal() +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ",") # Eje Y con punto como miles
) +
scale_fill_brewer(palette = "Set2") # Paleta de coloresEste descenso podría ser el resultado de varios factores. Primero, la oferta educativa podría haber variado en 2023, ya sea por un menor número de programas disponibles o una reducción en la matrícula en comparación con el año anterior. Además, factores económicos o cambios en la demanda educativa también pueden influir en la decisión de los estudiantes de posponer o interrumpir sus estudios, afectando así el número de graduados.
Otro aspecto relevante podría ser el impacto de situaciones externas, como la pandemia de COVID-19, que afectó fuertemente la educación en 2020 y 2021, y cuyas repercusiones todavía pueden sentirse en los años posteriores, en términos de ajustes en los calendarios académicos o la finalización de programas de manera más lenta.
En resumen, la caída en los graduados en 2023 frente a 2022 es un indicio de que, aunque la educación sigue siendo una prioridad, hay factores internos y externos que podrían estar afectando la cantidad de graduados en el país, lo que subraya la importancia de monitorear estos cambios y adaptarse a las nuevas circunstancias.
El siguiente Grafico de barras tiene como objetivo analizar y visualizar la distribución de los graduados de educación superior según el semestre académico en el que finalizaron sus estudios. Específicamente, se filtran los datos para incluir únicamente los registros correspondientes al primer y segundo semestre, agrupando la información por cada uno de ellos.
A partir de esta agrupación, se calcula el total de graduados por semestre y el porcentaje que representa cada grupo respecto al total genera.
df %>%
filter(`NOMBRE_SEMESTRE` %in% c("Primer semestre", "Segundo semestre")) %>% # Filtra solo primer y segundo semestre.
group_by(`NOMBRE_SEMESTRE`) %>% # Agrupa por semestre.
summarise(
TotalGraduados = sum(GRADUADOS, na.rm = TRUE) # Total por semestre.
) %>%
mutate(
Porcentaje = round(TotalGraduados / sum(TotalGraduados) * 100, 1) # Porcentaje del total.
) %>%
ggplot(
aes(
x = `NOMBRE_SEMESTRE`,
y = TotalGraduados,
fill = `NOMBRE_SEMESTRE`
)
) +
geom_col() +
geom_text(
aes(
label = paste0(
format(TotalGraduados, big.mark = ".", decimal.mark = "."), # ← punto para miles
" (",
format(Porcentaje, decimal.mark = "."), "%)" # ← coma para decimales
)
),
vjust = -0.5
) +
labs(
title = "Graduados por Semestre",
x = "Semestre",
y = "Número de Graduados"
) +
scale_y_continuous(
labels = function(x) format(x, big.mark = ".", decimal.mark = ".") # ← punto miles, coma decimales en eje Y
) +
scale_fill_manual(values = c("#54A676", "#F0B034")) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5)
)Se observa la distribución de graduados por semestre, destacando una gran diferencia entre el primer y el segundo semestre. Con 52.056 graduados en el primer semestre, que representan el 34% del total, y 101.030 graduados en el segundo semestre, que constituyen el 66%, se observa una tendencia clara de que más de la mitad de los graduados se concentra en el segundo semestre. Este desequilibrio podría deberse a diversos factores. Es posible que la oferta académica en el segundo semestre sea mayor, o que el calendario académico favorezca una mayor graduación hacia el final del año. Además, aspectos institucionales o sociales como el momento de los exámenes finales o la culminación de proyectos de grado también podrían estar influyendo en esta concentración. En resumen, la diferencia significativa en la cantidad de graduados por semestre sugiere que el segundo semestre es el periodo de mayor graduación, lo cual debe ser considerado al momento de evaluar la planificación académica y los recursos educativos disponibles.
Este grafico tiene como finalidad analizar y visualizar la distribución de los graduados de programas técnicos y tecnológicos según el sexo y el nivel de formación. Para ello, se filtran los datos únicamente para los niveles “Formación técnica profesional” y “Tecnológico”, y luego se agrupan por nivel y sexo. A partir de esta agrupación, se calcula el total de graduados en cada categoría, y se presenta la información en un gráfico de barras agrupadas.
df %>%
filter(`NIVEL_DE_FORMACIÓN` %in% c("Formación técnica profesional", "Tecnológico")) %>% # Filtrar niveles deseados
group_by(`NIVEL_DE_FORMACIÓN`, SEXO) %>% # Agrupar por nivel y sexo
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Sumar graduados
ggplot(aes(x = `NIVEL_DE_FORMACIÓN`, y = TotalGraduados, fill = SEXO)) + # Mapeo estético
geom_col(position = "dodge") + # Barras agrupadas
geom_text(
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ".")), # ← punto miles, coma decimal
position = position_dodge(width = 0.9),
vjust = -0.3,
size = 3
) +
labs(
title = "Graduados por Nivel de Formación y Sexo",
x = "Nivel de Formación",
y = "Número de Graduados",
fill = "Sexo"
) +
theme_minimal() + # Tema visual
scale_fill_brewer(palette = "Set2") + # Paleta de colores
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ",") # ← Formato eje Y
) En el nivel de formación técnica profesional, se observa que la diferencia entre el número de graduadas y graduados masculinos es mínima. Femenino cuenta con 27.211 graduadas (el 50,5% del total en este nivel), mientras que Masculino tiene 26.654 graduados (el 49,5%). Esta distribución casi equitativa refleja una participación balanceada de ambos sexos en este tipo de programas.
Por otro lado, en el nivel tecnológico, la participación femenina se incrementa notablemente. 128.533 mujeres (el 54,3%) se graduaron en este nivel, mientras que 108.321 hombres (el 45,7%) completaron sus estudios. Este dato sugiere una mayor presencia femenina en el nivel tecnológico en comparación con el nivel de formación técnica profesional, lo que podría estar reflejando un cambio en las tendencias educativas y la mayor inclusión de las mujeres en áreas técnicas y tecnológicas.
En términos absolutos, el nivel tecnológico tiene una representación mucho mayor en cuanto al número total de graduados, con 236.854 graduados, frente a los 53.865 en el nivel de formación técnica profesional. Esto indica que los programas tecnológicos son más populares o, posiblemente, tienen una mayor capacidad de graduación.
En conclusión, el gráfico evidencia un crecimiento significativo en la participación femenina en el nivel tecnológico, una tendencia que refleja posiblemente tanto los cambios en las preferencias educativas como las políticas de inclusión en áreas de alta demanda como la tecnología.
Este Analisis tiene como propósito identificar y visualizar los 10 departamentos de Colombia con mayor número de graduados de educación superior. Para ello, agrupa los datos por Departamento, calcula el total de graduados por cada uno y selecciona los 10 con mayores cifras.
El resultado se presenta mediante un gráfico de barras horizontales, donde cada barra representa un departamento y su respectivo total de graduados.
df %>%
group_by(DEPARTAMENTO_DE_DOMICILIO) %>% # Agrupar por departamento
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular total de graduados
arrange(desc(TotalGraduados)) %>% # Ordenar de mayor a menor
slice_head(n = 10) %>% # Mostrar solo el top 10
ggplot(aes(x = reorder(DEPARTAMENTO_DE_DOMICILIO, TotalGraduados),
y = TotalGraduados)) + # Ejes
geom_col(fill = "#1F77B4") + # Barras azules
geom_text(
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",")), # Etiquetas con punto
hjust = -0.1,
size = 3
) +
coord_flip() + # Barras horizontales
labs(
title = "Top 10 Departamentos con más Graduados",
x = "Departamento",
y = "Número de Graduados"
) +
theme_minimal() +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ".") # Formato en eje Y, y miles.
)Se muestra la distribución de graduados por departamento, destacando a Bogotá D.C. Con la mayor cantidad de graduados, con 218.953 graduados, lo que representa una diferencia significativa respecto al resto. Antioquia, con 12.319 graduados, ocupa el segundo lugar, pero la diferencia con Bogotá es notable. Otros departamentos como Valle del Cauca (10.390), Atlántico (10.327) y Santander (9.065) también se encuentran en el top 5, aunque sus cifras son considerablemente más bajas en comparación con Bogotá.
La gran concentración de graduados en Bogotá D.C. puede explicarse por su rol como la capital del país, donde se encuentran muchas de las principales instituciones educativas y programas académicos, lo que atrae a estudiantes de todo el país. La diferencia entre Bogotá y los demás departamentos pone de manifiesto la centralización de la educación superior en la capital, mientras que las regiones fuera de Bogotá, aunque con cifras importantes, tienen una representación más equitativa en comparación entre ellas.
En conclusión, el gráfico refleja una clara desigualdad en la distribución de graduados en Colombia, con Bogotá dominando la lista y sugiriendo la necesidad de políticas que promuevan una distribución más equitativa de la educación superior en todo el país.
Este analisis tiene como objetivo identificar y visualizar los 10 municipios con mayor número de graduados de educación superior en Colombia. Para lograrlo, los datos se agrupan por el campo Municipio y se calcula el total de graduados por municipio. A continuación, se seleccionan los 10 municipios con mayores cifras y se representa la información mediante un gráfico de barras horizontales.
df %>%
filter(MUNICIPIO_DE_DOMICILIO != "Bogotá, D.C.") %>% # Excluir Bogotá D.C.
group_by(MUNICIPIO_DE_DOMICILIO) %>% # Agrupar por municipio
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular total por municipio
arrange(desc(TotalGraduados)) %>% # Ordenar descendente
slice_head(n = 10) %>% # Top 10 municipios
ggplot(aes(x = reorder(MUNICIPIO_DE_DOMICILIO, TotalGraduados),
y = TotalGraduados)) + # Ejes
geom_col(fill = "#FF7F0E") + # Barras color naranja
geom_text(
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ".")), # Etiquetas con punto
hjust = -0.1,
size = 3
) +
coord_flip() + # Barras horizontales
labs(
title = "Top 10 Municipios con más Graduados",
x = "Municipio",
y = "Número de Graduados"
) +
theme_minimal() +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ".") # Eje Y con punto miles
)Se observa a Medellín liderar la lista con 11.246 graduados, seguido por Barranquilla (9.623) y Bucaramanga (8.695). Estos tres municipios destacan por encima de los demás, reflejando una mayor concentración de graduados. Otros municipios como Cartagena de Indias (6.248), Nilo (4.352) y Cali (4.081) completan el top 6, pero con cifras considerablemente más bajas. Esta distribución muestra que, aunque hay una concentración importante en algunas ciudades, persisten diferencias regionales en el acceso a la educación superior, sugiriendo que el acceso a la educación podría estar más centralizado en ciertos municipios con mayor infraestructura educativa. En general, el gráfico resalta la desigualdad en la distribución de graduados fuera de Bogotá, lo que subraya la necesidad de políticas que promuevan el acceso equitativo a la educación superior en otras regiones del país.
Este gráfico tiene como objetivo mostrar la distribución del número total de graduados según el nivel de formación alcanzado. Para ello, se agrupan los datos por la variable NIVEL_DE_FORMACIÓN y se calcula el total de graduados en cada categoría. La información se visualiza mediante un gráfico de barras verticales, que permite comparar de forma clara cuáles niveles concentran mayor número de egresados.
df %>%
group_by(`NIVEL_DE_FORMACIÓN`) %>% # Agrupar por nivel de formación
summarise(TotalGraduados = sum(GRADUADOS, na.rm = TRUE)) %>% # Calcular el total de graduados por nivel
arrange(desc(TotalGraduados)) %>% # Ordenar de mayor a menor
ggplot(aes(x = reorder(`NIVEL_DE_FORMACIÓN`, TotalGraduados), # Reordenar niveles por cantidad
y = TotalGraduados)) + # Eje Y: número de graduados
geom_col(fill = "#4CAF50") + # Barras en color verde
geom_text(
aes(label = scales::comma(TotalGraduados, big.mark = ".", decimal.mark = ",")), # Etiquetas con punto y coma
vjust = -0.3,
size = 3.5
) +
labs(
title = "Graduados por Nivel de Formación",
x = "Nivel de Formación",
y = "Número de Graduados"
) +
theme_minimal() +
scale_y_continuous(
labels = scales::comma_format(big.mark = ".", decimal.mark = ",") # Eje Y formateado con punto
) Se muestra una clara predominancia de graduados en el nivel tecnológico, con 236.854 graduados, una cifra que supera ampliamente a los otros niveles. Le sigue el nivel de formación técnica profesional con 53.865 graduados, mientras que los niveles de especialización tienen una presencia mucho más reducida, con solo 121 graduados en especialización técnico profesional y 3.741 en especialización tecnológica. Esta distribución resalta una preferencia generalizada por el nivel tecnológico, posiblemente debido a la alta demanda de este tipo de formación en el mercado laboral, mientras que los niveles de especialización aún cuentan con una oferta y demanda más limitadas. En resumen, el gráfico subraya la importancia y el crecimiento de la formación tecnológica en comparación con las especializaciones, que parecen tener un menor impacto en la cantidad de graduados.
El análisis presentado a lo largo de este informe revela diversas tendencias y desigualdades en el panorama educativo colombiano en relación con los graduados de programas técnicos y tecnológicos durante los años 2022 y 2023. La centralización de la educación superior en la Región Andina, con un 88,4% de los graduados concentrados en esta área, refleja una brecha significativa en el acceso a la formación técnica y tecnológica entre las regiones del país. En particular, la Región Caribe y la Región Pacífica tienen una participación mucho más reducida, lo que sugiere la necesidad de fortalecer las políticas educativas en estas zonas para reducir las desigualdades.
En cuanto a género, se observa una ligera superioridad femenina, con un 53,5% de graduadas frente al 46,5% de graduados masculinos, lo que resalta la presencia creciente de las mujeres en la educación técnica y tecnológica, especialmente en el nivel tecnológico. Esta tendencia apunta a un cambio positivo hacia la inclusión de las mujeres en áreas de alta demanda como la tecnología.
En el análisis por instituciones educativas, el SENA se destaca como el principal proveedor de formación técnica y tecnológica en Colombia, con más del 53% de los graduados de este nivel. Este dato resalta su rol fundamental en la formación de profesionales técnicos en el país, consolidándose como un actor clave en el sector educativo.
Finalmente, el descenso en la cantidad de graduados en 2023 respecto a 2022 sugiere que, aunque la educación sigue siendo una prioridad, factores como cambios en la oferta educativa, demandas económicas y efectos de la pandemia podrían estar influyendo en esta disminución. En general, este informe pone de manifiesto la importancia de monitorear las tendencias educativas para adaptar las políticas y asegurar un acceso más equitativo a la educación superior, especialmente en áreas rurales y periféricas del país.