Avance de Proyecto de Intervención 1

Nombre del estudiante: Lilia Pamela Solis Reyes

Institución: Universidad Digital del Estado de México

Programa: Doctorado en Gestión e Innovación Educativa

Asignatura: Análisis de Datos y Toma de Decisiones

Actividad: Avance de Proyecto de Intervención 1

Fecha: 19 de febrero de 2026

1 Desarrollo

1.1 Introducción

El conjunto de datos utilizado corresponde a una base de información educativa del Departamento de Estadísticas Institucionales de la Universidad Autónoma de Chapingo (Universidad Autónoma Chapingo 2025), la cual integra variables relacionadas con características académicas como el ingreso, egreso y titulados, de una población estudiantil durante el ciclo 2025. Su estructura permite analizar patrones de rendimiento y permanencia escolar, lo cual resulta relevante para la identificación de tendencias, la detección de factores asociados al desempeño académico y la toma de decisiones basadas en evidencia. Este tipo de datos es fundamental para el diseño de estrategias de intervención educativa, la mejora de procesos formativos y el fortalecimiento de políticas educativas orientadas a la calidad educativa.


1.2 Resultados

library(readxl)


hojas <- excel_sheets("BASE2025.xlsx")
hojas
## [1] "Nvo. Ingreso 2025" "Egresados 2025"    "Titulados 2025"
datos <- lapply(hojas, function(h) {
  read_excel("BASE2025.xlsx", sheet = h)
})
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...10`
## • `` -> `...11`
## • `` -> `...12`
## • `` -> `...13`
## • `` -> `...14`
## • `` -> `...15`
names(datos) <- hojas


str(datos)
## List of 3
##  $ Nvo. Ingreso 2025: tibble [36 × 15] (S3: tbl_df/tbl/data.frame)
##   ..$ No. DE ASPIRANTES POR ESTADO Y GÉNERO       : chr [1:36] "No." NA "1" "2" ...
##   ..$ ...2                                        : chr [1:36] "ESTADO" NA "AGUASCALIENTES" "BAJA CALIFORNIA" ...
##   ..$ ...3                                        : chr [1:36] "PREPARATORIA" "H" "10" "19" ...
##   ..$ ...4                                        : chr [1:36] NA "M" "7" "21" ...
##   ..$ ...5                                        : chr [1:36] "PROPEDÉUTICO" "H" "58" "85" ...
##   ..$ ...6                                        : chr [1:36] NA "M" "57" "91" ...
##   ..$ ...7                                        : chr [1:36] "TOTAL" NA "132" "216" ...
##   ..$ ...8                                        : logi [1:36] NA NA NA NA NA NA ...
##   ..$ No. DE ALUMNOS INSCRITOS POR ESTADO Y GÉNERO: chr [1:36] "No." NA "1" "2" ...
##   ..$ ...10                                       : chr [1:36] "ESTADO" NA "AGUASCALIENTES" "BAJA CALIFORNIA" ...
##   ..$ ...11                                       : chr [1:36] "PREPARATORIA" "H" "2" "4" ...
##   ..$ ...12                                       : chr [1:36] NA "M" "1" "3" ...
##   ..$ ...13                                       : chr [1:36] "PROPEDÉUTICO" "H" "8" "11" ...
##   ..$ ...14                                       : chr [1:36] NA "M" "1" "16" ...
##   ..$ ...15                                       : chr [1:36] "TOTAL" NA "12" "34" ...
##  $ Egresados 2025   : tibble [3,031 × 18] (S3: tbl_df/tbl/data.frame)
##   ..$ NÚM                : num [1:3031] 1 2 3 4 5 6 7 8 9 10 ...
##   ..$ AÑO                : num [1:3031] 2025 2025 2025 2025 2025 ...
##   ..$ NIVEL DE EGRESO    : chr [1:3031] "MAESTRÍA" "DOCTORADO" "DOCTORADO" "MAESTRÍA" ...
##   ..$ GENERO             : chr [1:3031] "H" "H" "H" "H" ...
##   ..$ EDAD               : num [1:3031] 30 36 40 28 29 29 35 34 35 38 ...
##   ..$ NACIONALIDAD       : chr [1:3031] "MEXICANA" "MEXICANA" "MEXICANA" "MEXICANA" ...
##   ..$ ESTADO DOMICILIO   : chr [1:3031] "OAXACA" "ESTADO DE MÉXICO" "ESTADO DE MÉXICO" "OAXACA" ...
##   ..$ MUNICIPIO DOMICILIO: chr [1:3031] "SAN MIGUEL TENANGO, OAX." "TEXCOCO, MEX." "TEXCOCO, MEX." "SANTA MARIA TLAHUITOLTEPEC, OAX." ...
##   ..$ NIVEL DE INGRESO   : chr [1:3031] "LICENCIATURA" "MAESTRÍA" "MAESTRÍA" "LICENCIATURA" ...
##   ..$ CATEGORÍA          : chr [1:3031] "COMPLETO" "COMPLETO" "COMPLETO" "COMPLETO" ...
##   ..$ UNIDAD ACADÉMICA   : chr [1:3031] "SEDE SAN CRISTOBAL DE LAS CASAS, CHIAPAS" "DEIS EN FITOTECNIA" "DEIS EN SOCIOLOGÍA RURAL" "DEIS EN IRRIGACIÓN" ...
##   ..$ SEDE               : chr [1:3031] "SEDE CHIAPAS" "CHAPINGO" "CHAPINGO" "CHAPINGO" ...
##   ..$ ESTADO SEDE        : chr [1:3031] "CHIAPAS" "MÉXICO" "MÉXICO" "MÉXICO" ...
##   ..$ PROGRAMA EDUCATIVO : chr [1:3031] "MAESTRÍA EN CIENCIAS EN DESARROLLO RURAL REGIONAL" "DOCTORADO EN CIENCIAS EN HORTICULTURA" "DOCTORADO EN CIENCIAS EN EDUCACIÓN AGRÍCOLA SUPERIOR" "MAESTRÍA EN INGENIERÍA AGRÍCOLA Y USO INTEGRAL DEL AGUA" ...
##   ..$ LENGUA             : chr [1:3031] "CHONTAL DE OAXACA" "HUASTECO" "MAZAHUA" "MIXE" ...
##   ..$ AFRODESCENDIENTES  : chr [1:3031] "NO" "NO" "NO" "NO" ...
##   ..$ DISCAPACIDAD       : chr [1:3031] NA NA NA NA ...
##   ..$ TIPO DISCAPACIDAD  : chr [1:3031] NA NA NA NA ...
##  $ Titulados 2025   : tibble [1,219 × 17] (S3: tbl_df/tbl/data.frame)
##   ..$ NÚM                : num [1:1219] 1 2 3 4 5 6 7 8 9 10 ...
##   ..$ AÑO                : num [1:1219] 2025 2025 2025 2025 2025 ...
##   ..$ NIVEL DE TITULACIÓN: chr [1:1219] "LICENCIATURA" "LICENCIATURA" "LICENCIATURA" "LICENCIATURA" ...
##   ..$ GENERO             : chr [1:1219] "H" "H" "M" "H" ...
##   ..$ EDAD               : num [1:1219] 25 26 28 27 26 24 24 30 26 25 ...
##   ..$ NACIONALIDAD       : chr [1:1219] "MEXICANA" "MEXICANA" "MEXICANA" "MEXICANA" ...
##   ..$ ESTADO             : chr [1:1219] "VERACRUZ DE IGNACIO DE LA LLAVE" "ESTADO DE MÉXICO" "ESTADO DE MÉXICO" "ESTADO DE MÉXICO" ...
##   ..$ MUNICIPIO          : chr [1:1219] "ZONGOLICA, VER." "SAN JOSE CHIAPA, PUE." "TEXCOCO, MEX." "AMEALCO, QRO." ...
##   ..$ NIVEL DE INGRESO   : chr [1:1219] "PROPEDÉUTICO" "PREPARATORIA" "PREPARATORIA" "PROPEDÉUTICO" ...
##   ..$ TIPO DE TITULACIÓN : chr [1:1219] "PRESENTA TESIS PROFESIONAL" "PRESENTA TESIS PROFESIONAL" "PRESENTA TESIS PROFESIONAL" "PRESENTA TESIS PROFESIONAL" ...
##   ..$ MODALIDAD          : chr [1:1219] "INDIVIDUAL" "INDIVIDUAL" "INDIVIDUAL" "INDIVIDUAL" ...
##   ..$ TÍTULO DE TESIS    : chr [1:1219] "SEPARACIÓN DE PROTEÍNAS MEDIANTE EXTRACCIÓN ACUOSA EN DOS FASES" "RESISTENCIA DE Bidens odorata A HERBICIDAS AUXÍNICOS Y SULFONILUREAS EN BENITO JUÁREZ, TLAXCALA" "IDENTIFICACIÓN DE ESPECIES DE TRIPS ASOCIADAS CON EL CULTIVO DE CARAMBOLO EN YAUTEPEC, MORELOS" "CONSTRUCCIÓN Y EVALUACIÓN DE SECADOR SOLAR PARA PRODUCTOS AGRÍCOLAS" ...
##   ..$ CATEGORÍA          : chr [1:1219] "BECADO EXTERNO" "BECADO EXTERNO" "BECADO EXTERNO" "BECADO EXTERNO" ...
##   ..$ UNIDAD ACADÉMICA   : chr [1:1219] "DEIS EN INGENIERÍA AGROINDUSTRIAL" "DEIS EN PARASITOLOGÍA AGRÍCOLA" "DEIS EN PARASITOLOGÍA AGRÍCOLA" "DEIS EN MECÁNICA AGRÍCOLA" ...
##   ..$ SEDE               : chr [1:1219] "CHAPINGO" "CHAPINGO" "CHAPINGO" "CHAPINGO" ...
##   ..$ PROGRAMA EDUCATIVO : chr [1:1219] "INGENIERÍA AGROINDUSTRIAL" "INGENIERO AGRÓNOMO ESPECIALISTA EN PARASITOLOGÍA AGRÍCOLA" "INGENIERO AGRÓNOMO ESPECIALISTA EN PARASITOLOGÍA AGRÍCOLA" "INGENIERO MECÁNICO AGRÍCOLA" ...
##   ..$ LENGUA             : chr [1:1219] "NÁHUATL" NA NA NA ...

head(datos[[Nvo.Ingreso 2025]]) head(datos[[Egresados 2025]]) head(datos[[Titulados 2025]])

Para el análisis descriptivo se seleccionó la hoja correspondiente a Egresados 2025, por considerarse la más pertinente para el objetivo del estudio, ya que concentra información relevante sobre el comportamiento y las características de la población estudiantil analizada.

base <- datos[["Egresados 2025"]]


str(base)
## tibble [3,031 × 18] (S3: tbl_df/tbl/data.frame)
##  $ NÚM                : num [1:3031] 1 2 3 4 5 6 7 8 9 10 ...
##  $ AÑO                : num [1:3031] 2025 2025 2025 2025 2025 ...
##  $ NIVEL DE EGRESO    : chr [1:3031] "MAESTRÍA" "DOCTORADO" "DOCTORADO" "MAESTRÍA" ...
##  $ GENERO             : chr [1:3031] "H" "H" "H" "H" ...
##  $ EDAD               : num [1:3031] 30 36 40 28 29 29 35 34 35 38 ...
##  $ NACIONALIDAD       : chr [1:3031] "MEXICANA" "MEXICANA" "MEXICANA" "MEXICANA" ...
##  $ ESTADO DOMICILIO   : chr [1:3031] "OAXACA" "ESTADO DE MÉXICO" "ESTADO DE MÉXICO" "OAXACA" ...
##  $ MUNICIPIO DOMICILIO: chr [1:3031] "SAN MIGUEL TENANGO, OAX." "TEXCOCO, MEX." "TEXCOCO, MEX." "SANTA MARIA TLAHUITOLTEPEC, OAX." ...
##  $ NIVEL DE INGRESO   : chr [1:3031] "LICENCIATURA" "MAESTRÍA" "MAESTRÍA" "LICENCIATURA" ...
##  $ CATEGORÍA          : chr [1:3031] "COMPLETO" "COMPLETO" "COMPLETO" "COMPLETO" ...
##  $ UNIDAD ACADÉMICA   : chr [1:3031] "SEDE SAN CRISTOBAL DE LAS CASAS, CHIAPAS" "DEIS EN FITOTECNIA" "DEIS EN SOCIOLOGÍA RURAL" "DEIS EN IRRIGACIÓN" ...
##  $ SEDE               : chr [1:3031] "SEDE CHIAPAS" "CHAPINGO" "CHAPINGO" "CHAPINGO" ...
##  $ ESTADO SEDE        : chr [1:3031] "CHIAPAS" "MÉXICO" "MÉXICO" "MÉXICO" ...
##  $ PROGRAMA EDUCATIVO : chr [1:3031] "MAESTRÍA EN CIENCIAS EN DESARROLLO RURAL REGIONAL" "DOCTORADO EN CIENCIAS EN HORTICULTURA" "DOCTORADO EN CIENCIAS EN EDUCACIÓN AGRÍCOLA SUPERIOR" "MAESTRÍA EN INGENIERÍA AGRÍCOLA Y USO INTEGRAL DEL AGUA" ...
##  $ LENGUA             : chr [1:3031] "CHONTAL DE OAXACA" "HUASTECO" "MAZAHUA" "MIXE" ...
##  $ AFRODESCENDIENTES  : chr [1:3031] "NO" "NO" "NO" "NO" ...
##  $ DISCAPACIDAD       : chr [1:3031] NA NA NA NA ...
##  $ TIPO DISCAPACIDAD  : chr [1:3031] NA NA NA NA ...
summary(base)
##       NÚM              AÑO       NIVEL DE EGRESO       GENERO         
##  Min.   :   1.0   Min.   :2025   Length:3031        Length:3031       
##  1st Qu.: 758.5   1st Qu.:2025   Class :character   Class :character  
##  Median :1516.0   Median :2025   Mode  :character   Mode  :character  
##  Mean   :1516.0   Mean   :2025                                        
##  3rd Qu.:2273.5   3rd Qu.:2025                                        
##  Max.   :3031.0   Max.   :2025                                        
##       EDAD       NACIONALIDAD       ESTADO DOMICILIO   MUNICIPIO DOMICILIO
##  Min.   :17.00   Length:3031        Length:3031        Length:3031        
##  1st Qu.:19.00   Class :character   Class :character   Class :character   
##  Median :22.00   Mode  :character   Mode  :character   Mode  :character   
##  Mean   :22.12                                                            
##  3rd Qu.:23.00                                                            
##  Max.   :69.00                                                            
##  NIVEL DE INGRESO    CATEGORÍA         UNIDAD ACADÉMICA       SEDE          
##  Length:3031        Length:3031        Length:3031        Length:3031       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##  ESTADO SEDE        PROGRAMA EDUCATIVO    LENGUA          AFRODESCENDIENTES 
##  Length:3031        Length:3031        Length:3031        Length:3031       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##  DISCAPACIDAD       TIPO DISCAPACIDAD 
##  Length:3031        Length:3031       
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 
base_num <- base[sapply(base, is.numeric)]


medias <- sapply(base_num, mean, na.rm = TRUE)


medianas <- sapply(base_num, median, na.rm = TRUE)


desv_std <- sapply(base_num, sd, na.rm = TRUE)


estadisticas <- data.frame(
  Media = medias,
  Mediana = medianas,
  Desviacion_Estandar = desv_std
)

estadisticas
##           Media Mediana Desviacion_Estandar
## NÚM  1516.00000    1516          875.118659
## AÑO  2025.00000    2025            0.000000
## EDAD   22.12207      22            4.633884
lapply(base_num, summary)
## $NÚM
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     1.0   758.5  1516.0  1516.0  2273.5  3031.0 
## 
## $AÑO
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2025    2025    2025    2025    2025    2025 
## 
## $EDAD
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.00   19.00   22.00   22.12   23.00   69.00
base <- datos[["Egresados 2025"]]


base_num <- base[sapply(base, is.numeric)]

base <- datos[["Egresados 2025"]]

hist(base_num[[1]],
     main = "Distribución de la variable",
     xlab = "Valores",
     col = "lightblue",
     border = "white")

El histograma permite observar la distribución de la variable analizada en la hoja Egresados 2025, mostrando cómo se concentran los valores de la población estudiantil egresada. A partir de esta visualización es posible identificar la tendencia central de los datos, así como la presencia de concentraciones o asimetrías, lo que facilita comprender el comportamiento general de los egresados y detectar patrones relevantes en la distribución de la información.

base <- datos[["Egresados 2025"]]

boxplot(base_num[[1]],
        main = "Boxplot de la variable",
        ylab = "Valores",
        col = "lightgreen")

El boxplot evidencia el nivel de dispersión de los datos y la distribución de los valores correspondientes a los egresados. Esta visualización permite identificar el rango intercuartílico, la mediana y posibles valores atípicos, lo cual resulta útil para reconocer variaciones significativas dentro del conjunto de datos. La presencia de estos elementos aporta información relevante sobre la heterogeneidad de la población egresada y posibles diferencias entre los registros analizados.

base <- datos[["Egresados 2025"]]

if(ncol(base_num) >= 2){
  plot(base_num[[1]], base_num[[2]],
       main = "Gráfico de dispersión",
       xlab = names(base_num)[1],
       ylab = names(base_num)[2],
       pch = 19,
       col = "steelblue")
}

El gráfico de dispersión muestra la relación entre dos variables numéricas seleccionadas de la hoja Egresados 2025, permitiendo analizar si existe algún tipo de asociación entre ellas. A través de esta visualización es posible identificar tendencias, agrupamientos o patrones que sugieran comportamientos similares entre los egresados. Este análisis contribuye a una mejor comprensión de cómo interactúan las variables educativas y apoya la interpretación de los datos desde una perspectiva analítica y descriptiva.

Revisando el texto (Scetta, A. 2021), las visualizaciones generadas permiten identificar la distribución de los datos, los niveles de dispersión y las posibles relaciones entre variables. El histograma muestra la forma de la distribución, el boxplot permite observar la variabilidad y concentración de los datos, mientras que el gráfico de dispersión facilita el análisis de relaciones entre variables, contribuyendo a una interpretación integral del comportamiento del conjunto de datos.


2 Conclusiones

  1. Con relación al uso de programación R (Hereira, S. 2022) y con respecto al análisis de datos, representa una herramienta de gran valor para la investigación educativa, ya que permite realizar análisis estadísticos rigurosos, generar visualizaciones claras y documentar los procesos de forma transparente. No obstante, su implementación implica un nivel de complejidad técnica que requiere del desarrollo de habilidades específicas, como la comprensión de la estructura de los datos, el uso adecuado de paquetes y la correcta interpretación de los resultados.

  2. Las visualizaciones generadas, tales como histogramas, boxplots y gráficos de dispersión, complementaron el análisis estadístico al permitir una comprensión más clara de la distribución de los datos, la variabilidad entre los estudiantes y la posible relación entre variables educativas. Estas herramientas visuales fortalecen el análisis al hacer visibles fenómenos que no siempre se identifican únicamente a través de indicadores numéricos.

  3. En conjunto, el uso de técnicas de análisis de datos aplicadas al contexto educativo demuestra su potencial para apoyar la toma de decisiones informadas, el diseño de estrategias de intervención y la mejora de los procesos de enseñanza y aprendizaje. Este enfoque analítico contribuye al fortalecimiento de prácticas educativas basadas en datos y sienta las bases para estudios posteriores de mayor profundidad.


Referencias

Hereira, S. 2022. “R Markdown En Rstudio. Haciendo Documentos y Presentaciones Desde Rstudio.” https://www.youtube.com/watch?v=C6Xuimk7p8A.
Scetta, A. 2021. “Estableciendo Relaciones Entre Variables.” https://rpubs.com/angiescetta/regresion-lineal.
Universidad Autónoma Chapingo. 2025. “Bases de Datos Anuales En Formato Excel.” https://upom.chapingo.mx/base-de-datos-en-excel/.