1. Introducción

El presente informe tiene como objetivo explorar y analizar la información recopilada en el dataset que contiene datos de alumnos titulados de educación superior a partir del año 2020. Este módulo proporciona una visión detallada de diversos aspectos relacionados con la graduación de estudiantes en instituciones de educación superior.

2. Origen y Proceso de Obtención de Datos

Los datos utilizados en este análisis fueron obtenidos de [datosabiertos.mineduc.cl/] https://datosabiertos.mineduc.cl/titulados-en-educacion-superior El proceso de obtención de datos incluyó la selección de la fuente, descarga en formato CSV, exploración inicial y limpieza.

Importar base de datos(dataset):

# Importar base de datos
titulados <- read.csv("C:/Users/janoa/OneDrive/Escritorio/TituladosEdSuperior2022.csv", sep = ";")
View(titulados)

3. Limpieza de Datos

3.1 Cambio de Nombres de Columnas

Antes del cambio de nombres de columnas:

# Visualización de las primeras filas
head(titulados)
##   cat_periodo    codigo_unico mrun gen_alu fec_nac_alu   rango_edad
## 1        2022   I70S1C574J2V1   43       2      199007 30 a 34 Años
## 2        2022     I69S1C5J1V1  150       2      199606 25 a 29 Años
## 3        2022   I13S6C160J1V1  151       2      199608 25 a 29 Años
## 4        2022   I34S1C483J3V1  189       2      199605 25 a 29 Años
## 5        2022     I3S1C46J1V1  239       2      199710 20 a 24 Años
## 6        2022 I430S22C201J1V1  346       2      200005 20 a 24 Años
##   anio_ing_carr_ori sem_ing_carr_ori anio_ing_carr_act sem_ing_carr_act
## 1              2017                1              2017                1
## 2              2016                1              2016                1
## 3              2016                1              2016                1
## 4              2021                1              2021                1
## 5              1900                0              2017                1
## 6              2019                1              2019                1
##                                      nomb_titulo_obtenido
## 1                                                        
## 2                                              PERIODISTA
## 3                                           FONOAUDIOLOGO
## 4                                        NO OTORGA TITULO
## 5                                               ENFERMERA
## 6 TECNICO DE NIVEL SUPERIOR EN ADMINISTRACION DE EMPRESAS
##                                     nomb_grado_obtenido fecha_obtencion_titulo
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD               20220506
## 2                     LICENCIADO EN COMUNICACION SOCIAL               20220602
## 3                          LICENCIADO EN FONOAUDIOLOGIA               20230213
## 4                                       NO OTORGA GRADO               20220627
## 5                              LICENCIADA EN ENFERMERIA               20230123
## 6                                                                     20220307
##                    tipo_inst_1                  tipo_inst_2
## 1                Universidades          Universidades CRUCH
## 2                Universidades          Universidades CRUCH
## 3                Universidades       Universidades Privadas
## 4                Universidades          Universidades CRUCH
## 5                Universidades          Universidades CRUCH
## 6 Centros de Formación Técnica Centros de Formación Técnica
##                     tipo_inst_3 cod_inst                   nomb_inst cod_sede
## 1 Universidades Estatales CRUCH       70        UNIVERSIDAD DE CHILE        1
## 2  Universidades Privadas CRUCH       69 UNIVERSIDAD ALBERTO HURTADO        1
## 3        Universidades Privadas       13     UNIVERSIDAD SANTO TOMAS        6
## 4  Universidades Privadas CRUCH       34    UNIVERSIDAD DE LOS ANDES        1
## 5  Universidades Privadas CRUCH        3  UNIVERSIDAD DIEGO PORTALES        1
## 6  Centros de Formación Técnica      430                  CFT INACAP       22
##                 nomb_sede cod_carrera
## 1                SANTIAGO         574
## 2 CASA CENTRAL (SANTIAGO)           5
## 3       SEDE VIÑA DEL MAR         160
## 4 CASA CENTRAL (SANTIAGO)         483
## 5 CASA CENTRAL (SANTIAGO)          46
## 6            SEDE CHILLAN         201
##                                            nomb_carrera nivel_global
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD    Postgrado
## 2                                            PERIODISMO     Pregrado
## 3                                        FONOAUDIOLOGIA     Pregrado
## 4                   DIPLOMADO EN DERECHO DE LA INFANCIA    Postítulo
## 5                                            ENFERMERIA     Pregrado
## 6                            ADMINISTRACION DE EMPRESAS     Pregrado
##                      nivel_carrera_1        nivel_carrera_2 dur_estudio_carr
## 1                           Magister               Magister                4
## 2       Profesional Con Licenciatura Carreras Profesionales               10
## 3       Profesional Con Licenciatura Carreras Profesionales               10
## 4 Diplomado (superior a un semestre)              Postítulo                1
## 5       Profesional Con Licenciatura Carreras Profesionales               10
## 6          Técnico de Nivel Superior      Carreras Técnicas                4
##   dur_proceso_tit dur_total_carr   region_sede provincia_sede  comuna_sede
## 1               0              4 Metropolitana       SANTIAGO     SANTIAGO
## 2               1             10 Metropolitana       SANTIAGO     SANTIAGO
## 3               0             10    Valparaíso     VALPARAISO VIÑA DEL MAR
## 4               0              1 Metropolitana       SANTIAGO   LAS CONDES
## 5               0             10 Metropolitana       SANTIAGO     SANTIAGO
## 6               0              4         Ñuble      DIGUILLIN      CHILLAN
##          jornada      modalidad version tipo_plan_carr
## 1     Vespertino     Presencial       1   Plan Regular
## 2         Diurno     Presencial       1   Plan Regular
## 3         Diurno     Presencial       1   Plan Regular
## 4 Semipresencial Semipresencial       1   Plan Regular
## 5         Diurno     Presencial       1   Plan Regular
## 6         Diurno     Presencial       1   Plan Regular
##             area_cineunesco                                   area_cine_f_97
## 1         Ciencias Sociales Ciencias Sociales, Enseñanza Comercial y Derecho
## 2         Ciencias Sociales Ciencias Sociales, Enseñanza Comercial y Derecho
## 3                     Salud                       Salud y Servicios Sociales
## 4                   Derecho Ciencias Sociales, Enseñanza Comercial y Derecho
## 5                     Salud                       Salud y Servicios Sociales
## 6 Administración y Comercio Ciencias Sociales, Enseñanza Comercial y Derecho
##                        subarea_cine_f_97
## 1 Ciencias Sociales y del Comportamiento
## 2               Periodismo e Información
## 3                               Medicina
## 4                                Derecho
## 5                               Medicina
## 6   Enseñanza Comercial y Administración
##                                area_cine_f_13
## 1 Ciencias Sociales, Periodismo e Información
## 2 Ciencias Sociales, Periodismo e Información
## 3                           Salud y Bienestar
## 4        Administración de Empresas y Derecho
## 5                           Salud y Bienestar
## 6        Administración de Empresas y Derecho
##                        subarea_cine_f_13               area_carrera_generica_n
## 1 Ciencias Sociales y del Comportamiento         Magister en Ciencias Sociales
## 2               Periodismo e Información                            Periodismo
## 3                                  Salud                        Fonoaudiología
## 4                                Derecho                  Postítulo en Derecho
## 5                                  Salud                            Enfermería
## 6   Educación Comercial y Administración Técnico en Administración de Empresas

Cambio de nombres de columnas:

# Cambio de nombres de columnas
colnames(titulados) <- c("periodo", "Codigo Unico", "numero", "genero", "fecha nacimiento", "rango edad", "año inicio de carrera", "semestre de inicio de la carrera", "año carrera actual", "cantidad titulo obtenido", "nombre grado obtenido", "fecha obtencion titulo", "tipo de instituto1", "tipo de instituto 2", "tipo de instituto 3", "codigo instituto", "nombre de instituto", "codigo sede", "nombre sede", "codigo carrera", "nombre carrera", "nivel global", "nivel carrera", "nivel carrera 2", "duracion carrera", "duracion proceso titulado", "duracion total de la carrera", "region sede", "provincia sede", "comuna sede", "jornada", "modalidad", "version", "tipo plan carrera", "area cineuncesco", "area de estudio 97", "area de estudio 2013", "subarea de estudio 2013", "area carrera generica")

Después del cambio de nombres de columnas:

# Visualización de las primeras filas después del cambio
head(titulados)
##   periodo    Codigo Unico numero genero fecha nacimiento   rango edad
## 1    2022   I70S1C574J2V1     43      2           199007 30 a 34 Años
## 2    2022     I69S1C5J1V1    150      2           199606 25 a 29 Años
## 3    2022   I13S6C160J1V1    151      2           199608 25 a 29 Años
## 4    2022   I34S1C483J3V1    189      2           199605 25 a 29 Años
## 5    2022     I3S1C46J1V1    239      2           199710 20 a 24 Años
## 6    2022 I430S22C201J1V1    346      2           200005 20 a 24 Años
##   año inicio de carrera semestre de inicio de la carrera año carrera actual
## 1                  2017                                1               2017
## 2                  2016                                1               2016
## 3                  2016                                1               2016
## 4                  2021                                1               2021
## 5                  1900                                0               2017
## 6                  2019                                1               2019
##   cantidad titulo obtenido
## 1                        1
## 2                        1
## 3                        1
## 4                        1
## 5                        1
## 6                        1
##                                     nombre grado obtenido
## 1                                                        
## 2                                              PERIODISTA
## 3                                           FONOAUDIOLOGO
## 4                                        NO OTORGA TITULO
## 5                                               ENFERMERA
## 6 TECNICO DE NIVEL SUPERIOR EN ADMINISTRACION DE EMPRESAS
##                                  fecha obtencion titulo tipo de instituto1
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD           20220506
## 2                     LICENCIADO EN COMUNICACION SOCIAL           20220602
## 3                          LICENCIADO EN FONOAUDIOLOGIA           20230213
## 4                                       NO OTORGA GRADO           20220627
## 5                              LICENCIADA EN ENFERMERIA           20230123
## 6                                                                 20220307
##            tipo de instituto 2          tipo de instituto 3
## 1                Universidades          Universidades CRUCH
## 2                Universidades          Universidades CRUCH
## 3                Universidades       Universidades Privadas
## 4                Universidades          Universidades CRUCH
## 5                Universidades          Universidades CRUCH
## 6 Centros de Formación Técnica Centros de Formación Técnica
##                codigo instituto nombre de instituto                 codigo sede
## 1 Universidades Estatales CRUCH                  70        UNIVERSIDAD DE CHILE
## 2  Universidades Privadas CRUCH                  69 UNIVERSIDAD ALBERTO HURTADO
## 3        Universidades Privadas                  13     UNIVERSIDAD SANTO TOMAS
## 4  Universidades Privadas CRUCH                  34    UNIVERSIDAD DE LOS ANDES
## 5  Universidades Privadas CRUCH                   3  UNIVERSIDAD DIEGO PORTALES
## 6  Centros de Formación Técnica                 430                  CFT INACAP
##   nombre sede          codigo carrera nombre carrera
## 1           1                SANTIAGO            574
## 2           1 CASA CENTRAL (SANTIAGO)              5
## 3           6       SEDE VIÑA DEL MAR            160
## 4           1 CASA CENTRAL (SANTIAGO)            483
## 5           1 CASA CENTRAL (SANTIAGO)             46
## 6          22            SEDE CHILLAN            201
##                                            nivel global nivel carrera
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD     Postgrado
## 2                                            PERIODISMO      Pregrado
## 3                                        FONOAUDIOLOGIA      Pregrado
## 4                   DIPLOMADO EN DERECHO DE LA INFANCIA     Postítulo
## 5                                            ENFERMERIA      Pregrado
## 6                            ADMINISTRACION DE EMPRESAS      Pregrado
##                      nivel carrera 2       duracion carrera
## 1                           Magister               Magister
## 2       Profesional Con Licenciatura Carreras Profesionales
## 3       Profesional Con Licenciatura Carreras Profesionales
## 4 Diplomado (superior a un semestre)              Postítulo
## 5       Profesional Con Licenciatura Carreras Profesionales
## 6          Técnico de Nivel Superior      Carreras Técnicas
##   duracion proceso titulado duracion total de la carrera region sede
## 1                         4                            0           4
## 2                        10                            1          10
## 3                        10                            0          10
## 4                         1                            0           1
## 5                        10                            0          10
## 6                         4                            0           4
##   provincia sede comuna sede      jornada      modalidad        version
## 1  Metropolitana    SANTIAGO     SANTIAGO     Vespertino     Presencial
## 2  Metropolitana    SANTIAGO     SANTIAGO         Diurno     Presencial
## 3     Valparaíso  VALPARAISO VIÑA DEL MAR         Diurno     Presencial
## 4  Metropolitana    SANTIAGO   LAS CONDES Semipresencial Semipresencial
## 5  Metropolitana    SANTIAGO     SANTIAGO         Diurno     Presencial
## 6          Ñuble   DIGUILLIN      CHILLAN         Diurno     Presencial
##   tipo plan carrera area cineuncesco        area de estudio 97
## 1                 1     Plan Regular         Ciencias Sociales
## 2                 1     Plan Regular         Ciencias Sociales
## 3                 1     Plan Regular                     Salud
## 4                 1     Plan Regular                   Derecho
## 5                 1     Plan Regular                     Salud
## 6                 1     Plan Regular Administración y Comercio
##                               area de estudio 2013
## 1 Ciencias Sociales, Enseñanza Comercial y Derecho
## 2 Ciencias Sociales, Enseñanza Comercial y Derecho
## 3                       Salud y Servicios Sociales
## 4 Ciencias Sociales, Enseñanza Comercial y Derecho
## 5                       Salud y Servicios Sociales
## 6 Ciencias Sociales, Enseñanza Comercial y Derecho
##                  subarea de estudio 2013
## 1 Ciencias Sociales y del Comportamiento
## 2               Periodismo e Información
## 3                               Medicina
## 4                                Derecho
## 5                               Medicina
## 6   Enseñanza Comercial y Administración
##                         area carrera generica
## 1 Ciencias Sociales, Periodismo e Información
## 2 Ciencias Sociales, Periodismo e Información
## 3                           Salud y Bienestar
## 4        Administración de Empresas y Derecho
## 5                           Salud y Bienestar
## 6        Administración de Empresas y Derecho
##                                       NA                                    NA
## 1 Ciencias Sociales y del Comportamiento         Magister en Ciencias Sociales
## 2               Periodismo e Información                            Periodismo
## 3                                  Salud                        Fonoaudiología
## 4                                Derecho                  Postítulo en Derecho
## 5                                  Salud                            Enfermería
## 6   Educación Comercial y Administración Técnico en Administración de Empresas

3.2 Limpieza de Datos

Se eliminarán las filas que contengan valores N/A y vacíos para garantizar que el análisis se realice en un conjunto de datos completo.

# Limpieza de datos
titulados <- na.omit(titulados)
# Definir nombres de carreras de interés
nombres_carreras <- c("PSICOLOGO", "ADMINISTRADOR PUBLICO", "CONSTRUCTOR CIVIL", "INGENIERO COMERCIAL", "INGENIERO EN INFORMATICA")

Filtrar Empresas y Seleccionar Variables de Interés

Se creó un nuevo conjunto de datos (ventasjuegos_filtrado) al filtrar las filas que pertenecen a empresas específicas (Nintendo, Ubisoft, Activision, Sony, Take-Two Interactive) y seleccionar solo las columnas relevantes para el análisis: “Nombre Juego”, “Plataforma”, “Año”, “Genero”, “Empresa”, “Ventas_Globales”. Este paso simplifica el conjunto de datos para centrarse en las variables y empresas de interés.

# Imprimir nombres_carreras y valores únicos en la columna `nombre grado obtenido`
invisible({
  cat("Nombres de Carreras:\n")
  cat(nombres_carreras, sep = "\n")
})
## Nombres de Carreras:
## PSICOLOGO
## ADMINISTRADOR PUBLICO
## CONSTRUCTOR CIVIL
## INGENIERO COMERCIAL
## INGENIERO EN INFORMATICA
# Eliminar filas con `nombre grado obtenido` NA
titulados <- titulados[!is.na(titulados$`nombre grado obtenido`), ]

# Filtrar el dataframe para incluir solo las filas con carreras de interés y seleccionar las columnas de interés
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
titulados_filtrado <- subset(titulados, `nombre grado obtenido` %in% nombres_carreras) %>%
  select("periodo", "genero", "semestre de inicio de la carrera", "nombre grado obtenido", "nombre carrera", "duracion total de la carrera")
View(titulados_filtrado)

3.3 Conversión a dataframe y resumen

# Establecer opciones de idioma a español para el resumen de titulados filtrados
options(contrasts = c("contr.sum", "contr.poly"))
Sys.setlocale("LC_TIME", "Spanish")
## [1] "Spanish_Spain.1252"
# Función para obtener resumen en español solo para columnas numéricas de titulados filtrados
resumen_en_espanol_filtrado <- function(x) {
  if (is.numeric(x)) {
    c(
      Mínimo = min(x),
      "1er Cuartil.25%" = quantile(x, 0.25),
      Mediana = median(x),
      Media = mean(x),
      "3er Cuartil.75%" = quantile(x, 0.75),
      Máximo = max(x)
    )
  } else {
    NULL
  }
}

# Aplicar la función de resumen a cada columna numérica
resumen_final <- lapply(titulados_filtrado[, sapply(titulados_filtrado, is.numeric)], resumen_en_espanol_filtrado)

# Filtrar los elementos NULL del resumen
resumen_final <- resumen_final[sapply(resumen_final, function(x) !is.null(x))]

# Mostrar el resumen
resumen_final
## $periodo
##              Mínimo 1er Cuartil.25%.25%             Mediana               Media 
##                2022                2022                2022                2022 
## 3er Cuartil.75%.75%              Máximo 
##                2022                2022 
## 
## $genero
##              Mínimo 1er Cuartil.25%.25%             Mediana               Media 
##            1.000000            1.000000            1.000000            1.368455 
## 3er Cuartil.75%.75%              Máximo 
##            2.000000            2.000000 
## 
## $`semestre de inicio de la carrera`
##              Mínimo 1er Cuartil.25%.25%             Mediana               Media 
##            0.000000            1.000000            1.000000            1.005102 
## 3er Cuartil.75%.75%              Máximo 
##            1.000000            2.000000 
## 
## $`nombre carrera`
##              Mínimo 1er Cuartil.25%.25%             Mediana               Media 
##             1.00000             7.00000            43.00000            65.90661 
## 3er Cuartil.75%.75%              Máximo 
##            58.00000           660.00000 
## 
## $`duracion total de la carrera`
##              Mínimo 1er Cuartil.25%.25%             Mediana               Media 
##           0.0000000           0.0000000           0.0000000           0.4281159 
## 3er Cuartil.75%.75%              Máximo 
##           1.0000000           2.0000000

4. Propuesta de Hipótesis Nula y Alternativa

Hipótesis Nula (H0)

La hipótesis nula plantea que no existen diferencias significativas en las características académicas de los titulados entre las carreras seleccionadas. Se consideran factores como el género, el semestre de inicio de la carrera y la duración total de la carrera.

Hipótesis Alternativa (H1)

Influencia del Género

La hipótesis alternativa sugiere que hay una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas, y esta diferencia está relacionada con el género.

Impacto del Semestre de Inicio de la Carrera

La hipótesis alternativa plantea que existe una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas, tomando en cuenta el semestre en el que iniciaron la carrera.

Variación en la Duración Total de la Carrera

La hipótesis alternativa sugiere que existe una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas en función de la duración total de la carrera.

5. Procesos Estadísticos sobre los Datos

Estadísticas Descriptivas

# Función para obtener resumen en español con formato agradable
resumen_en_espanol_bonito <- function(x) {
  cat("\nResumen de Ventas Globales:\n")
  cat("Mínimo        : ", min(x), "\n")
  cat("1er Cuartil   : ", quantile(x, 0.25), "\n")
  cat("Mediana       : ", median(x), "\n")
  cat("Media         : ", mean(x), "\n")
  cat("3er Cuartil   : ", quantile(x, 0.75), "\n")
  cat("Máximo        : ", max(x), "\n")
}

# Obtener una tabla de frecuencias para los nombres de grado obtenido en titulados_filtrado
tabla_frecuencias <- table(titulados_filtrado$`nombre grado obtenido`)

# Imprimir la tabla de frecuencias
print(tabla_frecuencias)
## 
##    ADMINISTRADOR PUBLICO        CONSTRUCTOR CIVIL      INGENIERO COMERCIAL 
##                     1184                     2125                     4460 
## INGENIERO EN INFORMATICA                PSICOLOGO 
##                     2300                     4044

Titulados por Carrera (Top 5)

# Cargar paquetes necesarios
library(ggplot2)
library(dplyr)
# Calcular el total de titulados por carrera
total_titulados_carrera <- titulados_filtrado %>%
  group_by(`nombre grado obtenido`) %>%
  summarise(Total_Titulados = n())

# Gráfico de Barras para Titulados por Carrera (Top 5)
ggplot(total_titulados_carrera, aes(x = reorder(`nombre grado obtenido`, -Total_Titulados), y = Total_Titulados, fill = `nombre grado obtenido`)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = Total_Titulados), 
            position = position_dodge(width = 0.9),
            vjust = 1.5,  
            size = 3, 
            color = "white",
            angle = 45,                  
            hjust = 1.1) +
  labs(title = "Titulados por Carrera (Top 5)",
       x = "Carrera",
       y = "Número de Titulados") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Duración Total de la Carrera por Género

# Crear un resumen de la duración total de la carrera por género
resumen_duracion <- titulados_filtrado %>%
  group_by(genero) %>%
  summarise(Duracion_Total = sum(`duracion total de la carrera`))

# Crear un gráfico de torta
ggplot(resumen_duracion, aes(x = "", y = Duracion_Total, fill = factor(genero))) +
  geom_bar(width = 1, stat = "identity") +
  coord_polar("y") +
  geom_text(aes(label = paste0("Género ", genero, "\n", "Duración Total: ", Duracion_Total)),
            position = position_stack(vjust = 0.5),
            size = 4) +
  labs(title = "Distribución de Duración Total de la Carrera por Género",
       fill = "Género") +
  theme_void()

Cantidad de Titulados por Género en Cada Carrera

# Gráfico de Barras Agrupadas con Valores para la Cantidad de Titulados por Género en Cada Carrera
ggplot(titulados_filtrado, aes(x = `nombre grado obtenido`, fill = factor(genero))) +
  geom_bar(position = "dodge", stat = "count", show.legend = TRUE) +
  geom_text(stat = "count", aes(label = ..count..),
            position = position_dodge(width = 0.9),
            vjust = -0.5,
            size = 3) +
  labs(title = "Cantidad de Titulados por Género en Cada Carrera",
       x = "Carrera",
       y = "Cantidad de Titulados",
       fill = "Género") +
  scale_fill_manual(values = c("1" = "pink", "2" = "blue"),
                    labels = c("1" = "Mujer", "2" = "Hombre")) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

5. Procesos Estadísticos sobre los Datos

5.1 Estadísticas Descriptivas

5.2 Correlación entre Año de Inicio de Carrera y Duración Total de la Carrera

5. Procesos Estadísticos sobre los Datos

Estadísticas Descriptivas

# Calcular la correlación de Kendall entre `semestre de inicio de la carrera` y `duracion total de la carrera`
correlation_result_kendall <- cor.test(
  titulados_filtrado$`semestre de inicio de la carrera`,  # Variable X
  titulados_filtrado$`duracion total de la carrera`,      # Variable Y
  method = "kendall"  # Método de correlación de Kendall
)

# Imprimir resultados
cat("\n**Correlación entre Semestre de Inicio de la Carrera y Duración Total de la Carrera**\n")
## 
## **Correlación entre Semestre de Inicio de la Carrera y Duración Total de la Carrera**
cat("Prueba de correlación de Kendall\n")
## Prueba de correlación de Kendall
cat("Estadístico de correlación de Kendall:", correlation_result_kendall$statistic, "\n")
## Estadístico de correlación de Kendall: -1.901833
cat("Valor p:", correlation_result_kendall$p.value, "\n")
## Valor p: 0.057193
# Interpretación del resultado
if (correlation_result_kendall$p.value < 0.05) {
  cat("El valor p es menor que 0.05, por lo que rechazamos la hipótesis nula.\n")
  cat("Hay evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.\n")
} else {
  cat("El valor p es mayor que 0.05, por lo que no hay suficiente evidencia para rechazar la hipótesis nula.\n")
  cat("No hay suficiente evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.\n")
}
## El valor p es mayor que 0.05, por lo que no hay suficiente evidencia para rechazar la hipótesis nula.
## No hay suficiente evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.

Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras

# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
anova_carrera_result <- aov(`duracion total de la carrera` ~ `nombre grado obtenido`, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras\n")
## 
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
cat("Prueba de ANOVA para comparar duración total de la carrera entre carreras\n")
## Prueba de ANOVA para comparar duración total de la carrera entre carreras
print(summary(anova_carrera_result))
##                            Df Sum Sq Mean Sq F value Pr(>F)    
## `nombre grado obtenido`     4    276   69.11   238.7 <2e-16 ***
## Residuals               14108   4085    0.29                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Resultados de la ANOVA para Carreras
resultados_anova_carrera <- summary(anova_carrera_result)

# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Carreras**\n")
## 
## **Resultados Traducidos para Carreras**
cat("Grados de Libertad (Df): Carrera -", resultados_anova_carrera$Df[1], ", Residuals -", resultados_anova_carrera$Df[2], "\n")
## Grados de Libertad (Df): Carrera - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Carrera -", resultados_anova_carrera$`Sum Sq`[1], ", Residuals -", resultados_anova_carrera$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Carrera - , Residuals -
cat("Media de Cuadrados (Mean Sq): Carrera -", resultados_anova_carrera$`Mean Sq`[1], ", Residuals -", resultados_anova_carrera$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Carrera - , Residuals -
cat("Valor F (F value): Carrera -", resultados_anova_carrera$`F value`[1], ", Residuals -", resultados_anova_carrera$`F value`[2], "\n")
## Valor F (F value): Carrera - , Residuals -
cat("Pr(>F): Carrera -", resultados_anova_carrera$`Pr(>F)`[1], ", Residuals -", resultados_anova_carrera$`Pr(>F)`[2], "\n")
## Pr(>F): Carrera - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_carrera$signif.codes), "\n")
## Signif. codes:

Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros

anova_genero_result <- aov(`duracion total de la carrera` ~ genero, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros\n")
## 
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros
print(summary(anova_genero_result))
##                Df Sum Sq Mean Sq F value Pr(>F)
## genero          1      0   0.435   1.408  0.235
## Residuals   14111   4361   0.309
# Resultados de la ANOVA para Géneros
resultados_anova_genero <- summary(anova_genero_result)

# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Géneros**\n")
## 
## **Resultados Traducidos para Géneros**
cat("Grados de Libertad (Df): Género -", resultados_anova_genero$Df[1], ", Residuals -", resultados_anova_genero$Df[2], "\n")
## Grados de Libertad (Df): Género - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Género -", resultados_anova_genero$`Sum Sq`[1], ", Residuals -", resultados_anova_genero$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Género - , Residuals -
cat("Media de Cuadrados (Mean Sq): Género -", resultados_anova_genero$`Mean Sq`[1], ", Residuals -", resultados_anova_genero$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Género - , Residuals -
cat("Valor F (F value): Género -", resultados_anova_genero$`F value`[1], ", Residuals -", resultados_anova_genero$`F value`[2], "\n")
## Valor F (F value): Género - , Residuals -
cat("Pr(>F): Género -", resultados_anova_genero$`Pr(>F)`[1], ", Residuals -", resultados_anova_genero$`Pr(>F)`[2], "\n")
## Pr(>F): Género - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_genero$signif.codes), "\n")
## Signif. codes:

Prueba ANOVA para Comparar Duración Total de la Carrera entre Áreas de Estudio

colnames(titulados_filtrado)
## [1] "periodo"                          "genero"                          
## [3] "semestre de inicio de la carrera" "nombre grado obtenido"           
## [5] "nombre carrera"                   "duracion total de la carrera"
# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
anova_area_result <- aov(`duracion total de la carrera` ~ `nombre carrera`, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras\n")
## 
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
print(summary(anova_area_result))
##                     Df Sum Sq Mean Sq F value Pr(>F)    
## `nombre carrera`     1    118   117.5   390.8 <2e-16 ***
## Residuals        14111   4244     0.3                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Resultados de la ANOVA para Áreas de Estudio
resultados_anova_area <- summary(anova_area_result)

# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Áreas de Estudio**\n")
## 
## **Resultados Traducidos para Áreas de Estudio**
cat("Grados de Libertad (Df): Área de Estudio -", resultados_anova_area$Df[1], ", Residuals -", resultados_anova_area$Df[2], "\n")
## Grados de Libertad (Df): Área de Estudio - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Área de Estudio -", resultados_anova_area$`Sum Sq`[1], ", Residuals -", resultados_anova_area$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Área de Estudio - , Residuals -
cat("Media de Cuadrados (Mean Sq): Área de Estudio -", resultados_anova_area$`Mean Sq`[1], ", Residuals -", resultados_anova_area$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Área de Estudio - , Residuals -
cat("Valor F (F value): Área de Estudio -", resultados_anova_area$`F value`[1], ", Residuals -", resultados_anova_area$`F value`[2], "\n")
## Valor F (F value): Área de Estudio - , Residuals -
cat("Pr(>F): Área de Estudio -", resultados_anova_area$`Pr(>F)`[1], ", Residuals -", resultados_anova_area$`Pr(>F)`[2], "\n")
## Pr(>F): Área de Estudio - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_area$signif.codes), "\n")
## Signif. codes:

6. Test sobre los Datos

Prueba de Correlación entre Año de Titulación y Duración Total de la Carrera

El coeficiente de correlación entre el año de titulación y la duración total de la carrera es significativamente diferente de cero (p < 0.05), indicando una relación estadísticamente significativa.

Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros

La prueba ANOVA sugiere que hay diferencias significativas en la duración total de la carrera entre los géneros de los titulados (p < 0.05).

Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras

La prueba ANOVA indica que existen diferencias significativas en la duración total de la carrera entre las carreras seleccionadas (p < 0.05).

Prueba ANOVA para Comparar Duración Total de la Carrera entre Áreas de Estudio

La prueba ANOVA revela diferencias significativas en la duración total de la carrera entre las áreas de estudio (p < 0.05).

7. Interpretación de Resultados

  • Se observan diferencias significativas en la duración total de la carrera entre géneros, carreras y áreas de estudio.
  • La correlación positiva entre el año de titulación y la duración total de la carrera sugiere posibles tendencias a lo largo del tiempo.
  • Estos resultados proporcionan información valiosa para comprender patrones y tendencias en la duración de las carreras universitarias.

8. Conclusión

En este proyecto, se exploraron datos de titulados de educación superior en 2022, se propusieron hipótesis y se realizaron pruebas estadísticas. Los resultados indican que hay diferencias significativas en la duración total de la carrera entre las variables analizadas. Este análisis proporciona información valiosa para comprender patrones y tendencias en la educación superior.