El presente informe tiene como objetivo explorar y analizar la información recopilada en el dataset que contiene datos de alumnos titulados de educación superior a partir del año 2020. Este módulo proporciona una visión detallada de diversos aspectos relacionados con la graduación de estudiantes en instituciones de educación superior.
Los datos utilizados en este análisis fueron obtenidos de [datosabiertos.mineduc.cl/] https://datosabiertos.mineduc.cl/titulados-en-educacion-superior El proceso de obtención de datos incluyó la selección de la fuente, descarga en formato CSV, exploración inicial y limpieza.
Importar base de datos(dataset):
# Importar base de datos
titulados <- read.csv("C:/Users/janoa/OneDrive/Escritorio/TituladosEdSuperior2022.csv", sep = ";")
View(titulados)
3.1 Cambio de Nombres de Columnas
Antes del cambio de nombres de columnas:
# Visualización de las primeras filas
head(titulados)
## cat_periodo codigo_unico mrun gen_alu fec_nac_alu rango_edad
## 1 2022 I70S1C574J2V1 43 2 199007 30 a 34 Años
## 2 2022 I69S1C5J1V1 150 2 199606 25 a 29 Años
## 3 2022 I13S6C160J1V1 151 2 199608 25 a 29 Años
## 4 2022 I34S1C483J3V1 189 2 199605 25 a 29 Años
## 5 2022 I3S1C46J1V1 239 2 199710 20 a 24 Años
## 6 2022 I430S22C201J1V1 346 2 200005 20 a 24 Años
## anio_ing_carr_ori sem_ing_carr_ori anio_ing_carr_act sem_ing_carr_act
## 1 2017 1 2017 1
## 2 2016 1 2016 1
## 3 2016 1 2016 1
## 4 2021 1 2021 1
## 5 1900 0 2017 1
## 6 2019 1 2019 1
## nomb_titulo_obtenido
## 1
## 2 PERIODISTA
## 3 FONOAUDIOLOGO
## 4 NO OTORGA TITULO
## 5 ENFERMERA
## 6 TECNICO DE NIVEL SUPERIOR EN ADMINISTRACION DE EMPRESAS
## nomb_grado_obtenido fecha_obtencion_titulo
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD 20220506
## 2 LICENCIADO EN COMUNICACION SOCIAL 20220602
## 3 LICENCIADO EN FONOAUDIOLOGIA 20230213
## 4 NO OTORGA GRADO 20220627
## 5 LICENCIADA EN ENFERMERIA 20230123
## 6 20220307
## tipo_inst_1 tipo_inst_2
## 1 Universidades Universidades CRUCH
## 2 Universidades Universidades CRUCH
## 3 Universidades Universidades Privadas
## 4 Universidades Universidades CRUCH
## 5 Universidades Universidades CRUCH
## 6 Centros de Formación Técnica Centros de Formación Técnica
## tipo_inst_3 cod_inst nomb_inst cod_sede
## 1 Universidades Estatales CRUCH 70 UNIVERSIDAD DE CHILE 1
## 2 Universidades Privadas CRUCH 69 UNIVERSIDAD ALBERTO HURTADO 1
## 3 Universidades Privadas 13 UNIVERSIDAD SANTO TOMAS 6
## 4 Universidades Privadas CRUCH 34 UNIVERSIDAD DE LOS ANDES 1
## 5 Universidades Privadas CRUCH 3 UNIVERSIDAD DIEGO PORTALES 1
## 6 Centros de Formación Técnica 430 CFT INACAP 22
## nomb_sede cod_carrera
## 1 SANTIAGO 574
## 2 CASA CENTRAL (SANTIAGO) 5
## 3 SEDE VIÑA DEL MAR 160
## 4 CASA CENTRAL (SANTIAGO) 483
## 5 CASA CENTRAL (SANTIAGO) 46
## 6 SEDE CHILLAN 201
## nomb_carrera nivel_global
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD Postgrado
## 2 PERIODISMO Pregrado
## 3 FONOAUDIOLOGIA Pregrado
## 4 DIPLOMADO EN DERECHO DE LA INFANCIA Postítulo
## 5 ENFERMERIA Pregrado
## 6 ADMINISTRACION DE EMPRESAS Pregrado
## nivel_carrera_1 nivel_carrera_2 dur_estudio_carr
## 1 Magister Magister 4
## 2 Profesional Con Licenciatura Carreras Profesionales 10
## 3 Profesional Con Licenciatura Carreras Profesionales 10
## 4 Diplomado (superior a un semestre) Postítulo 1
## 5 Profesional Con Licenciatura Carreras Profesionales 10
## 6 Técnico de Nivel Superior Carreras Técnicas 4
## dur_proceso_tit dur_total_carr region_sede provincia_sede comuna_sede
## 1 0 4 Metropolitana SANTIAGO SANTIAGO
## 2 1 10 Metropolitana SANTIAGO SANTIAGO
## 3 0 10 Valparaíso VALPARAISO VIÑA DEL MAR
## 4 0 1 Metropolitana SANTIAGO LAS CONDES
## 5 0 10 Metropolitana SANTIAGO SANTIAGO
## 6 0 4 Ñuble DIGUILLIN CHILLAN
## jornada modalidad version tipo_plan_carr
## 1 Vespertino Presencial 1 Plan Regular
## 2 Diurno Presencial 1 Plan Regular
## 3 Diurno Presencial 1 Plan Regular
## 4 Semipresencial Semipresencial 1 Plan Regular
## 5 Diurno Presencial 1 Plan Regular
## 6 Diurno Presencial 1 Plan Regular
## area_cineunesco area_cine_f_97
## 1 Ciencias Sociales Ciencias Sociales, Enseñanza Comercial y Derecho
## 2 Ciencias Sociales Ciencias Sociales, Enseñanza Comercial y Derecho
## 3 Salud Salud y Servicios Sociales
## 4 Derecho Ciencias Sociales, Enseñanza Comercial y Derecho
## 5 Salud Salud y Servicios Sociales
## 6 Administración y Comercio Ciencias Sociales, Enseñanza Comercial y Derecho
## subarea_cine_f_97
## 1 Ciencias Sociales y del Comportamiento
## 2 Periodismo e Información
## 3 Medicina
## 4 Derecho
## 5 Medicina
## 6 Enseñanza Comercial y Administración
## area_cine_f_13
## 1 Ciencias Sociales, Periodismo e Información
## 2 Ciencias Sociales, Periodismo e Información
## 3 Salud y Bienestar
## 4 Administración de Empresas y Derecho
## 5 Salud y Bienestar
## 6 Administración de Empresas y Derecho
## subarea_cine_f_13 area_carrera_generica_n
## 1 Ciencias Sociales y del Comportamiento Magister en Ciencias Sociales
## 2 Periodismo e Información Periodismo
## 3 Salud Fonoaudiología
## 4 Derecho Postítulo en Derecho
## 5 Salud Enfermería
## 6 Educación Comercial y Administración Técnico en Administración de Empresas
Cambio de nombres de columnas:
# Cambio de nombres de columnas
colnames(titulados) <- c("periodo", "Codigo Unico", "numero", "genero", "fecha nacimiento", "rango edad", "año inicio de carrera", "semestre de inicio de la carrera", "año carrera actual", "cantidad titulo obtenido", "nombre grado obtenido", "fecha obtencion titulo", "tipo de instituto1", "tipo de instituto 2", "tipo de instituto 3", "codigo instituto", "nombre de instituto", "codigo sede", "nombre sede", "codigo carrera", "nombre carrera", "nivel global", "nivel carrera", "nivel carrera 2", "duracion carrera", "duracion proceso titulado", "duracion total de la carrera", "region sede", "provincia sede", "comuna sede", "jornada", "modalidad", "version", "tipo plan carrera", "area cineuncesco", "area de estudio 97", "area de estudio 2013", "subarea de estudio 2013", "area carrera generica")
Después del cambio de nombres de columnas:
# Visualización de las primeras filas después del cambio
head(titulados)
## periodo Codigo Unico numero genero fecha nacimiento rango edad
## 1 2022 I70S1C574J2V1 43 2 199007 30 a 34 Años
## 2 2022 I69S1C5J1V1 150 2 199606 25 a 29 Años
## 3 2022 I13S6C160J1V1 151 2 199608 25 a 29 Años
## 4 2022 I34S1C483J3V1 189 2 199605 25 a 29 Años
## 5 2022 I3S1C46J1V1 239 2 199710 20 a 24 Años
## 6 2022 I430S22C201J1V1 346 2 200005 20 a 24 Años
## año inicio de carrera semestre de inicio de la carrera año carrera actual
## 1 2017 1 2017
## 2 2016 1 2016
## 3 2016 1 2016
## 4 2021 1 2021
## 5 1900 0 2017
## 6 2019 1 2019
## cantidad titulo obtenido
## 1 1
## 2 1
## 3 1
## 4 1
## 5 1
## 6 1
## nombre grado obtenido
## 1
## 2 PERIODISTA
## 3 FONOAUDIOLOGO
## 4 NO OTORGA TITULO
## 5 ENFERMERA
## 6 TECNICO DE NIVEL SUPERIOR EN ADMINISTRACION DE EMPRESAS
## fecha obtencion titulo tipo de instituto1
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD 20220506
## 2 LICENCIADO EN COMUNICACION SOCIAL 20220602
## 3 LICENCIADO EN FONOAUDIOLOGIA 20230213
## 4 NO OTORGA GRADO 20220627
## 5 LICENCIADA EN ENFERMERIA 20230123
## 6 20220307
## tipo de instituto 2 tipo de instituto 3
## 1 Universidades Universidades CRUCH
## 2 Universidades Universidades CRUCH
## 3 Universidades Universidades Privadas
## 4 Universidades Universidades CRUCH
## 5 Universidades Universidades CRUCH
## 6 Centros de Formación Técnica Centros de Formación Técnica
## codigo instituto nombre de instituto codigo sede
## 1 Universidades Estatales CRUCH 70 UNIVERSIDAD DE CHILE
## 2 Universidades Privadas CRUCH 69 UNIVERSIDAD ALBERTO HURTADO
## 3 Universidades Privadas 13 UNIVERSIDAD SANTO TOMAS
## 4 Universidades Privadas CRUCH 34 UNIVERSIDAD DE LOS ANDES
## 5 Universidades Privadas CRUCH 3 UNIVERSIDAD DIEGO PORTALES
## 6 Centros de Formación Técnica 430 CFT INACAP
## nombre sede codigo carrera nombre carrera
## 1 1 SANTIAGO 574
## 2 1 CASA CENTRAL (SANTIAGO) 5
## 3 6 SEDE VIÑA DEL MAR 160
## 4 1 CASA CENTRAL (SANTIAGO) 483
## 5 1 CASA CENTRAL (SANTIAGO) 46
## 6 22 SEDE CHILLAN 201
## nivel global nivel carrera
## 1 MAGISTER EN ANALISIS SISTEMICO APLICADO A LA SOCIEDAD Postgrado
## 2 PERIODISMO Pregrado
## 3 FONOAUDIOLOGIA Pregrado
## 4 DIPLOMADO EN DERECHO DE LA INFANCIA Postítulo
## 5 ENFERMERIA Pregrado
## 6 ADMINISTRACION DE EMPRESAS Pregrado
## nivel carrera 2 duracion carrera
## 1 Magister Magister
## 2 Profesional Con Licenciatura Carreras Profesionales
## 3 Profesional Con Licenciatura Carreras Profesionales
## 4 Diplomado (superior a un semestre) Postítulo
## 5 Profesional Con Licenciatura Carreras Profesionales
## 6 Técnico de Nivel Superior Carreras Técnicas
## duracion proceso titulado duracion total de la carrera region sede
## 1 4 0 4
## 2 10 1 10
## 3 10 0 10
## 4 1 0 1
## 5 10 0 10
## 6 4 0 4
## provincia sede comuna sede jornada modalidad version
## 1 Metropolitana SANTIAGO SANTIAGO Vespertino Presencial
## 2 Metropolitana SANTIAGO SANTIAGO Diurno Presencial
## 3 Valparaíso VALPARAISO VIÑA DEL MAR Diurno Presencial
## 4 Metropolitana SANTIAGO LAS CONDES Semipresencial Semipresencial
## 5 Metropolitana SANTIAGO SANTIAGO Diurno Presencial
## 6 Ñuble DIGUILLIN CHILLAN Diurno Presencial
## tipo plan carrera area cineuncesco area de estudio 97
## 1 1 Plan Regular Ciencias Sociales
## 2 1 Plan Regular Ciencias Sociales
## 3 1 Plan Regular Salud
## 4 1 Plan Regular Derecho
## 5 1 Plan Regular Salud
## 6 1 Plan Regular Administración y Comercio
## area de estudio 2013
## 1 Ciencias Sociales, Enseñanza Comercial y Derecho
## 2 Ciencias Sociales, Enseñanza Comercial y Derecho
## 3 Salud y Servicios Sociales
## 4 Ciencias Sociales, Enseñanza Comercial y Derecho
## 5 Salud y Servicios Sociales
## 6 Ciencias Sociales, Enseñanza Comercial y Derecho
## subarea de estudio 2013
## 1 Ciencias Sociales y del Comportamiento
## 2 Periodismo e Información
## 3 Medicina
## 4 Derecho
## 5 Medicina
## 6 Enseñanza Comercial y Administración
## area carrera generica
## 1 Ciencias Sociales, Periodismo e Información
## 2 Ciencias Sociales, Periodismo e Información
## 3 Salud y Bienestar
## 4 Administración de Empresas y Derecho
## 5 Salud y Bienestar
## 6 Administración de Empresas y Derecho
## NA NA
## 1 Ciencias Sociales y del Comportamiento Magister en Ciencias Sociales
## 2 Periodismo e Información Periodismo
## 3 Salud Fonoaudiología
## 4 Derecho Postítulo en Derecho
## 5 Salud Enfermería
## 6 Educación Comercial y Administración Técnico en Administración de Empresas
3.2 Limpieza de Datos
Se eliminarán las filas que contengan valores N/A y vacíos para garantizar que el análisis se realice en un conjunto de datos completo.
# Limpieza de datos
titulados <- na.omit(titulados)
# Definir nombres de carreras de interés
nombres_carreras <- c("PSICOLOGO", "ADMINISTRADOR PUBLICO", "CONSTRUCTOR CIVIL", "INGENIERO COMERCIAL", "INGENIERO EN INFORMATICA")
Filtrar Empresas y Seleccionar Variables de Interés
Se creó un nuevo conjunto de datos (ventasjuegos_filtrado) al filtrar las filas que pertenecen a empresas específicas (Nintendo, Ubisoft, Activision, Sony, Take-Two Interactive) y seleccionar solo las columnas relevantes para el análisis: “Nombre Juego”, “Plataforma”, “Año”, “Genero”, “Empresa”, “Ventas_Globales”. Este paso simplifica el conjunto de datos para centrarse en las variables y empresas de interés.
# Imprimir nombres_carreras y valores únicos en la columna `nombre grado obtenido`
invisible({
cat("Nombres de Carreras:\n")
cat(nombres_carreras, sep = "\n")
})
## Nombres de Carreras:
## PSICOLOGO
## ADMINISTRADOR PUBLICO
## CONSTRUCTOR CIVIL
## INGENIERO COMERCIAL
## INGENIERO EN INFORMATICA
# Eliminar filas con `nombre grado obtenido` NA
titulados <- titulados[!is.na(titulados$`nombre grado obtenido`), ]
# Filtrar el dataframe para incluir solo las filas con carreras de interés y seleccionar las columnas de interés
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
titulados_filtrado <- subset(titulados, `nombre grado obtenido` %in% nombres_carreras) %>%
select("periodo", "genero", "semestre de inicio de la carrera", "nombre grado obtenido", "nombre carrera", "duracion total de la carrera")
View(titulados_filtrado)
# Establecer opciones de idioma a español para el resumen de titulados filtrados
options(contrasts = c("contr.sum", "contr.poly"))
Sys.setlocale("LC_TIME", "Spanish")
## [1] "Spanish_Spain.1252"
# Función para obtener resumen en español solo para columnas numéricas de titulados filtrados
resumen_en_espanol_filtrado <- function(x) {
if (is.numeric(x)) {
c(
Mínimo = min(x),
"1er Cuartil.25%" = quantile(x, 0.25),
Mediana = median(x),
Media = mean(x),
"3er Cuartil.75%" = quantile(x, 0.75),
Máximo = max(x)
)
} else {
NULL
}
}
# Aplicar la función de resumen a cada columna numérica
resumen_final <- lapply(titulados_filtrado[, sapply(titulados_filtrado, is.numeric)], resumen_en_espanol_filtrado)
# Filtrar los elementos NULL del resumen
resumen_final <- resumen_final[sapply(resumen_final, function(x) !is.null(x))]
# Mostrar el resumen
resumen_final
## $periodo
## Mínimo 1er Cuartil.25%.25% Mediana Media
## 2022 2022 2022 2022
## 3er Cuartil.75%.75% Máximo
## 2022 2022
##
## $genero
## Mínimo 1er Cuartil.25%.25% Mediana Media
## 1.000000 1.000000 1.000000 1.368455
## 3er Cuartil.75%.75% Máximo
## 2.000000 2.000000
##
## $`semestre de inicio de la carrera`
## Mínimo 1er Cuartil.25%.25% Mediana Media
## 0.000000 1.000000 1.000000 1.005102
## 3er Cuartil.75%.75% Máximo
## 1.000000 2.000000
##
## $`nombre carrera`
## Mínimo 1er Cuartil.25%.25% Mediana Media
## 1.00000 7.00000 43.00000 65.90661
## 3er Cuartil.75%.75% Máximo
## 58.00000 660.00000
##
## $`duracion total de la carrera`
## Mínimo 1er Cuartil.25%.25% Mediana Media
## 0.0000000 0.0000000 0.0000000 0.4281159
## 3er Cuartil.75%.75% Máximo
## 1.0000000 2.0000000
La hipótesis nula plantea que no existen diferencias significativas en las características académicas de los titulados entre las carreras seleccionadas. Se consideran factores como el género, el semestre de inicio de la carrera y la duración total de la carrera.
La hipótesis alternativa sugiere que hay una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas, y esta diferencia está relacionada con el género.
La hipótesis alternativa plantea que existe una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas, tomando en cuenta el semestre en el que iniciaron la carrera.
La hipótesis alternativa sugiere que existe una diferencia significativa en las características académicas de los titulados entre las carreras seleccionadas en función de la duración total de la carrera.
# Función para obtener resumen en español con formato agradable
resumen_en_espanol_bonito <- function(x) {
cat("\nResumen de Ventas Globales:\n")
cat("Mínimo : ", min(x), "\n")
cat("1er Cuartil : ", quantile(x, 0.25), "\n")
cat("Mediana : ", median(x), "\n")
cat("Media : ", mean(x), "\n")
cat("3er Cuartil : ", quantile(x, 0.75), "\n")
cat("Máximo : ", max(x), "\n")
}
# Obtener una tabla de frecuencias para los nombres de grado obtenido en titulados_filtrado
tabla_frecuencias <- table(titulados_filtrado$`nombre grado obtenido`)
# Imprimir la tabla de frecuencias
print(tabla_frecuencias)
##
## ADMINISTRADOR PUBLICO CONSTRUCTOR CIVIL INGENIERO COMERCIAL
## 1184 2125 4460
## INGENIERO EN INFORMATICA PSICOLOGO
## 2300 4044
Titulados por Carrera (Top 5)
# Cargar paquetes necesarios
library(ggplot2)
library(dplyr)
# Calcular el total de titulados por carrera
total_titulados_carrera <- titulados_filtrado %>%
group_by(`nombre grado obtenido`) %>%
summarise(Total_Titulados = n())
# Gráfico de Barras para Titulados por Carrera (Top 5)
ggplot(total_titulados_carrera, aes(x = reorder(`nombre grado obtenido`, -Total_Titulados), y = Total_Titulados, fill = `nombre grado obtenido`)) +
geom_bar(stat = "identity") +
geom_text(aes(label = Total_Titulados),
position = position_dodge(width = 0.9),
vjust = 1.5,
size = 3,
color = "white",
angle = 45,
hjust = 1.1) +
labs(title = "Titulados por Carrera (Top 5)",
x = "Carrera",
y = "Número de Titulados") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Duración Total de la Carrera por Género
# Crear un resumen de la duración total de la carrera por género
resumen_duracion <- titulados_filtrado %>%
group_by(genero) %>%
summarise(Duracion_Total = sum(`duracion total de la carrera`))
# Crear un gráfico de torta
ggplot(resumen_duracion, aes(x = "", y = Duracion_Total, fill = factor(genero))) +
geom_bar(width = 1, stat = "identity") +
coord_polar("y") +
geom_text(aes(label = paste0("Género ", genero, "\n", "Duración Total: ", Duracion_Total)),
position = position_stack(vjust = 0.5),
size = 4) +
labs(title = "Distribución de Duración Total de la Carrera por Género",
fill = "Género") +
theme_void()
Cantidad de Titulados por Género en Cada Carrera
# Gráfico de Barras Agrupadas con Valores para la Cantidad de Titulados por Género en Cada Carrera
ggplot(titulados_filtrado, aes(x = `nombre grado obtenido`, fill = factor(genero))) +
geom_bar(position = "dodge", stat = "count", show.legend = TRUE) +
geom_text(stat = "count", aes(label = ..count..),
position = position_dodge(width = 0.9),
vjust = -0.5,
size = 3) +
labs(title = "Cantidad de Titulados por Género en Cada Carrera",
x = "Carrera",
y = "Cantidad de Titulados",
fill = "Género") +
scale_fill_manual(values = c("1" = "pink", "2" = "blue"),
labels = c("1" = "Mujer", "2" = "Hombre")) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Calcular la correlación de Kendall entre `semestre de inicio de la carrera` y `duracion total de la carrera`
correlation_result_kendall <- cor.test(
titulados_filtrado$`semestre de inicio de la carrera`, # Variable X
titulados_filtrado$`duracion total de la carrera`, # Variable Y
method = "kendall" # Método de correlación de Kendall
)
# Imprimir resultados
cat("\n**Correlación entre Semestre de Inicio de la Carrera y Duración Total de la Carrera**\n")
##
## **Correlación entre Semestre de Inicio de la Carrera y Duración Total de la Carrera**
cat("Prueba de correlación de Kendall\n")
## Prueba de correlación de Kendall
cat("Estadístico de correlación de Kendall:", correlation_result_kendall$statistic, "\n")
## Estadístico de correlación de Kendall: -1.901833
cat("Valor p:", correlation_result_kendall$p.value, "\n")
## Valor p: 0.057193
# Interpretación del resultado
if (correlation_result_kendall$p.value < 0.05) {
cat("El valor p es menor que 0.05, por lo que rechazamos la hipótesis nula.\n")
cat("Hay evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.\n")
} else {
cat("El valor p es mayor que 0.05, por lo que no hay suficiente evidencia para rechazar la hipótesis nula.\n")
cat("No hay suficiente evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.\n")
}
## El valor p es mayor que 0.05, por lo que no hay suficiente evidencia para rechazar la hipótesis nula.
## No hay suficiente evidencia de una correlación significativa entre el semestre de inicio y la duración total de la carrera.
# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
anova_carrera_result <- aov(`duracion total de la carrera` ~ `nombre grado obtenido`, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras\n")
##
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
cat("Prueba de ANOVA para comparar duración total de la carrera entre carreras\n")
## Prueba de ANOVA para comparar duración total de la carrera entre carreras
print(summary(anova_carrera_result))
## Df Sum Sq Mean Sq F value Pr(>F)
## `nombre grado obtenido` 4 276 69.11 238.7 <2e-16 ***
## Residuals 14108 4085 0.29
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Resultados de la ANOVA para Carreras
resultados_anova_carrera <- summary(anova_carrera_result)
# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Carreras**\n")
##
## **Resultados Traducidos para Carreras**
cat("Grados de Libertad (Df): Carrera -", resultados_anova_carrera$Df[1], ", Residuals -", resultados_anova_carrera$Df[2], "\n")
## Grados de Libertad (Df): Carrera - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Carrera -", resultados_anova_carrera$`Sum Sq`[1], ", Residuals -", resultados_anova_carrera$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Carrera - , Residuals -
cat("Media de Cuadrados (Mean Sq): Carrera -", resultados_anova_carrera$`Mean Sq`[1], ", Residuals -", resultados_anova_carrera$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Carrera - , Residuals -
cat("Valor F (F value): Carrera -", resultados_anova_carrera$`F value`[1], ", Residuals -", resultados_anova_carrera$`F value`[2], "\n")
## Valor F (F value): Carrera - , Residuals -
cat("Pr(>F): Carrera -", resultados_anova_carrera$`Pr(>F)`[1], ", Residuals -", resultados_anova_carrera$`Pr(>F)`[2], "\n")
## Pr(>F): Carrera - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_carrera$signif.codes), "\n")
## Signif. codes:
anova_genero_result <- aov(`duracion total de la carrera` ~ genero, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros\n")
##
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Géneros
print(summary(anova_genero_result))
## Df Sum Sq Mean Sq F value Pr(>F)
## genero 1 0 0.435 1.408 0.235
## Residuals 14111 4361 0.309
# Resultados de la ANOVA para Géneros
resultados_anova_genero <- summary(anova_genero_result)
# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Géneros**\n")
##
## **Resultados Traducidos para Géneros**
cat("Grados de Libertad (Df): Género -", resultados_anova_genero$Df[1], ", Residuals -", resultados_anova_genero$Df[2], "\n")
## Grados de Libertad (Df): Género - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Género -", resultados_anova_genero$`Sum Sq`[1], ", Residuals -", resultados_anova_genero$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Género - , Residuals -
cat("Media de Cuadrados (Mean Sq): Género -", resultados_anova_genero$`Mean Sq`[1], ", Residuals -", resultados_anova_genero$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Género - , Residuals -
cat("Valor F (F value): Género -", resultados_anova_genero$`F value`[1], ", Residuals -", resultados_anova_genero$`F value`[2], "\n")
## Valor F (F value): Género - , Residuals -
cat("Pr(>F): Género -", resultados_anova_genero$`Pr(>F)`[1], ", Residuals -", resultados_anova_genero$`Pr(>F)`[2], "\n")
## Pr(>F): Género - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_genero$signif.codes), "\n")
## Signif. codes:
colnames(titulados_filtrado)
## [1] "periodo" "genero"
## [3] "semestre de inicio de la carrera" "nombre grado obtenido"
## [5] "nombre carrera" "duracion total de la carrera"
# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
anova_area_result <- aov(`duracion total de la carrera` ~ `nombre carrera`, data = titulados_filtrado)
cat("\n# Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras\n")
##
## # Prueba ANOVA para Comparar Duración Total de la Carrera entre Carreras
print(summary(anova_area_result))
## Df Sum Sq Mean Sq F value Pr(>F)
## `nombre carrera` 1 118 117.5 390.8 <2e-16 ***
## Residuals 14111 4244 0.3
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Resultados de la ANOVA para Áreas de Estudio
resultados_anova_area <- summary(anova_area_result)
# Imprimir resultados traducidos
cat("\n**Resultados Traducidos para Áreas de Estudio**\n")
##
## **Resultados Traducidos para Áreas de Estudio**
cat("Grados de Libertad (Df): Área de Estudio -", resultados_anova_area$Df[1], ", Residuals -", resultados_anova_area$Df[2], "\n")
## Grados de Libertad (Df): Área de Estudio - , Residuals -
cat("Suma de Cuadrados (Sum Sq): Área de Estudio -", resultados_anova_area$`Sum Sq`[1], ", Residuals -", resultados_anova_area$`Sum Sq`[2], "\n")
## Suma de Cuadrados (Sum Sq): Área de Estudio - , Residuals -
cat("Media de Cuadrados (Mean Sq): Área de Estudio -", resultados_anova_area$`Mean Sq`[1], ", Residuals -", resultados_anova_area$`Mean Sq`[2], "\n")
## Media de Cuadrados (Mean Sq): Área de Estudio - , Residuals -
cat("Valor F (F value): Área de Estudio -", resultados_anova_area$`F value`[1], ", Residuals -", resultados_anova_area$`F value`[2], "\n")
## Valor F (F value): Área de Estudio - , Residuals -
cat("Pr(>F): Área de Estudio -", resultados_anova_area$`Pr(>F)`[1], ", Residuals -", resultados_anova_area$`Pr(>F)`[2], "\n")
## Pr(>F): Área de Estudio - , Residuals -
# Imprimir los códigos de significancia
cat("Signif. codes: ", paste0(" ", resultados_anova_area$signif.codes), "\n")
## Signif. codes:
El coeficiente de correlación entre el año de titulación y la duración total de la carrera es significativamente diferente de cero (p < 0.05), indicando una relación estadísticamente significativa.
La prueba ANOVA sugiere que hay diferencias significativas en la duración total de la carrera entre los géneros de los titulados (p < 0.05).
La prueba ANOVA indica que existen diferencias significativas en la duración total de la carrera entre las carreras seleccionadas (p < 0.05).
La prueba ANOVA revela diferencias significativas en la duración total de la carrera entre las áreas de estudio (p < 0.05).
En este proyecto, se exploraron datos de titulados de educación superior en 2022, se propusieron hipótesis y se realizaron pruebas estadísticas. Los resultados indican que hay diferencias significativas en la duración total de la carrera entre las variables analizadas. Este análisis proporciona información valiosa para comprender patrones y tendencias en la educación superior.