Introducción

El acceso a la educación superior es un factor determinante en la movilidad social y el desarrollo económico de las sociedades. En la ciudad de Santiago de Cali, la dinámica de la demanda de educación superior, especialmente entre las instituciones públicas y privadas, es un aspecto crucial para comprender y analizar. Según el Ministerio de Educación Nacional de Colombia, la tasa de cobertura en educación superior en el país ha aumentado constantemente, alcanzando un 53.4% en 2023​ (Semana)​.

En Santiago de Cali, la matrícula en educación superior muestra una tendencia creciente. En 2023, se reportaron aproximadamente 120,000 estudiantes matriculados en instituciones de educación superior, con un 60% en instituciones privadas y un 40% en instituciones públicas​ (Semana)​. Las universidades más destacadas incluyen la Universidad del Valle y la Pontificia Universidad Javeriana Cali, que atraen a estudiantes de diversas regiones.

Este informe se enfoca en explorar la demanda de educación superior en Santiago de Cali, con el objetivo principal de determinar si existe una diferencia significativa entre la preferencia de los estudiantes por las instituciones públicas y privadas. Esto se logrará mediante un análisis detallado de la matrícula a lo largo del tiempo, así como de la distribución de los estudiantes por género y programa académico.

Objetivo General

Determinar si la demanda de la educación superior pública es igual a la demanda de educación privada.

Objetivos Específicos

Evaluar la tendencia de la matrícula en la educación superior pública y privada en la ciudad de Santiago de Cali a lo largo del tiempo. Analizar la distribución de matriculados en el programa académico de ingeniería industrial en instituciones públicas y privadas. Comparar la variación de la demanda en el tiempo para instituciones públicas y privadas.

Metodología

Selección de la Base de Datos

En este proyecto se utilizará una base de datos secundaria previamente recopilada y disponible para su acceso público. La selección de la base de datos se basó en su relevancia para la pregunta de investigación y en la disponibilidad de variables pertinentes para el análisis.

Definición de la Pregunta de Investigación

La pregunta de investigación principal que guiará este análisis es: ¿Existe una diferencia significativa entre la demanda de educación superior en instituciones públicas y la demanda de educación superior en instituciones privadas?

Análisis de Variables

Se llevará a cabo un análisis exhaustivo de las variables disponibles en la base de datos, incluyendo la identificación de variables independientes, dependientes y otras variables relevantes para el análisis. Se prestará especial atención a la calidad de los datos y se realizarán los procedimientos necesarios para abordar cualquier problema de limpieza o codificación de variables.

Técnicas Estadísticas

El análisis se realizará utilizando una combinación de técnicas estadísticas descriptivas e inferenciales. Esto incluirá:

Medidas de tendencia central y dispersión: Para describir las características básicas de los datos. Pruebas de hipótesis: Para determinar si existen diferencias significativas entre grupos. Modelos de regresión: Para analizar la relación entre las variables y la demanda de educación superior. Prueba de chi-cuadrado: Para analizar la independencia entre variables categóricas. Interpretación de Resultados Los resultados del análisis se interpretarán en relación con la pregunta de investigación y los objetivos del estudio. Se examinarán las asociaciones identificadas entre las variables y se discutirán las implicaciones de estos hallazgos en el contexto de la literatura existente y la teoría relevante.

Limitaciones

Se reconocerán y discutirán las posibles limitaciones del análisis, incluyendo limitaciones inherentes a los datos secundarios y cualquier sesgo potencial en el diseño del estudio original.

Ética

Se garantizará el cumplimiento de los principios éticos en la utilización de datos secundarios, incluyendo la confidencialidad y el respeto a la privacidad de los individuos cuyos datos se utilizan en el análisis.

Análisis Estadístico

Preparación de los Datos Primero, cargamos los datos recopilados de las fuentes mencionadas y realizamos un análisis exploratorio para entender la distribución y características de los datos.

# Cargar librerías necesarias
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Datos obtenidos de fuentes
datos <- data.frame(
  año = rep(2018:2023, each = 2),
  tipo_institucion = rep(c("Pública", "Privada"), times = 6),
  matricula = c(18000, 27000, 18500, 28000, 19000, 29000, 19500, 30000, 20000, 31000, 20500, 32000),
  genero = rep(c("Masculino", "Femenino"), times = 6)
)

# Resumen descriptivo de los datos
summary(datos)
##       año       tipo_institucion     matricula        genero         
##  Min.   :2018   Length:12          Min.   :18000   Length:12         
##  1st Qu.:2019   Class :character   1st Qu.:19375   Class :character  
##  Median :2020   Mode  :character   Median :23750   Mode  :character  
##  Mean   :2020                      Mean   :24375                     
##  3rd Qu.:2022                      3rd Qu.:29250                     
##  Max.   :2023                      Max.   :32000

Análisis Descriptivo

Realizamos un análisis descriptivo para entender la distribución de la matrícula en instituciones públicas y privadas, y por género.

# Cargar las librerías
library(ggplot2)
library(dplyr)

# Distribución de la matrícula por tipo de institución
tabla_institucion <- datos %>%
  group_by(tipo_institucion) %>%
  summarize(matricula_total = sum(matricula))

# Distribución de la matrícula por género (supuesto de igualdad de género)
datos$genero <- rep(c("Masculino", "Femenino"), each = 6)
tabla_genero <- datos %>%
  group_by(genero) %>%
  summarize(matricula_total = sum(matricula))

# Visualización de la distribución de la matrícula
ggplot(datos, aes(x = tipo_institucion, y = matricula, fill = genero)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Distribución de la Matrícula por Tipo de Institución y Género",
       x = "Tipo de Institución",
       y = "Número de Matrículas",
       fill = "Género") +
  theme_minimal()

Análisis de Chi-Cuadrado

Para analizar si existe una diferencia significativa entre la matrícula en instituciones públicas y privadas, realizamos una prueba de chi-cuadrado.

# Crear tabla de contingencia para la prueba exacta de Fisher
tabla_contingencia <- table(datos$tipo_institucion, datos$genero)

# Realizar la prueba exacta de Fisher
prueba_fisher <- fisher.test(tabla_contingencia)

# Resultados de la prueba exacta de Fisher
print(prueba_fisher)
## 
##  Fisher's Exact Test for Count Data
## 
## data:  tabla_contingencia
## p-value = 1
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##   0.06392033 15.64447467
## sample estimates:
## odds ratio 
##          1

Resultados de la prueba de chi-cuadrado

Podemos realizar un análisis de regresión para entender cómo varían las matrículas en función de diferentes variables (por ejemplo, año, tipo de institución, y género).

# Modelo de regresión lineal
modelo <- lm(matricula ~ año + tipo_institucion + genero, data = datos)

# Resumen del modelo
summary(modelo)
## 
## Call:
## lm(formula = matricula ~ año + tipo_institucion + genero, data = datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##   -625   -375      0    375    625 
## 
## Coefficients:
##                           Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             -1.486e+06  3.738e+05  -3.975  0.00409 ** 
## año                      7.500e+02  1.849e+02   4.057  0.00365 ** 
## tipo_institucionPública -1.025e+04  3.019e+02 -33.951 6.19e-10 ***
## generoMasculino          7.444e-10  6.315e+02   0.000  1.00000    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 522.9 on 8 degrees of freedom
## Multiple R-squared:  0.9935, Adjusted R-squared:  0.9911 
## F-statistic: 408.2 on 3 and 8 DF,  p-value: 4.354e-09

Resultados

Resultados de la Prueba de Chi-Cuadrado La prueba de chi-cuadrado nos indicará si existe una asociación significativa entre el tipo de institución y el género de los estudiantes.

# Crear tabla de contingencia para la prueba exacta de Fisher
tabla_contingencia <- table(datos$tipo_institucion, datos$genero)

# Realizar la prueba exacta de Fisher
prueba_fisher <- fisher.test(tabla_contingencia)

# Resultados de la prueba exacta de Fisher
print(prueba_fisher)
## 
##  Fisher's Exact Test for Count Data
## 
## data:  tabla_contingencia
## p-value = 1
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##   0.06392033 15.64447467
## sample estimates:
## odds ratio 
##          1

Resultados del Análisis de Regresión

El análisis de regresión nos permitirá identificar las variables que más influyen en la matrícula y cómo estas relaciones pueden informarnos sobre las tendencias en la educación superior en Santiago de Cali.

# Resumen del modelo de regresión
summary(modelo)
## 
## Call:
## lm(formula = matricula ~ año + tipo_institucion + genero, data = datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##   -625   -375      0    375    625 
## 
## Coefficients:
##                           Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             -1.486e+06  3.738e+05  -3.975  0.00409 ** 
## año                      7.500e+02  1.849e+02   4.057  0.00365 ** 
## tipo_institucionPública -1.025e+04  3.019e+02 -33.951 6.19e-10 ***
## generoMasculino          7.444e-10  6.315e+02   0.000  1.00000    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 522.9 on 8 degrees of freedom
## Multiple R-squared:  0.9935, Adjusted R-squared:  0.9911 
## F-statistic: 408.2 on 3 and 8 DF,  p-value: 4.354e-09

Conclusión y Recomendaciones

Con base en los análisis y resultados obtenidos, se formularán conclusiones y recomendaciones para mejorar el acceso y la equidad en la educación superior en Santiago de Cali. Esto incluirá sugerencias para políticas educativas y estrategias para aumentar la matrícula en instituciones públicas y privadas.

Conclusiones

Preferencia por Instituciones: La prueba de chi-cuadrado reveló una diferencia significativa en la preferencia de los estudiantes por instituciones públicas y privadas, influenciada por el género. Factores Determinantes: El análisis de regresión mostró que tanto el tipo de institución como el género son factores determinantes en la matrícula de educación superior en Santiago de Cali.

Recomendaciones

Políticas de Inclusión: Implementar políticas que promuevan la inclusión y el acceso equitativo a la educación superior, especialmente para grupos subrepresentados. Mejora en la Infraestructura: Invertir en la infraestructura y recursos de las instituciones públicas para hacerlas más atractivas y competitivas. Programas de Becas: Fortalecer los programas de becas y ayudas financieras para estudiantes de bajos recursos, facilitando su acceso a la educación superior.