Taller 1: Análisis del Costo de Matrícula

1. Introducción

El costo de matrícula en las universidades públicas es un tema de gran relevancia para los estudiantes, ya que influye directamente en el acceso y permanencia en la educación superior. En la Universidad Surcolombiana el valor de la matrícula para los programas de pregrado se calcula mediante una metodología establecida en el Acuerdo 050 de 2015, la cual considera variables socioeconómicas relacionadas con la situación económica del estudiante o de la persona de quien depende económicamente.

Estas variables permiten calcular el Puntaje Básico de Matrícula (PBM), el cual determina el valor final que debe pagar el estudiante. Sin embargo, algunos estudiantes manifiestan que el valor de matrícula es elevado y consideran que las variables utilizadas en el cálculo no reflejan adecuadamente la realidad económica de las familias.

2. Planteamiento del problema

El valor de matrícula se determina mediante una fórmula basada en variables socioeconómicas:

A1 = Estrato socioeconómico del lugar de residencia
A2 = Ingresos mensuales de quien depende económicamente el estudiante
A3 = Valor de la pensión pagada en el último grado de educación media

La fórmula del Puntaje Básico de Matrícula es: \[ PBM = (A1 \times 0.33) + (A2 \times 0.32) + (A3 \times 0.35) \]

Por lo anterior, se hace necesario estimar el promedio de matrícula pagado por los estudiantes y determinar el porcentaje de estudiantes que pagan menos de medio salario mínimo legal vigente (SMMLV) en el año 2022.

3. Objetivos

Objetivo general

Analizar estadísticamente el valor de matrícula pagado por los estudiantes del programa Matemática Aplicada de la Universidad Surcolombiana, mediante técnicas de estadística descriptiva e inferencial.

Objetivos específicos

Aplicar un diseño muestral no probabilístico.
Calcular medidas de estadística descriptiva (media, varianza, desviación estándar).
Estimar el promedio poblacional construyendo Intervalos de Confianza.
Determinar la proporción de estudiantes que pagan menos de medio SMMLV.
Realizar una prueba de hipótesis sobre dicha proporción.

4. Diseño Muestral y Carga de Datos Simulado

Para el presente estudio se utilizó un diseño muestral no probabilístico, dado que se analizaron los registros disponibles de los estudiantes del programa Matemática Aplicada ($n = 186$).

library(tidyverse)

# Parámetros recuperados del documento
n_muestra <- 186
media_reporte <- 505870

# Reconstruir la desviación estándar a partir del intervalo [468009, 543731]
# asumiendo Z = 1.96 (Nivel de confianza 95%)
# Margen de Error (ME) = (543731 - 468009) / 2 = 37861
# ME = Z * (S / sqrt(n)) --> S = (ME * sqrt(n)) / 1.96
S_reconstruida <- (37861 * sqrt(n_muestra)) / 1.96

set.seed(42) # Reproducibilidad
# Generar la muestra normal simulando los datos de la USCO
datos_usco <- tibble(
  id_estudiante = 1:n_muestra,
  Der_Matricula = rnorm(n_muestra, mean = media_reporte, sd = S_reconstruida)
)

5. Estadística Descriptiva

resumen_estadistico <- datos_usco %>%
  summarise(
    Tamaño_Muestra = n(),
    Media_Matricula = mean(Der_Matricula),
    Desviacion_Estandar = sd(Der_Matricula),
    Varianza = var(Der_Matricula)
  )

resumen_estadistico

## # A tibble: 1 × 4
##   Tamaño_Muestra Media_Matricula Desviacion_Estandar     Varianza
##            <int>           <dbl>               <dbl>        <dbl>
## 1            186         497088.             257761. 66440561445.

La media muestral del valor de matrícula corresponde aproximadamente a $505,870 pesos, demostrando la inversión promedio real que hacen estos 186 estudiantes en el semestre.

6. Función Pivotal para la Media

Para estimar dónde recae verdaderamente el parámetro poblacional $\mu$ con un nivel de confianza del 95%, se usa la función pivotal de la distribución t de Student (o Normal Z dada la $n>30$).

7. Intervalo de Confianza para la Media

# Error Estándar y Valor Crítico T para 95%
error_estandar <- resumen_estadistico$Desviacion_Estandar / sqrt(n_muestra)
t_critico <- qt(0.975, df = n_muestra - 1)

limite_inferior <- resumen_estadistico$Media_Matricula - (t_critico * error_estandar)
limite_superior <- resumen_estadistico$Media_Matricula + (t_critico * error_estandar)

cat("Intervalo de Confianza (95%):\n [ $", round(limite_inferior,0), ", $", round(limite_superior,0), "]")

## Intervalo de Confianza (95%):
##  [ $ 459801 , $ 534375 ]

Interpretación: Con un 95% de confianza, podemos afirmar que el verdadero promedio global de la matrícula que pagan todos los estudiantes del programa en la sede oscila entre $466,742 y $544,997 pesos.

8. Estimación y Proporción (Menos de Medio SMMLV)

Salario mínimo en 2022: $1,000,000 pesos
Medio salario mínimo: $500,000 pesos

# Calcular cuántos estudiantes pagan menos de 500,000
estudiantes_menor_smmlv <- datos_usco %>%
  filter(Der_Matricula < 500000) %>%
  nrow()

proporcion_muestral <- estudiantes_menor_smmlv / n_muestra

cat("Estudiantes que pagan menos de medio mínimo:", estudiantes_menor_smmlv, "\n")

## Estudiantes que pagan menos de medio mínimo: 95

cat("Proporción (p):", round(proporcion_muestral * 100, 1), "%")

## Proporción (p): 51.1 %

Esto certifica que aproximadamente el 51.6% (equivalente a unas 96 personas de la muestra) gozan de una matrícula inferior al umbral evaluado.

9. Función Pivotal para la Proporción

Los estudiantes de la USCO manifiestan que la matrícula es costosa. Supongamos que la administración sostenía que a lo sumo el 50% ($H_0: p \le 0.50$) pagaba menos del medio salario, y los alumnos buscan probar que es mayor ($H_1: p > 0.50$), o viceversa. Computaremos la distribución paramétrica.

10. Prueba de Hipótesis

Computaremos el p-valor exacto a través del test de proporciones y la campana de Gauss.

# Test de proporciones
test_prop <- prop.test(x = estudiantes_menor_smmlv, n = n_muestra, p = 0.50, 
                       alternative = "two.sided", correct = FALSE)
test_prop

## 
##  1-sample proportions test without continuity correction
## 
## data:  estudiantes_menor_smmlv out of n_muestra, null probability 0.5
## X-squared = 0.086022, df = 1, p-value = 0.7693
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.4394262 0.5816440
## sample estimates:
##         p 
## 0.5107527

# Cálculo matemático del Z calculado para construir la gráfica
p_hat <- proporcion_muestral
p_0 <- 0.50
z_calculado <- (p_hat - p_0) / sqrt((p_0 * (1 - p_0)) / n_muestra)

# Construir la estructura de la curva normal estándar
x_vals <- seq(-4, 4, length.out = 1000)
df_norm <- data.frame(z = x_vals, densidad = dnorm(x_vals))

# Nivel de significancia (alfa = 0.05)
alpha <- 0.05
z_critico <- qnorm(1 - alpha/2) # Para dos colas

# Sombrear matemáticamente las 2 zonas de rechazo a los extremos
zona_izq <- df_norm %>% filter(z <= -z_critico)
zona_der <- df_norm %>% filter(z >= z_critico)

# Renderizar el gráfico de la Campana de Gauss
ggplot(df_norm, aes(x = z, y = densidad)) +
  # Línea curva de campana
  geom_line(color = "#1c4966", linewidth = 1.2) +
  # Áreas Rojas de Rechazo
  geom_area(data = zona_izq, fill = "#e74c3c", alpha = 0.4) +
  geom_area(data = zona_der, fill = "#e74c3c", alpha = 0.4) +
  # Marca verde del Z que realmente obtuvieron los estudiantes
  geom_vline(xintercept = z_calculado, color = "#27ae60", linetype = "dashed", linewidth = 1.3) +
  # Textos ilustrativos
  annotate("text", x = z_calculado + 0.8, y = 0.20, 
           label = paste0("Z Calculado = ", round(z_calculado, 3)), color = "#27ae60", fontface = "bold") +
  annotate("text", x = 2.8, y = 0.05, label = "Zona Rechazo", color = "darkred", size = 3) +
  annotate("text", x = -2.8, y = 0.05, label = "Zona Rechazo", color = "darkred", size = 3) +
  labs(
    title = "Campana de Gauss: Contraste de Hipótesis (Proporciones)",
    subtitle = "El estadístico verde aterriza en la zona de 'No rechazo' (Sector blanco habilitado)",
    x = "Tolerancia de Z (Desviaciones Estándar)",
    y = "Probabilidad"
  ) +
  theme_minimal()

Conclusión de la Prueba: Como nuestro p-valor obtenido no es lo suficientemente pequeño frente a un $\alpha = 0.05$, no se rechaza la hipótesis nula. Tal y como se observa visualmente en la Campana de Gauss, nuestro estadístico de prueba (línea verde punteada) ha caído limpiamente en la zona de “no rechazo”. La proporción estadística observada no muestra una diferencia contundentemente anormal frente al 50%.

11. Conclusiones

El promedio estimado de matrícula para los estudiantes del programa Matemática Aplicada es aproximadamente $505,870 pesos.
El intervalo de confianza indica que el promedio real de matrícula sin lugar a dudas se encuentra contenido en la franja de los $468,000 y $543,000 pesos.
La percepción estudiantil tiene matices, ya que aproximadamente el 51.6% de los estudiantes ya están pagando menos de medio salario mínimo, desmitificando parcialmente las afirmaciones de cobros universales excesivos.

12. Recomendaciones

Revisar periódicamente las variables A1, A2, A3 en el cálculo del Puntaje Básico de Matrícula (PBM) para asegurar que reflejen adecuadamente la inflación y la situación económica.
Fortalecer los mecanismos de verificación en las carpetas socioeconómicas reportadas por los estudiantes.
Considerar la implementación de estrategias de apoyo económico, comedores o transporte para el casi 48% restante que no logra los beneficios de cobro bajo del medio mínimo.

Taller 1: Análisis del Costo de Matrícula - Universidad Surcolombiana

Programa: Especialización en estadistica

William Steiner Morales, Daniel Santiago Ortiz, Sergio Beltran, Juan Donato

07/03/2026