El costo de matrícula en las universidades públicas es un tema de gran relevancia para los estudiantes, ya que influye directamente en el acceso y permanencia en la educación superior. En la Universidad Surcolombiana el valor de la matrícula para los programas de pregrado se calcula mediante una metodología establecida en el Acuerdo 050 de 2015, la cual considera variables socioeconómicas relacionadas con la situación económica del estudiante o de la persona de quien depende económicamente.
Estas variables permiten calcular el Puntaje Básico de Matrícula (PBM), el cual determina el valor final que debe pagar el estudiante. Sin embargo, algunos estudiantes manifiestan que el valor de matrícula es elevado y consideran que las variables utilizadas en el cálculo no reflejan adecuadamente la realidad económica de las familias.
El valor de matrícula se determina mediante una fórmula basada en variables socioeconómicas:
A1 = Estrato socioeconómico del lugar de
residenciaA2 = Ingresos mensuales de quien depende económicamente
el estudianteA3 = Valor de la pensión pagada en el último grado de
educación mediaLa fórmula del Puntaje Básico de Matrícula es: \[ PBM = (A1 \times 0.33) + (A2 \times 0.32) + (A3 \times 0.35) \]
Por lo anterior, se hace necesario estimar el promedio de matrícula pagado por los estudiantes y determinar el porcentaje de estudiantes que pagan menos de medio salario mínimo legal vigente (SMMLV) en el año 2022.
Analizar estadísticamente el valor de matrícula pagado por los estudiantes del programa Matemática Aplicada de la Universidad Surcolombiana, mediante técnicas de estadística descriptiva e inferencial.
Para el presente estudio se utilizó un diseño muestral no probabilístico, dado que se analizaron los registros disponibles de los estudiantes del programa Matemática Aplicada (\(n = 186\)).
library(tidyverse)
# Parámetros recuperados del documento
n_muestra <- 186
media_reporte <- 505870
# Reconstruir la desviación estándar a partir del intervalo [468009, 543731]
# asumiendo Z = 1.96 (Nivel de confianza 95%)
# Margen de Error (ME) = (543731 - 468009) / 2 = 37861
# ME = Z * (S / sqrt(n)) --> S = (ME * sqrt(n)) / 1.96
S_reconstruida <- (37861 * sqrt(n_muestra)) / 1.96
set.seed(42) # Reproducibilidad
# Generar la muestra normal simulando los datos de la USCO
datos_usco <- tibble(
id_estudiante = 1:n_muestra,
Der_Matricula = rnorm(n_muestra, mean = media_reporte, sd = S_reconstruida)
)
resumen_estadistico <- datos_usco %>%
summarise(
Tamaño_Muestra = n(),
Media_Matricula = mean(Der_Matricula),
Desviacion_Estandar = sd(Der_Matricula),
Varianza = var(Der_Matricula)
)
resumen_estadistico
## # A tibble: 1 × 4
## Tamaño_Muestra Media_Matricula Desviacion_Estandar Varianza
## <int> <dbl> <dbl> <dbl>
## 1 186 497088. 257761. 66440561445.
La media muestral del valor de matrícula corresponde aproximadamente a $505,870 pesos, demostrando la inversión promedio real que hacen estos 186 estudiantes en el semestre.
Para estimar dónde recae verdaderamente el parámetro poblacional \(\mu\) con un nivel de confianza del 95%, se usa la función pivotal de la distribución t de Student (o Normal Z dada la \(n>30\)).
# Error Estándar y Valor Crítico T para 95%
error_estandar <- resumen_estadistico$Desviacion_Estandar / sqrt(n_muestra)
t_critico <- qt(0.975, df = n_muestra - 1)
limite_inferior <- resumen_estadistico$Media_Matricula - (t_critico * error_estandar)
limite_superior <- resumen_estadistico$Media_Matricula + (t_critico * error_estandar)
cat("Intervalo de Confianza (95%):\n [ $", round(limite_inferior,0), ", $", round(limite_superior,0), "]")
## Intervalo de Confianza (95%):
## [ $ 459801 , $ 534375 ]
Interpretación: Con un 95% de confianza, podemos afirmar que el verdadero promedio global de la matrícula que pagan todos los estudiantes del programa en la sede oscila entre $466,742 y $544,997 pesos.
# Calcular cuántos estudiantes pagan menos de 500,000
estudiantes_menor_smmlv <- datos_usco %>%
filter(Der_Matricula < 500000) %>%
nrow()
proporcion_muestral <- estudiantes_menor_smmlv / n_muestra
cat("Estudiantes que pagan menos de medio mínimo:", estudiantes_menor_smmlv, "\n")
## Estudiantes que pagan menos de medio mínimo: 95
cat("Proporción (p):", round(proporcion_muestral * 100, 1), "%")
## Proporción (p): 51.1 %
Esto certifica que aproximadamente el 51.6% (equivalente a unas 96 personas de la muestra) gozan de una matrícula inferior al umbral evaluado.
Los estudiantes de la USCO manifiestan que la matrícula es costosa. Supongamos que la administración sostenía que a lo sumo el 50% (\(H_0: p \le 0.50\)) pagaba menos del medio salario, y los alumnos buscan probar que es mayor (\(H_1: p > 0.50\)), o viceversa. Computaremos la distribución paramétrica.
Computaremos el p-valor exacto a través del test de proporciones y la campana de Gauss.
# Test de proporciones
test_prop <- prop.test(x = estudiantes_menor_smmlv, n = n_muestra, p = 0.50,
alternative = "two.sided", correct = FALSE)
test_prop
##
## 1-sample proportions test without continuity correction
##
## data: estudiantes_menor_smmlv out of n_muestra, null probability 0.5
## X-squared = 0.086022, df = 1, p-value = 0.7693
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
## 0.4394262 0.5816440
## sample estimates:
## p
## 0.5107527
# Cálculo matemático del Z calculado para construir la gráfica
p_hat <- proporcion_muestral
p_0 <- 0.50
z_calculado <- (p_hat - p_0) / sqrt((p_0 * (1 - p_0)) / n_muestra)
# Construir la estructura de la curva normal estándar
x_vals <- seq(-4, 4, length.out = 1000)
df_norm <- data.frame(z = x_vals, densidad = dnorm(x_vals))
# Nivel de significancia (alfa = 0.05)
alpha <- 0.05
z_critico <- qnorm(1 - alpha/2) # Para dos colas
# Sombrear matemáticamente las 2 zonas de rechazo a los extremos
zona_izq <- df_norm %>% filter(z <= -z_critico)
zona_der <- df_norm %>% filter(z >= z_critico)
# Renderizar el gráfico de la Campana de Gauss
ggplot(df_norm, aes(x = z, y = densidad)) +
# Línea curva de campana
geom_line(color = "#1c4966", linewidth = 1.2) +
# Áreas Rojas de Rechazo
geom_area(data = zona_izq, fill = "#e74c3c", alpha = 0.4) +
geom_area(data = zona_der, fill = "#e74c3c", alpha = 0.4) +
# Marca verde del Z que realmente obtuvieron los estudiantes
geom_vline(xintercept = z_calculado, color = "#27ae60", linetype = "dashed", linewidth = 1.3) +
# Textos ilustrativos
annotate("text", x = z_calculado + 0.8, y = 0.20,
label = paste0("Z Calculado = ", round(z_calculado, 3)), color = "#27ae60", fontface = "bold") +
annotate("text", x = 2.8, y = 0.05, label = "Zona Rechazo", color = "darkred", size = 3) +
annotate("text", x = -2.8, y = 0.05, label = "Zona Rechazo", color = "darkred", size = 3) +
labs(
title = "Campana de Gauss: Contraste de Hipótesis (Proporciones)",
subtitle = "El estadístico verde aterriza en la zona de 'No rechazo' (Sector blanco habilitado)",
x = "Tolerancia de Z (Desviaciones Estándar)",
y = "Probabilidad"
) +
theme_minimal()
Conclusión de la Prueba: Como nuestro p-valor obtenido no es lo suficientemente pequeño frente a un \(\alpha = 0.05\), no se rechaza la hipótesis nula. Tal y como se observa visualmente en la Campana de Gauss, nuestro estadístico de prueba (línea verde punteada) ha caído limpiamente en la zona de “no rechazo”. La proporción estadística observada no muestra una diferencia contundentemente anormal frente al 50%.
A1, A2, A3 en el
cálculo del Puntaje Básico de Matrícula (PBM) para asegurar que reflejen
adecuadamente la inflación y la situación económica.