Nuestra investigación requiere uso de modelos que puedan predecir, pero mayormente, explicar el comportamiento de la matricula a partir de ciertas variables independientes. Los modelos predictivos que hemos escogido para nuestra investigación es la regresion logística y la regresión lineal mútliple. El uso de estos dos modelos tienen una razón. La regresión lineal múltiple y la regresión logística nos permite conocer que factores hacen que los estudiantes de la UPRRP se matriculen o no se matriculen, qué factores tienen más peso en esa decisión y las diferentes interacciones entre ellos.
prueba1 <- lm(matricula_total ~ incidentes, variables)
summary(prueba1)
##
## Call:
## lm(formula = matricula_total ~ incidentes, data = variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2414.2 -586.9 -134.5 613.9 2266.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8723.50 500.68 17.423 1.03e-12 ***
## incidentes 72.99 16.96 4.303 0.000428 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1191 on 18 degrees of freedom
## Multiple R-squared: 0.5071, Adjusted R-squared: 0.4797
## F-statistic: 18.52 on 1 and 18 DF, p-value: 0.0004278
ggplot(data = variables,
aes(x = incidentes, y = matricula_total)) +
geom_point(size = 3, color = "purple") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
labs(
title = "Relación entre los incidentes ocurridos en el campus y la matrícula total",
x = "Incidentes ocurridos dentro del campus",
y = "Matrícula Total"
) +
theme_minimal()
Interpretación Se puede observar una relación significativa y positiva entre la matricula total y la cantidad de incidentes ocurridos dentro en el campus de la universidad de Puerto Rico, Rio Piedras. Por cada incidente adicional que ocurre, es muy probable que la matricula total sea mayor por 72 personas. Con relación al tiempo, hace 10 años en el 2015 ocurría mayor cantidad de incidentes y la matricula total de ese momento tambien era más alta. Por lo que una matricula baja ocaciona que los incidentes tambien sean menos.
prueba2 <- lm(matricula_total ~ precio_credito, variables)
summary(prueba2)
##
## Call:
## lm(formula = matricula_total ~ precio_credito, data = variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1559.3 -350.7 15.2 427.7 1139.3
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 14645.00 448.90 32.624 < 2e-16 ***
## precio_credito -35.89 3.70 -9.699 1.43e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 679.7 on 18 degrees of freedom
## Multiple R-squared: 0.8394, Adjusted R-squared: 0.8305
## F-statistic: 94.07 on 1 and 18 DF, p-value: 1.427e-08
ggplot(data = variables,
aes(x = precio_credito, y = matricula_total)) +
geom_point(size = 3, color = "steelblue") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
labs(
title = "Relación entre precio del crédito y la matrícula",
x = "Precio del crédito",
y = "Matrícula"
) +
theme_minimal()
Interpretación Con estos resultados podemos ver como al pasar los años el costo del credito ha aumentado; su trayectoria va desde 55 dolares por crédito en el año 2015 hasta aumentar a 157 dolares por crédito en el año 2024. La totalidad de los estudiantes matriculados en el recinto de Rio Piedras a lo largo de este mismo tiempo ha actuado de forma contraria, es decir se puede observar una relación negativa entre la matricula total y el precio del crédito. Se podría interpretar que al aumentar el costo del crédito en un dolar la matricula total sería menor por 35 estudiantes. Aun asi, no se puede asegurar causalidad con estos datos sino solamente la asociación negativa que tienen una con la otra en la última década.
prueba3 <- lm(matricula_total ~ poblacion_15a24, variables)
summary(prueba3)
##
## Call:
## lm(formula = matricula_total ~ poblacion_15a24, data = variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -920.60 -465.62 31.49 300.68 1503.55
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.073e+04 2.278e+03 -4.711 0.000174 ***
## poblacion_15a24 4.825e-02 5.152e-03 9.365 2.43e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 699.9 on 18 degrees of freedom
## Multiple R-squared: 0.8297, Adjusted R-squared: 0.8202
## F-statistic: 87.7 on 1 and 18 DF, p-value: 2.428e-08
ggplot(data = variables,
aes(x = poblacion_15a24, y = matricula_total)) +
geom_point(size = 3, color = "green3") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
labs(
title = "Relación entre la población de jóvenes de 15 a 24 años y la matrícula",
x = "Población de 15 a 24 años",
y = "Matrícula"
)
Interpretación Existe una relación positiva entre la población de jóvenes entre 15 a 24 años de edad en Puerto Rico y la variable de matricula total. La asociacion que podemos observar aquí nos informa que históricamente mientras mayor es la población de jóvenes en Puerto Rico tambien es mayor la matricula en la Universidad de Puerto Rico en el recinto de Rio Piedras. Por verlo de una forma más numérica, pero no necesariamente sucede así, cada 25 jóvenes dentro de la edad de 15 a 24 años en Puerto Rico uno de ellos se matricularía en la UPR-RP.
prueba4 <- lm(matricula_total ~ cant_concent, variables)
summary(prueba4)
##
## Call:
## lm(formula = matricula_total ~ cant_concent, data = variables)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1493.0 -747.6 -130.2 799.4 1661.5
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -29434.2 6376.8 -4.616 0.000215 ***
## cant_concent 666.4 106.2 6.274 6.47e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 950.1 on 18 degrees of freedom
## Multiple R-squared: 0.6862, Adjusted R-squared: 0.6687
## F-statistic: 39.36 on 1 and 18 DF, p-value: 6.468e-06
ggplot(data = variables,
aes(x = cant_concent, y = matricula_total)) +
geom_point(size = 3, color = "gold2") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
labs(
title = "Relación entre la cantidad de concentraciones y la matrícula",
x = "Cantidad de Concentraciones por semestre",
y = "Matricula Total"
) +
theme_minimal()
Interpretación Existe una asociación positiva entre la cantidad de concentraciones ofrecidas en la universidad y la cantidad total de matricula. Si hubiera una mayor matrícula total de estudiantes en la UPR-RP es altamente probable que las concentraciones disponibles ofrecidas tambien aumente.
Hemos llegado a la conclusión de que los límites de nuestra investigación se basan en dos específicamente: