knitr::opts_chunk$set(echo = TRUE)
FACTORES QUE AFECTAN EL RENDIMIENTO ACADEMICO
INTRODUCCIÓN
En el rendimiento académico influyen una gran cantidad de factores determinantes tales cómo estado de ánimo, dinero, tiempo y sobrecarga estudiantil. En este proyecto se busca identificar cuál es el factor más determinante, tomando como población a las mujeres de ingeniería civil, para así poder hacer un estudio estadístico para la realización de este proyecto.La encuesta realizada fue la siguiente https://docs.google.com/forms/d/16g-neVP3ydSRf2XSYFrh6vSkoNG_2RvJYpjg_AkWfiU/edit.
Para el desarrollo de la encuesta se plantearon las siguientes preguntas, las cuales se dividen entre categóricas y numéricas
PREGUNTAS CATEGÓRICAS
1 Estado civil
2 ¿Cómo financia sus estudios?
3 ¿Considera que el dinero que recibe cubre sus necesidades ?
4 ¿Qué tan a menudo llega tarde a sus clases?
5 ¿Cuál es su medio de transporte cuando va a la universidad?
6¿Cuál es tu estado de animo antes de presentar un parcial?
PREGUNTAS NUMÉRICAS
1 Código
2 Edad
3 ¿Cuántas materias estás viendo este semestre?
4 ¿Cuál es tu promedio ponderado?
5 ¿Cuántos semestres llevas en la universidad?
6 Aproximadamente, ¿Cuánto dinero recibe mensualmente?
7 Aproximadamente, ¿Cuánto dinero gasta mensualmente?
8 En promedio ¿Cuántas veces llegó tarde a clases este mes?
9 ¿Cuántas horas a la semana le dedica al estudio?
10 ¿En promedio cuantas horas duerme al día?
MUESTREO
Al momento de realizar la investigación de la población a estudiar se determinó que 414 mujeres se encontraban matriculadas en el programa de ingeniería civil como se evidencia en la siguiente imágen:
En este proyecto se realizó un muestreo proporcional al tamaño debido a que la encuesta fue enviada antes de realizar la prueba piloto, por lo tanto se realizo un proceso de aleatorizacion para poder determinar el número de personas a encuestar de manera aleatoria, de los cuáles se obtuvieron los siguientes resultados:
PRUEBA PILOTO: Para la determinación del tamaño de muestra realizamos una prueba piloto de las cuáles se tomaron como referencia 5 personas, para así poder determinar nuestro tamañao de muestra el cuál se evidencia a continuación:
library(readxl)
ENC <- read_excel("ENC.xlsx")
View(ENC)
attach(ENC)
names(ENC)
library(TeachingSampling)
pp=S.SI(nrow(ENC),5)
table(pp)
piloto=ENC[pp,]
v_p=var(piloto$V1)
d_p=sd(piloto$V1)
desv_deseada=d_p/8
var_deseada=desv_deseada^2
N=414
n=(N*v_p)/((N*var_deseada)+v_p)
tm=S.SI(nrow(ENC),round(n,0))
Tratamiento de datos
Con los resultados obtenidos de la encuesta se procede a relaizar la estadística descriptiva de las variables usando el paquete pastecs el cuál nos arroja todos los resultados.
Estadistica descriptiva de variables númericas
library(pastecs)
stat.desc(V2)
stat.desc(V6)
stat.desc(V5)
stat.desc(V7)
stat.desc(V8)
Análisis
Para la variable v2 (edad): Se encontró que el intervalo mínimo y máximo de edad está entre 17 y 27 años, su rango es de 10 años, su mediana es de 21 años, su media es de 20 años aproximadamente. Su varianza es de 2,74 , su desviación estándar es de 1,66, por último el coeficiente de variación de la edad de las mujeres encuestadas es de 0,08.
Para la variable v6 (Promedio ponderado): Se encontró que el intervalo mínimo y máximo de promedio está entre 3,3 y 4,6, su rango es de 1,3 puntos, su mediana es de 3,81, su media es de 3,87. Su varianza es de 0,061, su desviación estándar es de 0,24, por último el coeficiente de variación de la edad es de 0,063.
Para la variable v5 (Materias matriculadas): Se encontró que el intervalo mínimo y máximo de materias matriculadas en el semestre está entre 2 y 8, su rango es de 6 materias, su mediana es de 5, su media es de 4,82 pero debido a que son materias se aproxima a 5. Su varianza es de 1,05, su desviación estándar es de 1,02, por último el coeficiente de variación de la edad es de 0,21.
Para la variable v7 (Semestres cumplidos): Se encontró que el intervalo mínimo y máximo de semestres que lleva en la universidad está entre 2 y 15, para este rango de semestres se cree que exceden los 10 debido a los semestres virtuales que no contó la univesidad, su rango es de 13 semestres, su mediana es de 5, su media es de 5,89 semestres. Su varianza es de 3,44, como anteiormente se menciona la varianza es alta por el numero alto de semestres, su desviación estándar es de 1,85, por último el coeficiente de variación de la edad es de 0,315.
por último la variable v8 (Dinero que recibe): Se encontró que el intervalo mínimo y máximo de dinero que recibe al mes es de entre 100.000 y 3’000.000 millones de pesos, su rango es de 2’900.000 pesos, su mediana es de 525.000 pesos, su media es de 3,87. Su varianza es de 0,061, su desviación estándar es de 0,24, por último el coeficiente de variación de la edad es de 0,063.
ESTADISTICA DESCRIPTIVA VARIABLES CATEGÓRICAS
## tabla de frecuencia categorica V4
library(fdth)
V4_a=as.factor(V4)
attach(ENC)
class(V4_a)
tabla1=fdt_cat(V4_a,sort=TRUE)
tabla1
## tabla de frecuencia categorica V11
library(fdth)
V11_a=as.factor(V11)
attach(ENC)
class(V11_a)
tabla2=fdt_cat(V11_a,sort=TRUE)
tabla2
## tabla de frecuencia categorica V10
library(fdth)
V10_a=as.factor(V10)
attach(ENC)
class(V10_a)
tabla3=fdt_cat(V10_a,sort=TRUE)
tabla3
# tabla de frecuencia categorica v16
library(fdth)
V16_a=as.factor(V16)
attach(ENC)
class(V16_a)
tabla4=fdt_cat(V16_a,sort=TRUE)
tabla4
ANALISIS
Para la variable v4 (¿Considera que el dinero que recibe cubre sus necesidades?): De acuerdo con los datos arrojados por el programa se determina que las mujeres que son ayudadas por sus padres son las que más frecuentan en la encuesta, con una frecuencia relativa de 62,50 %, seguidamente las mujeres becadas tienen una frecuencia relativa de 28,57%, las mujeres que pagan sus estudios por medio del icetex tienen una frecuencia relativa de 3,57%, las mujeres que pagan sus estudios trabajando tienen una frecuencia relativa de 1,79% y por último las mujeres que pagan sus estudios por otra forma de pago tiene una frecuencia relativa de 3,57%, por lo que podemos deducir que la mayoria de mujeres encuestadas son ayudadas por sus padres u otras personas, creemos que las mujeres que tienen que trabajar para pagar sus estudios son las mujeres que les va regular en su estudio debido a que el tiempo que deberian invertir estudiando, lo consumen trabajando.
Para la variable v11 (¿Qué tan a menudo llega tarde a clases?): De acuerdo con los datos arrojados por el programa se determina que las mujeres que el 53,57% de ellas llega tarde a clases, el 28,57% controla sus llegadas a tarde pero establecen que lo hacen de vez en cuando, por último el 17,86% de las mujeres encuestadas no llegan tarde, podemos determinar que llegar a clases es un posible factor que está afectando a sus notas debido a que se pierde el hilo de la clase y produce confusión de los temas a estudiar. Para la variable v16 (¿Cuál es tu estado de animo antes de presentar un parcial?): De acuerdo con los datos arrojados por el programa se determina que las mujeres que sienten ansiedad antes de un parcial se encuentran con un 46,43%, el 30,36% de las mujeres sienten nervios para los previos, el 14,29% de las mujeres sienten tranquilidad antes de un previo, el 5,36% de las mujeres sienten angustia antes de resolver un parcial, por último las mujeres que no sienten nada para los parciales spn del 3,57% del total de encuestadas, como conclusión creemos que el estado de animo también es un factor importante a tener en cuenta con respecto al rendimiento estudiantil.
CRUCES DE VARIABLES
## CATEGORICA VS CATEGORICA V4 VS V10
library(gmodels)
CrossTable(V4,V10,prop.chisq=FALSE,prop.r=FALSE,prop.c=T,prop.t=FALSE)
ANÁLISIS
De acuerdo con la tabla creada debido a el cruce de la variable v4 (Cómo
finacia sus estudios), con la variable V10 (¿Considera que el dinero que
recibe cubre sus necesidades?), podemos afirmar que las respuestas
‘’ayuda de padres u otras personas’’ con la respuesta ‘’más o menos’’
tienen una relación de 0,314 ahora, con la respuesta ‘’no’’ tiene una
relación de 0,143 , con la respuesta si tiene una relación de 0,549
obteniendo un total de 0,625 en proporción de las personas encuestadas.
estos valores dependen de la cantidad de personas que se relacionan con
las variables, un ejemplo es decir que de todas las 56 personas
encuestadas, 11 de ellas son ayudadas por sus padres y consideran que el
dinero que reciben es más o menos suficiente para el sustento mensual.
Cabe decir que el resto de relaciones se puede visualizar en la tabla
que reproduce el programa, mostrando cada una de sus relaciones en
porcentajes y en cantidad de personas relacionadas con las respuestas.
Para concluir podemos hacer las siguientes afirmaciones:
–De 35 de las 56 mujeres encuestadas la mayoria que son ayudadas por sus padres u otras personas 19 de ellas creen que el dinero que reciben es suficiente para cubrir sus necesidades en todo el mes.
–De 16 de las 56 mujeres encuestadas 9 de las que respondieron que estudian gracias a la beca, afirman que el dinero que gastan es suficiente para poder vivir tranquilamente a lo largo del mes.
–De 2 de las 56 mujeres encuestadas que pagan sus estudios con icetex, una de ellas dice que si le alcanza el dinero para vivir el mes y otra de ellas niega esta afirmación.
–De 1 mujer de las 56 encuestadas que paga sus estudios trabajando, cree que más o menos le alcanza el dinero para vivir.
–De 2 mujeres de las 56 encuestadas que paga sus estudios de otra manera se debate entre si y no alcanza el dinero para vivir en todo lo que abarca el mes.
## CATEGORICA VS CATEGORICA V11 VS V16
library(gmodels)
CrossTable(V11,V16,prop.chisq=FALSE,prop.r=FALSE,prop.c=T,prop.t=FALSE)
ANÁLISIS
De acuerdo con la tabla creada debido a el cruce de la variable v11 (¿Qué tan a menudo llega tarde a sus clases? ), con la variable V16 (¿Cuál es tu estado de animo antes de presentar un parcial? ), podemos afirmar que las respuestas ‘’a veces’’ con la respuesta ‘’angustia’’ tienen una relación del 0,667 ahora, con la respuesta ‘’ansiedad’’ tiene una relación de 0,731 %, con la respuesta ‘’nada’’ tiene una relación de 0,500, con la respuesta ‘’nervios’’ tiene una relación de 0,824 y por último con la respuesta ‘’tranquilidad’’ tiene una relación de 0,500 teniendo un total de 40 mujeres relacionadas con respecto a las preguntas que se les hicieron. Para concluir podemos decir que:
-De 40 mujeres con respecto a todas las 56 encuestadas, podemos afirmar que 19 de ellas aveces llegan tarde a clase y sienten ansiedad antes de entrar a un parcial.
-De 5 mujeres con respecto a todas las 56 encuestadas, podemos afirmar que 3 de ellas casi siempre llegan tarde a clase y sienten ansiedad antes de entrar a un parcial.
-De 10 mujeres con respecto a todas las 56 encuestadas, podemos afirmar que 3 de ellas nunca llegan tarde a clase y sienten tranquilidad antes de entrar a un parcial.
-De 1 mujer con respecto a todas las 56 encuestadas, podemos afirmar que 1 de ellas siempre llegan tarde a clase y no siente nada antes de entrar a un parcial.
Teniendo en cuenta que la suma de todas estas mujeres da 56, podemos recalcar que todos los analisis no están expuestos pero si tienen la misma metodologia que puede ser guiada con la tabla generada en el cruce de estas dos variables.
# CATEGORICA VS CATEGORICA V10 VS V12
library(gmodels)
CrossTable(V10,V12,prop.chisq=FALSE,prop.r=FALSE,prop.c=FALSE,prop.t=FALSE)
ANÁLISIS
De acuerdo con la tabla creada debido a el cruce de la variable v10 (¿Considera que el dinero que recibe cubre sus necesidades?), con la variable V12 (¿Cuál es su medio de transporte cuando va a la universidad?), podemos afirmar que las respuestas ‘’más o menos’‘, no tiene ninguna relación con la respuesta bicicleta, por otro lado si tiene relación con la respuesta’‘metrolinea’’ que es de 0,222, por último tiene una relación con la respuesta ‘’otro medio de transporte’’, dando un total de 16 mujeres relacionadas el total que son 56 mujeres, este analisis se hace de igual manera para las otras respuestas, con base a los datos arrojadas de la tabla generada por el programa. Para concluir, podemos decir que:
– 8 de las 56 mujeres encuestadas que respondieron que más o menos les alcanza el dinero para cubrir sus necesidades mensuales, se movilizan por medio de otro transporte, posiblemente moto o caminando.
– 19 de las 56 mujeres encuestadas que respondieron que no les alcanza el dinero para cubrir todas sus necesidades a lo largo del mes, se movilizan de otra manera a la universidad.
– 37 de las 56 mujeres encuestadas que respondieron que si les alcanza el dinero para cubrir sus necesidades se movilizan de otra manera cuando van a la universidad.
## CATEGORICA VS CONTINUA V6 VS V16
## variable 1
ENC$V16_a=as.factor(ENC$V16)
attach(ENC)
class(ENC$V16_a)
tablav3=fdt_cat(ENC$V16_a,sort=TRUE)
## variable 2
ENC$V6_a=as.factor(ENC$V6)
attach(ENC)
class(ENC$V6_a)
tablav4=fdt_cat(ENC$V6_a,sort=TRUE)
library(crosstable)
library(dplyr)
crosstable(ENC, c(V6), by= V16_a)%>% as_flextable(keep_id=TRUE)
ANÁLISIS
De acuerdo a la tabla generada por el programa, donde analiza el cruce entre la variable v6 (Promedio ponderado) con la variable v16 (¿Qué tan a menudo llega tarde a clases?), podemos decir que:
– Las mujeres que sienten angustia antes de entrar a un parcial tienen un promedio ponderado entre [3,5 y 4,2], su mediana es de 4,2 y su media es de 4.
–Las mujeres que sienten ansiedad antes de entrar a un parcial tienen un promedio ponderado entre [3,3 y 4,2], su mediana es de 3,8 y su media es de 3,8.
–Las mujeres que no sienten nada antes de entrar a un parcial tienen un promedio ponderado entre [4,1 y 4,6], su mediana es de 4,3 y su media es de 4,3.
–Las mujeres que sienten nervios antes de entrar a un parcial tienen un promedio ponderado entre [3,6 y 4,2], su mediana es de 3,9 y su media es de 3,9.
–Las mujeres que sienten nervios antes de entrar a un parcial tienen un promedio ponderado entre [3,5 y 4,0], su mediana es de 3,8 y su media es de 3,8.
Con esto podemos concluir que las mujeres que no sienten nada antes de presentar un parcial, tienden a ser mejores en sus calificaciones, además podemos decir que la mayoria de mujeres siente ansiedad o nervios antes de ingresar a un parcial.
# CATEGORICA VS CONTINUA V11 VS V6
## variable 1
ENC$V6_a=as.factor(ENC$V6)
attach(ENC)
class(ENC$V6_a)
tablav3=fdt_cat(ENC$V6_a,sort=TRUE)
## variable 2
ENC$V11_a=as.factor(ENC$V11)
attach(ENC)
class(ENC$V11_a)
tablav4=fdt_cat(ENC$V11_a,sort=TRUE)
library(crosstable)
library(dplyr)
crosstable(ENC, c(V6), by= V11_a)%>% as_flextable(keep_id=TRUE)
ANÁLISIS
De acuerdo a la tabla generada por el programa, donde analiza el cruce entre la variable v6 (Promedio ponderado) con la variable v11 (¿Cuál es tu estado de animo antes de presentar un parcial?), podemos decir que:
–Las mujeres que aveces llegan tarde a clases tienen un promedio ponderado entre[3,3 y 4,2],su mediana es de 3,8, y su media es de 3,8.
–Las mujeres que casi siempre llegan tarde a clases tienen un promedio ponderado entre[3,7 y 4,1],su mediana es de 3,9, y su media es de 3,9.
–Las mujeres que nunca llegan tarde a clases tienen un promedio ponderado entre[3,5 y 4,2],su mediana es de 3,9, y su media es de 3,9.
–Las mujeres que siempre llegan tarde a clases tienen un promedio ponderado de 4,6,su mediana es de 4,6, y su media es de 4,6.
Con esto podemos concluir que las mujeres que han llegado tarde a clases tienden a ser mejores estudiantes.
PROBABILIDAD
Por último realizamos diferentes ejercicios de probabilidad con unas de las variables estudiadas en este proyecto.
CONCLUSIONES
Con la realización de este proyecto se resalta la importancia de la estadistica para analizar los factores que más afectaron a nuestra población a estudiar.
Se puede concluir que el rendimiento academico no depende solamente del conocimiento adquirido , si no de factores determinantes como los estudiados anteriormente.
A partir del estudio que se hizo de las 56 mujeres encuestadas, podemos afirmar que uno de los factores que posiblemente más afectan a las notas de esta población es el estado de animo que sienten antes de presentar un parcial, pues las mujeres que no sentían nada tenia un promedio mucho más alto a comparación de las que tenían algún sentimiento.
**LINK VIDEO EXPLICATIVO**