RENDIMIENTO ACÁDEMICO DE ESTUDIANTES DE LA UIS DESPUES DE QUINTO SEMESTRE DE INGENIERIA CIVIL POST PANDEMIA
INTRODUCCIÓN
En el presente informe se adjunta los resultados de un estudio en los estudiantes de ingenieria civil de la Universidad Industrial de Santander, en este estudio se pretende estudiar y analizar la problematica en el promedio acumulado de los estudiantes post pandemi. Se presenta pregunta problema La llegada de la pandemia del COVID-19 en todo el mundo, cambio nuestra forma de vida a la que estábamos acostumbrados, teniendo en cuenta este cambio tan inesperado, ¿Por qué es importante el estudio del rendimiento académico en los estudiantes de la UIS de ingeniería civil después del COVID 19?
JUSTIFICACIÓN DE LA PREGUNTA PROBLEMA
Se han expresado muchas conjeturas sobre cuál fue el impacto de la educación virtual durante la pandemia sobre el desempeño académico de los estudiantes, en todos los niveles. Pero hasta ahora dentro de la carrera de la UIS no se ha realizado un estudio al menos exploratorio, consultando directamente la percepción que tienen los estudiantes que estuvieron en las dos modalidades. De ahí la necesidad de profundizar sobre este tema y lograr tener unos elementos de juicio más o menos ciertos, para poder dar una valoración de este fenómeno.
A continuación se presenta la encuesta y se adjunta el link
Variables categoricas
Cómo fue su rendimiento académico durante la virtualidad de pandemia:
Considera que las excepciones que hizo la UIS respecto al promedio y las materias pérdidas en el periodo 2021-2 fueron:
Qué nivel se encuentra cursando:
Variables continuas
4. Su promedio acumulado actual es: (separar decimales con comas) .
5. ¿Cuántos puntos decimales ha aumentado(+#) o disminuido(-#) en su promedio acumulado post-pandemia? (separar decimales con comas)
6. ¿Cuántas materias ha perdido post pandemia?(solo números)
Se adjunta el link https://forms.gle/T4aMMUnfAj5t9nV48.
Se pretende calcular el tamaño de muestra, procedemos a realizar una prueba piloto con 7 estudiantes de ingenieria civil, obteniendo los siguientes resultados:
library(readxl)
corregidas <- read_excel("corregidas.xlsx",
sheet = "analisis")
attach(corregidas)
names(corregidas)
## [1] "v1" "v2" "v3" "v4" "v5" "v6"
library(TeachingSampling)
## Loading required package: dplyr
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Loading required package: magrittr
v_p=var(corregidas$v4)
d_p=sd(corregidas$v4)
desv_deseada=d_p/8
var_deseada=desv_deseada^2
N=1199
n=(N*v_p)/((N*var_deseada)+v_p)
n
## [1] 60.75693
DISEÑO DE MUESTREO POR EL MÉTODO DE CONGLOMERADOS
set.seed(2)
sample(1:10,3) ##entrevisto a 5,6 y 9 semestres
## [1] 5 6 9
set.seed(2)
sample(1:5,1) ##los de quinto semestre ven 5 materias aleatorizo para saber en clase de que materia los entrevisto(arrojó que los entrevisto en clase de geomática)
## [1] 5
set.seed(6)
sample(1:7,3) ##son 7 grupos y entrevistaré en el grupo 2(lunes 6-8), 5(jueves 6-8), 7(jueves 6-8) Para finalmente volver a aleatorizar y encuestar en el grupo:
## [1] 5 2 7
set.seed(2)
sample(1:3,2) ##finalmente se realizo la encuesta en el grupo 1 y 3.
## [1] 1 3
A continuación se presenta la estadistica descriptiva de cada una de las variables:
Nota
Diccionario de variables
Proceso:
Variables categoricas
## tabla de frecuencia categorica V1
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
v1=as.factor(v1)
tabla1=fdt_cat(v1,sort=TRUE)
tabla1
## Category f rf rf(%) cf cf(%)
## Regular 36 0.59 59.02 36 59.02
## Excelente 24 0.39 39.34 60 98.36
## Malo 1 0.02 1.64 61 100.00
library(fdth)
v2=as.factor(v2)
tabla2=fdt_cat(v2,sort=TRUE)
tabla2
## Category f rf rf(%) cf cf(%)
## Adecuadas 59 0.97 96.72 59 96.72
## Inadecuadas 2 0.03 3.28 61 100.00
library(fdth)
v3=as.factor(v3)
tabla3=fdt_cat(v3,sort=TRUE)
tabla3
## Category f rf rf(%) cf cf(%)
## Quinto 22 0.36 36.07 22 36.07
## Septimo 15 0.25 24.59 37 60.66
## Sexto 15 0.25 24.59 52 85.25
## Octavo 4 0.07 6.56 56 91.80
## Noveno 3 0.05 4.92 59 96.72
## Cuarto 2 0.03 3.28 61 100.00
Variables continuas
library(dplyr)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.4.0 ✔ purrr 0.3.5
## ✔ tibble 3.1.8 ✔ stringr 1.5.0
## ✔ tidyr 1.2.1 ✔ forcats 0.5.2
## ✔ readr 2.1.3
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ tidyr::extract() masks magrittr::extract()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ✖ purrr::set_names() masks magrittr::set_names()
library(moments)
Promedio_v4=mean(v4)
Promedio_v4
## [1] 3.83918
## Promedio = 3.83
Mediana_v4=median(corregidas$v4)
Mediana_v4
## [1] 3.9
### Media = 3.9
desv_v4=sd(corregidas$v4)
desv_v4
## [1] 0.2357633
## Desviacion = 0.23
varianza_v4=var(corregidas$v4)
varianza_v4
## [1] 0.05558432
## Varianza = 0.05
Cv_v4=desv_v4/Promedio_v4
Cv_v4
## [1] 0.06140979
## Coeficiente de variacion (Cv)=0.06
Ca_v4=skewness(v4)
Ca_v4
## [1] -0.5510245
## Coeficiente de asimetria (Ca)=-0.55
Curtosis_v4=kurtosis(v4)
Curtosis_v4
## [1] 3.473632
## Coeficiente de curtosis (Cc)=3.47
Histograma_v4=hist(v4, main=paste("Histograma"), xlab="Promedio",ylab="Frecuencia")
## tabla de frecuencia CONTINUA variable v5
Promedio_v5=mean(v5)
Promedio_v5
## [1] 0.004918033
## Promedio = 0.004
Mediana_v5=median(corregidas$v5)
Mediana_v5
## [1] 0.1
### Media = 0.1
desv_v5=sd(corregidas$v5)
desv_v5
## [1] 0.3068258
## desviacion = 0.3
varianza_v5=var(corregidas$v5)
varianza_v5
## [1] 0.09414208
## Varianza = 0.09
Cv_v5=desv_v5/Promedio_v5
Cv_v5
## [1] 62.38791
## Coeficiente de variacion (Cv)=0.62.38
Ca_v5=skewness(v5)
Ca_v5
## [1] -0.02579991
## Coeficiente de asimetria (Ca)=-0.02
Curtosis_v5=kurtosis(v5)
Curtosis_v5
## [1] 1.961877
## Coeficiente de curtosis (Cc)=1.9
Histograma_v5=hist(v5, main=paste("Histograma"), xlab="Promedio",ylab="Frecuencia")
## tabla de frecuencia CONTINUA variable v6
Promedio_v6=mean(v6)
Promedio_v6
## [1] 3.229508
## Promedio = 0.004
Mediana_v6=median(corregidas$v6)
Mediana_v6
## [1] 3
### Media = 0.1
desv_v6=sd(corregidas$v6)
desv_v6
## [1] 2.472471
## desviacion = 0.3
varianza_v6=var(corregidas$v6)
varianza_v6
## [1] 6.113115
## Varianza = 0.09
Cv_v6=desv_v6/Promedio_v5
Cv_v6
## [1] 502.7358
## Coeficiente de variacion (Cv)=0.62.38
Ca_v6=skewness(v6)
Ca_v6
## [1] 0.2676442
## Coeficiente de asimetria (Ca)=-0.02
Curtosis_v6=kurtosis(v6)
Curtosis_v6
## [1] 1.973708
## Coeficiente de curtosis (Cc)=1.9
Histograma_v6=hist(v6, main=paste("Histograma"), xlab="Promedio",ylab="Frecuencia")
A continuación se presenta el cruce de las variables 1 - categoricas vs categoricas
library(gmodels)
CrossTable(v1,v2,prop.chisq=FALSE,prop.r=FALSE,prop.c=FALSE,prop.t=FALSE)
##
##
## Cell Contents
## |-------------------------|
## | N |
## |-------------------------|
##
##
## Total Observations in Table: 61
##
##
## | v2
## v1 | Adecuadas | Inadecuadas | Row Total |
## -------------|-------------|-------------|-------------|
## Excelente | 24 | 0 | 24 |
## -------------|-------------|-------------|-------------|
## Malo | 1 | 0 | 1 |
## -------------|-------------|-------------|-------------|
## Regular | 34 | 2 | 36 |
## -------------|-------------|-------------|-------------|
## Column Total | 59 | 2 | 61 |
## -------------|-------------|-------------|-------------|
##
##
2 - categoricas vs categoricas
## CATEGORICA VS CATEGORICA V1 VS V3
library(gmodels)
library(moments)
CrossTable(v1,v3,prop.chisq=FALSE,prop.r=FALSE,prop.c=FALSE,prop.t=FALSE)
##
##
## Cell Contents
## |-------------------------|
## | N |
## |-------------------------|
##
##
## Total Observations in Table: 61
##
##
## | v3
## v1 | Cuarto | Noveno | Octavo | Quinto | Septimo | Sexto | Row Total |
## -------------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|
## Excelente | 1 | 1 | 3 | 11 | 3 | 5 | 24 |
## -------------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|
## Malo | 0 | 0 | 0 | 0 | 0 | 1 | 1 |
## -------------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|
## Regular | 1 | 2 | 1 | 11 | 12 | 9 | 36 |
## -------------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|
## Column Total | 2 | 3 | 4 | 22 | 15 | 15 | 61 |
## -------------|-----------|-----------|-----------|-----------|-----------|-----------|-----------|
##
##
Cruce de variables continua vs categorica
library(crosstable)
##
## Attaching package: 'crosstable'
## The following object is masked from 'package:purrr':
##
## compact
crosstable(corregidas, c(v4), by=v1) %>% as_flextable(keep_id=TRUE)
.id | label | variable | v1 | ||
|---|---|---|---|---|---|
Excelente | Malo | Regular | |||
v4 | v4 | Min / Max | 3.5 / 4.4 | 3.2 / 3.2 | 3.2 / 4.2 |
Med [IQR] | 3.9 [3.9;4.0] | 3.2 [3.2;3.2] | 3.8 [3.7;4.0] | ||
Mean (std) | 3.9 (0.2) | 3.2 (NA) | 3.8 (0.2) | ||
N (NA) | 24 (0) | 1 (0) | 36 (0) | ||
Aplicaciones de probabilidad
¿Qué probabilidad hay de 20 estudiantes, las 6 personas tengan su promedio aculumado actual en 3.5?
##PRIMERA APLICACION CON VARIABLE CONTINUA
p1=20/61
probabilidad1=dnbinom(1,3.5,p1)
probabilidad1
## [1] 0.04747584¿Qué probabilidad hay de que al tomar 7 estudiantes a lo menos 3 estudiantes hayan considerado que si fue adecuada la decision de la UIS en el periodo 2022-2?
##SEGUNDA APLICACION CON VARIABLE CATEGORICA
n=7
Nt=61
p=n/Nt
probabilidad=choose(7,3)*p^3*(1-0.098)^2
p
## [1] 0.1147541Conclusiones
Se demuestra lo importante que es para la sociedad la estadística ya que nos permite realizar cualquier estudio deseado con un objetivo claro. De acuerdo a nuestro estudio realizado según la pregunta problema se resolvió ya que pudimos descifrar cual fue el impacto que abarco la pandemia en educación superior y las consecuencias que esta proporcionó, por tanto, según los resultados obtenidos se puede recomendar la universidad que implementen mas apoyo a los estudiantes y se brinde charlas de acompañamiento a los estudiantes de ingeniería civil de la Universidad Industrial de Santander.
Referente a las variables analizadas que fueron continuas y categoricas arrojaron unos buenos datos en la encuesta las cuales nos sirvierón para el estudio de la estadistica descriptiva.
La prueba piloto obteniendo un promedio desviación y varianza deseada nos ayudó para poder seleccionar el tamaño de muestra para ponerlo en estudio que en este caso se encuestaron a 61 estudiantes de ing civil, y por consiguiente se realizo un muestreo con el metodo de conglomerados el cual nos permitio poder seleccionar en que semestre, asignatura y grupo a realiar la encuesta que anteriormente se presentan evidencias.
Al realizar la estadistica descriptiva en las variables continuas nos permite saber con la mediana que esos datos nos permite saber la pocision del 50% en el estudio, la desviación nos permitió obtener el tamaño de diferencia entre los datos, un coeficiente de variación nos ayuda para saber la medida estanderizada de disperción de la distribución de la frecuencia, el coeficiente de asimetria nos ayudó a saber el grado de distribución de probabilidad y el coefiente de curtosis es la forma de distribución de las frecuencias.
En analisis de las variables categoricas nos permitió identificar la tendencia de los estudiantes, es decir, hacia donde tiende el promedio en la mayoria de los estudiantes de ingenieria civil, las variables categoricas nos permitieron saber cual era la opinion si eran adeacuadas o inadecuadas las decisiones de las UIS con respecto a las materias perdidas en el periodo 2022-2.
Finalmente, se presenta problemas de la vida cotidiana que podemos resolver al hacer un estudio como el realizado anteriormente.