En el presente trabajo de investigación para la materia de Estadística Aplicada a la Ingeniería , se realiza una serie de encuestas para recolectar información, la cual tiene como objetivo, estudiar la dependecia del rendimiento academico de los estudiantes universitario, ente caso para la carrera de Ingniería Civil de quinto nivel, además de precisar acerca de la conformidad de los estudiantes de quinto semestre de ingeniería civil de la Uis , acerca de los diversos recursos ofrecidos por la universidad , mediante la aplicacion de un muestro por conglomerados a la poblacion, la descricpcion estadistica de las variables continuas y categoricas, ademas de dos aplicaciones de probabilidad.
¿Cómo influye los espacios y servicios que ofrece la UIS en el rendiemiento académico de los estudiantes de 5° semestro de Ingeniería Civil?
Esta pregunta problema se hizo con el fin de conocer acerca de qué tan satisfechos están los estudiantes de quinto semestre de ingeniería civil de la UIS , ya que muchos de los recursos ofrecidos por la universidad pueden influir de cierta manera con el rendimiento académico , y a partir de esta encuesta poder saber algunas de las ventajas y desventajas de estudiar en la UIS
Debido a que no se encontraron literaturas relacionadas a la temática de estudio, se procedió a realizar una prueba piloto, la cual consto de la selección de 10 personas perteneciente a la población: estudiantes de 5° semestre de Ingeniería Civil.
Conociendo que se podrian encontrar personas pertenencientes al conjunto de investigacion en la clase de Analisis Estructural (no se contaba con un marco muestral), se procedio primero a aleatorizar los conglomerados de las clases de la asignatura que se dictarian el dia martes 29 de enero de 2023, las cuales fueron 10 clases, obteniendo 2 valores al azar por si no se completaban las 10 personas en una clase.
### aleatorizacion conglomerados de las clases para no tener una muestra piloto cesgada
set.seed(1)
sample(1:10,2)
## [1] 9 4
los datos del aleatorio fueron el 9 y el 4, correspondiente a las clases E2 (martes de 10-12, Docente: Álvaro Viviescas) y O1 (martes de 10-12, Docente: Gustavo Cho).
Obtenidos Los datos de la prueba piloto, se procede a calcular la varianza y la desviación, para luego ser utilizadas en la formula del tamaño de muestreo optimo:
El tamaño de la población de estudio es N=194 (Valor obtenido de cifrasUIS, Estudiantes de Ingeniería Civil, que ingresaron en el periodo de 2020-2).
\(n=(NS^2)/((NV)+S^2)\)
en donde,
\(N=\)Población total
\(S=\)Desviación
\(V=\)Varianza deseada, especificada por los estimadores, en esta caso se eligió que debía ser 1/6 menor a la varianza de la prueba piloto)
\(V=S^2\) (relación para tener en cuenta)
Calculo del valor de Tamaño de muestra “n”
library(readxl)
cr <- read_excel("cr.xlsx")
View(cr)
attach(cr)
names(cr)
## [1] "sexo" "edad"
## [3] "financiamiento" "horas"
## [5] "dinero" "promedio"
## [7] "rendimiento" "plan de estudio"
## [9] "metodo de enseñanza" "planta fisica"
## [11] "bienestar universitario" "biblioteca"
## [13] "tutorias" "hermanos"
library(TeachingSampling)
## Warning: package 'TeachingSampling' was built under R version 4.2.2
## Loading required package: dplyr
## Warning: package 'dplyr' was built under R version 4.2.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Loading required package: magrittr
###cálculo de la varianza, con una prueba piloto -S.SI- utilizar semilla (replicabilidad-fijar el número piloto)
v_p=var(cr$horas)
d_p=sd(cr$horas)
desv_deseada=d_p/6
var_deseada=desv_deseada^2
N=194
n=(N*v_p)/((N*var_deseada)+v_p)
message("EL TAMAÑO DE MUESTRA ES:", n)
## EL TAMAÑO DE MUESTRA ES:30.3652173913043
Después de hallar, el tamaño de la muestra para aplicar la encuesta, y adecuada las preguntas gracias a la prueba piloto, se procede a realizar la encuesta a 30 estudiantes de Ingeniería Civil de quinto semestre, al no poseer un marco muestral, se optó por un diseño de muestreo por conglomerados, en los que a partir de un aleatorización de clases únicas para estudiantes del quinto nivel académico, como caracterización de materiales, mecánica de fluidos, estadística, análisis estructural y Geomática, que en total suman 44 clases, se aleatorizan y se escogen 6 grupos los cuales se proceden a censar.
library(readxl)
asignaturas_aleatorias <- read_excel("asignaturas aleatorias.xlsx")
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
View(asignaturas_aleatorias)
###valores aleatorizados guardados por una semilla en codigo R Set.seed(2)
S.SI(nrow(asignaturas_aleatorias),6)
## [,1]
## [1,] 0
## [2,] 0
## [3,] 0
## [4,] 0
## [5,] 0
## [6,] 0
## [7,] 0
## [8,] 8
## [9,] 0
## [10,] 0
## [11,] 0
## [12,] 0
## [13,] 0
## [14,] 0
## [15,] 0
## [16,] 0
## [17,] 0
## [18,] 0
## [19,] 0
## [20,] 0
## [21,] 0
## [22,] 22
## [23,] 0
## [24,] 0
## [25,] 25
## [26,] 0
## [27,] 0
## [28,] 0
## [29,] 0
## [30,] 0
## [31,] 0
## [32,] 32
## [33,] 0
## [34,] 0
## [35,] 0
## [36,] 36
## [37,] 0
## [38,] 0
## [39,] 0
## [40,] 0
## [41,] 0
## [42,] 0
## [43,] 0
## [44,] 0
## [45,] 45
las clases obtenidas a través de la aleatorización de conglomerados fueron muestreo2=(8,22,25,32,36,44), respectivamente caracterización de materiales L3, estadística B1, geomática D1, caracterización de materiales D1, mecánica de Fluidos H3; los horarios de estas clases se obtuvieron de la pagina de asignaturas programadas de la Universidad.
Obtenidos los 30 datos del muestreo, procedemos a descargar del Google Forms el Excel con las respuesta a cada una de las preguntas de los estudiantes de ingeniería civil censados. A continuación, se representa la clasificaron de variables en continuas y categóricas.
library(readxl)
Encuesta <- read_excel("Encuesta.xlsx")
View(Encuesta)
attach(Encuesta)
## The following object is masked from cr:
##
## planta fisica
names(Encuesta)
## [1] "Código Estudiantil" "Sexo" "Edad"
## [4] "Financiamiento" "Horas" "Dinero"
## [7] "Promedio" "Rendimiento" "Plan de Estudio"
## [10] "Docentes" "planta fisica" "Servicios Bienestar"
## [13] "Biblioteca" "Tutorias" "Hermanos"
library(fdth)
## Warning: package 'fdth' was built under R version 4.2.2
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
###Continuas: Edad, Horas, Dinero, Promedio, Metodos de enseñanza, Planta fC-sica, Servicios Bienestar y TutorC-as
class(Edad)
## [1] "numeric"
class(Horas)
## [1] "numeric"
class(Dinero)
## [1] "numeric"
class(Promedio)
## [1] "numeric"
class(Docentes)
## [1] "numeric"
class(`planta fisica`)
## [1] "numeric"
class(`Servicios Bienestar`)
## [1] "numeric"
class(Tutorias)
## [1] "numeric"
###Categoricas: Sexo, Financiamiento, Rendimiento, Plan de Estudio,Biblioteca y Hermanos
class(Sexo)
## [1] "character"
class(Financiamiento)
## [1] "character"
class(Rendimiento)
## [1] "character"
class(`Plan de Estudio`)
## [1] "character"
class(Biblioteca)
## [1] "character"
class(Hermanos)
## [1] "character"
Para la estadística descriptiva se procede a calcular únicamente la moda a las variables categorías a través del paquete moodest, activado desde R. En cambio, a las variables continuas se pueden hallar la mediana o promedio, la moda, la varianza, la variación el coeficiente de variación.
En este informe cabe mencionar, que no se vio necesario el calculo de las medidas de forma (coeficiente de asimetría, curtosis y correlación) debido a que no se cuentan con varios datos y las tendencias para cada una de la variables se pueden apreciar en las tabla de frecuencia.
##ESTADISTICA DESCRIPTIVA
###CATEGORICA #1-Financiamiento
MODA1=mfv(Encuesta$Financiamiento,na.rm = T)##moda
message("LA MODA ES: ",MODA1 )
## LA MODA ES: Padres y/o parientes
###CATEGORICA #2-Sexo
MODA2=mfv(Encuesta$Sexo,na.rm = T)##moda
message("LA MODA ES: ",MODA2 )
## LA MODA ES: Hombre
###CATEGORICA #3-Rendimiento
MODA3=mfv(Encuesta$Rendimiento,na.rm = T)##moda
message("LA MODA ES: ",MODA3 )
## LA MODA ES: Regular
###CATEGORICA #4-Plan de Estudio
MODA4=mfv(Encuesta$`Plan de Estudio`,na.rm = T)##moda
message("LA MODA ES: ",MODA4 )
## LA MODA ES: Sobresaliente
###CATEGORICA #5-Biblioteca
MODA5=mfv(Encuesta$Biblioteca,na.rm = T)##moda
message("LA MODA ES: ",MODA5 )
## LA MODA ES: Si
###CATEGORICA #6-Hermanos
MODA6=mfv(Encuesta$Hermanos,na.rm = T)##moda
message("LA MODA ES: ",MODA5 )
## LA MODA ES: Si
Para las variables categóricas la tendencia de los encuestados fue la siguiente:
la mayoría de los encuestados fueron hombres.
El financiamiento para asistir a la universidad corre en mayoría por ayudas económica de los padres o un pariente,
El rendimiento académico de este semestre 2022-2 fue regular y el plan de estudio fue categorizado como sobresaliente, además los estudiantes consideran que los recursos de biblioteca son fáciles de utilizar y en gran medida estudiar en la universidad los hace acreedores de beneficios a nivel social.
###CONTINUA #1-Edad
summary(Encuesta$Edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 19.00 20.00 19.73 20.00 23.00
varianza1=var(Encuesta$Edad,na.rm = T)##VARIANZA
desviacion1=sqrt(varianza1)##DESVIACION
promedio1=mean(Encuesta$Edad,na.rm = T)
cv1=desviacion1/promedio1 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza1)
## LA VARIANZA ES: 1.16781609195402
message("EL COEFICIENTE DE VARIACION ES: ", cv1)
## EL COEFICIENTE DE VARIACION ES: 0.0547629425301668
message("LA DESVIACION ES: ",desviacion1 )
## LA DESVIACION ES: 1.08065539926196
message("LA PROMEDIO ES: ",promedio1)
## LA PROMEDIO ES: 19.7333333333333
###CONTINUA #2-Horas
summary(Encuesta$Horas)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.00 7.25 8.00 8.20 10.00 12.00
varianza2=var(Encuesta$Horas,na.rm = T)##VARIANZA
desviacion2=sqrt(varianza2)##DESVIACION
promedio2=mean(Encuesta$Horas,na.rm = T)
cv2=desviacion2/promedio2 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza2)
## LA VARIANZA ES: 5.2
message("EL COEFICIENTE DE VARIACION ES: ", cv2)
## EL COEFICIENTE DE VARIACION ES: 0.278091567097351
message("LA DESVIACION ES: ",desviacion2 )
## LA DESVIACION ES: 2.28035085019828
###CONTINUA #3-Dinero
summary(Encuesta$Dinero)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1500 5000 9500 10233 14250 30000
varianza3=var(Encuesta$Dinero,na.rm = T)##VARIANZA
desviacion3=sqrt(varianza3)##DESVIACION
promedio3=mean(Encuesta$Dinero,na.rm = T)
cv3=desviacion3/promedio3 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza3)
## LA VARIANZA ES: 50960919.5402299
message("EL COEFICIENTE DE VARIACION ES: ", cv3)
## EL COEFICIENTE DE VARIACION ES: 0.697592025214502
message("LA DESVIACION ES: ",desviacion3 )
## LA DESVIACION ES: 7138.69172469507
###CONTINUA #4-Promedio
summary(Encuesta$Promedio)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.600 3.763 3.900 3.883 4.000 4.300
varianza4=var(Encuesta$Promedio,na.rm = T)##VARIANZA
desviacion4=sqrt(varianza4)##DESVIACION
promedio4=mean(Encuesta$Promedio,na.rm = T)
cv4=desviacion4/promedio4 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza4)
## LA VARIANZA ES: 0.0310781609195402
message("EL COEFICIENTE DE VARIACION ES: ", cv4)
## EL COEFICIENTE DE VARIACION ES: 0.0453965642007209
message("LA DESVIACION ES: ",desviacion4)
## LA DESVIACION ES: 0.176289990979466
###CONTINUA #5-Docentes
summary(Encuesta$Docentes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 5.25 7.50 6.70 8.00 9.00
varianza5=var(Encuesta$Docentes,na.rm = T)##VARIANZA
desviacion5=sqrt(varianza5)##DESVIACION
promedio5=mean(Encuesta$Docentes,na.rm = T)
cv5=desviacion5/promedio5 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza5)
## LA VARIANZA ES: 3.73448275862069
message("EL COEFICIENTE DE VARIACION ES: ", cv5)
## EL COEFICIENTE DE VARIACION ES: 0.288429997808852
message("LA DESVIACION ES: ",desviacion5 )
## LA DESVIACION ES: 1.93248098531931
###CONTINUA #6-Planta fisica
summary(Encuesta$`planta fisica`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 7.000 8.000 7.767 9.000 10.000
varianza6=var(Encuesta$`planta fisica`,na.rm = T)##VARIANZA
desviacion6=sqrt(varianza6)##DESVIACION
promedio6=mean(Encuesta$`planta fisica`,na.rm = T)
cv6=desviacion6/promedio6 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza6)
## LA VARIANZA ES: 2.66781609195402
message("EL COEFICIENTE DE VARIACION ES: ", cv6)
## EL COEFICIENTE DE VARIACION ES: 0.210301939328844
message("LA DESVIACION ES: ",desviacion6 )
## LA DESVIACION ES: 1.63334506212068
###CONTINUA #7-Servicios Bienestar
summary(Encuesta$`Servicios Bienestar`)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.0 6.0 7.5 7.1 9.0 10.0
varianza7=var(Encuesta$`Servicios Bienestar`,na.rm = T)##VARIANZA
desviacion7=sqrt(varianza7)##DESVIACION
promedio7=mean(Encuesta$`Servicios Bienestar`,na.rm = T)
cv7=desviacion7/promedio7 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza7)
## LA VARIANZA ES: 4.78275862068966
message("EL COEFICIENTE DE VARIACION ES: ", cv7)
## EL COEFICIENTE DE VARIACION ES: 0.308021394616595
message("LA DESVIACION ES: ",desviacion7 )
## LA DESVIACION ES: 2.18695190177783
###CONTINUA #8-Tutorias
summary(Encuesta$Tutorias)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.0 5.0 6.0 6.2 8.0 10.0
varianza8=var(Encuesta$Tutorias,na.rm = T)##VARIANZA
desviacion8=sqrt(varianza8)##DESVIACION
promedio8=mean(Encuesta$Tutorias,na.rm = T)
cv8=desviacion8/promedio8 ##COEFICIENTE DE VARIACION
message("LA VARIANZA ES: ", varianza8)
## LA VARIANZA ES: 4.23448275862069
message("EL COEFICIENTE DE VARIACION ES: ", cv8)
## EL COEFICIENTE DE VARIACION ES: 0.331900949589976
message("LA DESVIACION ES: ",desviacion8 )
## LA DESVIACION ES: 2.05778588745785
La estadística descriptiva para las variables continuas es la siguiente:
En la variable Edad de los encuestados la media fue de 20 años, el coeficiente de variación es cercano al cero, interpretándose que los datos no están separados entre si como indica la desviación de 1.08.
la media de las horas promedio que pasa un alumno en la universidad es de 8 horas, se presenta una desviación de 2.28.
La media del dinero que gasta un estudiante dentro de la universidad es de $9500 pesos, es la variable que mayor desviación presenta de la variables continuas, d_s= 7138.69.
Para los datos de promedio ponderado de cada uno de los encuestado la mediana es 3.88, el rango de esta variable se encuentra desde 3.60 a 4.30.
ahora para las preguntas de gradiente de satisfacción, siendo 1 insatisfecho y 10 satisfecho, los resultados fueron los siguientes:
En la variable docentes, satisfacción con respecto a la metodología impartida por los profesores la media es de alrededor de 7.5. Para la pregunta ¿Cómo calificaría la planta física de la Universidad, aulas, centros de estudio, lugares de esparcimiento, entre otros? la mediana de los 30 encuestados fue de 8 en la escala. En la pregunta ¿Cómo calificaría los diferentes servicios que presta Bienestar Universitario? el promedio de grado de satisfacción fue de 7 y de acuerdo con calificaría las tutorías impartidas por los estudiantes del programa sea midas, se obtuvo un 6, la menor media entre las variables de investigación.
##TABLA DE FRECUENCIA (VARIABLES CATEGORICAS)
library(readxl)
Encuesta <- read_excel("Encuesta.xlsx")
View(Encuesta)
attach(Encuesta)
## The following objects are masked from Encuesta (pos = 4):
##
## Biblioteca, Código Estudiantil, Dinero, Docentes, Edad,
## Financiamiento, Hermanos, Horas, Plan de Estudio, planta fisica,
## Promedio, Rendimiento, Servicios Bienestar, Sexo, Tutorias
## The following object is masked from cr:
##
## planta fisica
names(Encuesta)
## [1] "Código Estudiantil" "Sexo" "Edad"
## [4] "Financiamiento" "Horas" "Dinero"
## [7] "Promedio" "Rendimiento" "Plan de Estudio"
## [10] "Docentes" "planta fisica" "Servicios Bienestar"
## [13] "Biblioteca" "Tutorias" "Hermanos"
library(dplyr)
tabla_Financiamiento=fdt_cat(Encuesta$Financiamiento,sort=T,na.rm=T)
tabla_Financiamiento
## Category f rf rf(%) cf cf(%)
## Padres y/o parientes 14 0.47 46.67 14 46.67
## Beca patrocinada por el gobierno 8 0.27 26.67 22 73.33
## Matricula Cero 8 0.27 26.67 30 100.00
tabla_Sexo=fdt_cat(Encuesta$Sexo,sort=T,na.rm=T)
tabla_Sexo
## Category f rf rf(%) cf cf(%)
## Hombre 18 0.6 60 18 60
## Mujer 12 0.4 40 30 100
tabla_Rendiemiento=fdt_cat(Encuesta$Rendimiento,sort=T,na.rm=T)
tabla_Rendiemiento
## Category f rf rf(%) cf cf(%)
## Regular 19 0.63 63.33 19 63.33
## Bueno 8 0.27 26.67 27 90.00
## Malo 3 0.10 10.00 30 100.00
tabla_Plan_de_Estudio=fdt_cat(Encuesta$`Plan de Estudio`,sort=T,na.rm=T)
tabla_Plan_de_Estudio
## Category f rf rf(%) cf cf(%)
## Sobresaliente 17 0.57 56.67 17 56.67
## Excelente 8 0.27 26.67 25 83.33
## básico 5 0.17 16.67 30 100.00
tabla_Biblioteca=fdt_cat(Encuesta$Biblioteca,sort=T,na.rm=T)
tabla_Biblioteca
## Category f rf rf(%) cf cf(%)
## Si 24 0.8 80 24 80
## No 6 0.2 20 30 100
tabla_Hermanos=fdt_cat(Encuesta$Hermanos,sort=T,na.rm=T)
tabla_Hermanos
## Category f rf rf(%) cf cf(%)
## Si 25 0.83 83.33 25 83.33
## No 5 0.17 16.67 30 100.00
##TABLA DE FRECUENCIA (VARIABLES CONTINUAS)
###Continuas: Edad, Horas, Dinero, Promedio, Docentes, Servicios Bienestar, Biblioteca y Tutorias
tabla_Edad=fdt(Encuesta$Edad,h=1,start = 17,end =23,right =T)
tabla_Edad
## Class limits f rf rf(%) cf cf(%)
## (17,18] 3 0.10 10.00 3 10.00
## (18,19] 10 0.33 33.33 13 43.33
## (19,20] 11 0.37 36.67 24 80.00
## (20,21] 5 0.17 16.67 29 96.67
## (21,22] 0 0.00 0.00 29 96.67
## (22,23] 1 0.03 3.33 30 100.00
tabla_Horas=fdt(Encuesta$Horas,h=2,start = 2,end =12,right =T)
tabla_Horas
## Class limits f rf rf(%) cf cf(%)
## (2,4] 1 0.03 3.33 1 3.33
## (4,6] 4 0.13 13.33 5 16.67
## (6,8] 13 0.43 43.33 18 60.00
## (8,10] 8 0.27 26.67 26 86.67
## (10,12] 3 0.10 10.00 29 96.67
tabla_Dinero=fdt(Encuesta$Dinero,h=5000,start = 1500,end =30000,right =T)
tabla_Dinero
## Class limits f rf rf(%) cf cf(%)
## (1500,6500] 12 0.40 40.00 12 40.00
## (6500,11500] 7 0.23 23.33 19 63.33
## (11500,16500] 5 0.17 16.67 24 80.00
## (16500,21500] 3 0.10 10.00 27 90.00
## (21500,26500] 1 0.03 3.33 28 93.33
tabla_Promedio=fdt(Encuesta$Promedio,h=0.2,start = 3.6,end =4.3,right =T)
tabla_Promedio
## Class limits f rf rf(%) cf cf(%)
## (3.6,3.8] 8 0.27 26.67 8 26.67
## (3.8,4] 13 0.43 43.33 21 70.00
## (4,4.2] 5 0.17 16.67 26 86.67
tabla_planta_fisica=fdt(Encuesta$`planta fisica`, h=1, start = 1, end = 10, right = T)
tabla_planta_fisica
## Class limits f rf rf(%) cf cf(%)
## (1,2] 0 0.00 0.00 0 0.00
## (2,3] 1 0.03 3.33 1 3.33
## (3,4] 1 0.03 3.33 2 6.67
## (4,5] 0 0.00 0.00 2 6.67
## (5,6] 3 0.10 10.00 5 16.67
## (6,7] 6 0.20 20.00 11 36.67
## (7,8] 8 0.27 26.67 19 63.33
## (8,9] 8 0.27 26.67 27 90.00
## (9,10] 3 0.10 10.00 30 100.00
tabla_Docentes=fdt(Encuesta$Docentes, h=1, start = 1, end = 10, right = T)
tabla_Docentes
## Class limits f rf rf(%) cf cf(%)
## (1,2] 0 0.00 0.00 0 0.00
## (2,3] 0 0.00 0.00 0 0.00
## (3,4] 5 0.17 16.67 5 16.67
## (4,5] 2 0.07 6.67 7 23.33
## (5,6] 1 0.03 3.33 8 26.67
## (6,7] 6 0.20 20.00 14 46.67
## (7,8] 13 0.43 43.33 27 90.00
## (8,9] 2 0.07 6.67 29 96.67
## (9,10] 0 0.00 0.00 29 96.67
tabla_Servicios_Bienestar=fdt(Encuesta$`Servicios Bienestar`,h=1,start = 1,end =10,right =T)
tabla_Servicios_Bienestar
## Class limits f rf rf(%) cf cf(%)
## (1,2] 2 0.07 6.67 2 6.67
## (2,3] 0 0.00 0.00 2 6.67
## (3,4] 2 0.07 6.67 4 13.33
## (4,5] 1 0.03 3.33 5 16.67
## (5,6] 7 0.23 23.33 12 40.00
## (6,7] 3 0.10 10.00 15 50.00
## (7,8] 5 0.17 16.67 20 66.67
## (8,9] 7 0.23 23.33 27 90.00
## (9,10] 3 0.10 10.00 30 100.00
tabla_Tutorias=fdt(Encuesta$Tutorias,h=1,start = 1,end =10,right =T)
tabla_Tutorias
## Class limits f rf rf(%) cf cf(%)
## (1,2] 1 0.03 3.33 1 3.33
## (2,3] 1 0.03 3.33 2 6.67
## (3,4] 4 0.13 13.33 6 20.00
## (4,5] 7 0.23 23.33 13 43.33
## (5,6] 4 0.13 13.33 17 56.67
## (6,7] 4 0.13 13.33 21 70.00
## (7,8] 6 0.20 20.00 27 90.00
## (8,9] 0 0.00 0.00 27 90.00
## (9,10] 3 0.10 10.00 30 100.00
teniendo en cuenta las tablas de la seccion 2.2 para variables continuas y categoricas se procede a realizar sus respectivos gráficos de barras.
###Gráficos variables categoricas
plot(tabla_Financiamiento, main= "Gráfico de Barras Financiamiento" , ylab= "frecuencia", xlab= "Tipo de financiamiento", col=rainbow(3))
plot(tabla_Sexo, main= "Gráfico de Barras Sexo" , ylab= "frecuencia", xlab= "sexo ", col=rainbow(2))
plot(tabla_Rendiemiento, main= "Gráfico de Barras Rendeimiento" , ylab= "frecuencia", xlab= "Rendimiento académico ", col=c("yellow", "green", "red"))
plot(tabla_Plan_de_Estudio, main= "Gráfico de Barras Plan de Estudio" , ylab= "frecuencia", xlab= "calificación del plan de estudio", col=c("yellow", "green", "red"))
plot(tabla_Biblioteca, main= "Gráfico de Barras Servivio de Biblioteca" , ylab= "frecuencia", xlab= "respueta dicotómica", col=c("green", "red"))
plot(tabla_Hermanos, main= "Gráfico de Barras Hermanos" , ylab= "frecuencia", xlab= "respueta dicotómica", col=c("green", "red"))
###Gráficos variables continuas
plot(tabla_Edad, main= "Gráfico de Barras Edades" , ylab= "frecuencia", xlab= "rango de edades ", col=c("lightgreen", "turquoise", "purple", "darkorange", "red", "yellow"))
plot(tabla_Horas, main= "Gráfico de Barras Horas" , ylab= "frecuencia", xlab= "Horas que pasa en la Universidad ", col=c("plum","royalblue","salmon","springgreen","gold","deeppink"))
plot(tabla_Dinero, main= "Gráfico de Barras Dinero" , ylab= "frecuencia", xlab= "Promedio de gasto de Dinero", col=c("cyan","gold","green","orange","coral", "purple"))
plot(tabla_Promedio, main= "Gráfico de Barras Promedio" , ylab= "frecuencia", xlab= "Promedios ponderados ", col=c("deepskyblue", "red", "orange","magenta"))
plot(tabla_Docentes, main= "Gráfico de Barras Satisfacción Docente" , ylab= "frecuencia", xlab= "Escala de Satisfacción", col=c( "yellow", "green", "darkorchid","red","blue1","darkorange","brown2","olivedrab1","lightpink","cyan2"))
plot(tabla_planta_fisica, main= "Gráfico de Barras Satisfacción Planta Física" , ylab= "frecuencia", xlab= "Escala de Satisfacción", col=c("gold", "green", "orchid","red2","blue1","orange2","brown2","magenta","lightpink","deeppink"))
plot(tabla_Servicios_Bienestar, main= "Gráfico de Barras Satisfacción Servicios Bienestar" , ylab= "frecuencia", xlab= "Escala de Satisfacción", col=c("blue", "green", "orange", "deeppink", "aquamarine2","chocolate","firebrick1","royalblue","palegreen","mediumpurple"))
plot(tabla_Tutorias, main= "Gráfico de Barras Satisfacción Tutorías" , ylab= "frecuencia", xlab= "Escala de Satisfacción", col=c("blue", "gold", "green", "red1","cyan","magenta","Khaki","lightblue","hotpink","coral"))
De acuerdo con la guía del proyecto se procede hacer dos relaciones estadísticas entre variables categóricas y una entre categórica y continua.
la relación de la variable continua vs categórica, se planteó: ¿de acuerdo al sexo como son los resultados de promedio ponderado de los estudiantes de quinto semestre de ingeniería civil?
las relaciones categórica vs categórica, escogidas fueron: ¿cuál es la relación entre la variable sexo y el promedio?, ¿cómo es la relación de financiamiento universitario y el género de los encuestados?, además de conocer si entre hombres o mujeres ¿cómo fue su rendimiento académico este semestre 2022-2?
Información para la estadística cruce de variables
Numero total de hombres encuestados: 18
Numero total de mujeres encuestadas: 12
##CONTINUA VS CATEGORICA (Sexo vs Promedio)
library(crosstable)
## Warning: package 'crosstable' was built under R version 4.2.2
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.2
library(dplyr)
crosstable(Encuesta, c(Promedio), by= Sexo) %>% as_flextable(keep_id=TRUE)
.id | label | variable | Sexo | |
|---|---|---|---|---|
Hombre | Mujer | |||
Promedio | Promedio | Min / Max | 3.6 / 4.3 | 3.6 / 4.2 |
Med [IQR] | 4.0 [3.8;4.0] | 3.8 [3.7;3.9] | ||
Mean (std) | 3.9 (0.2) | 3.9 (0.2) | ||
N (NA) | 18 (0) | 12 (0) | ||
Podemos notar que para esta relación de una variable categórica como el “sexo” y una continua como es el “promedio” notamos que en los hombres de quinto semestre de Ingeniería Civil la media del promedio ponderado es mayor que el de las mujeres así mismo, el valor máximo es alcanzado por los hombres con un valor de 4.3
##CATEGORICA VS CATEGORICA (Sexo vs Financiamineto) y (Sexo vs Rendimiento)
###CrossTable Sexo vs Financiamiento
table(Encuesta$Financiamiento,Encuesta$Sexo)
##
## Hombre Mujer
## Beca patrocinada por el gobierno 5 3
## Matricula Cero 4 4
## Padres y/o parientes 9 5
library(gmodels)
## Warning: package 'gmodels' was built under R version 4.2.2
CrossTable(Encuesta$Sexo,Encuesta$Financiamiento)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | Chi-square contribution |
## | N / Row Total |
## | N / Col Total |
## | N / Table Total |
## |-------------------------|
##
##
## Total Observations in Table: 30
##
##
## | Encuesta$Financiamiento
## Encuesta$Sexo | Beca patrocinada por el gobierno | Matricula Cero | Padres y/o parientes | Row Total |
## --------------|----------------------------------|----------------------------------|----------------------------------|----------------------------------|
## Hombre | 5 | 4 | 9 | 18 |
## | 0.008 | 0.133 | 0.043 | |
## | 0.278 | 0.222 | 0.500 | 0.600 |
## | 0.625 | 0.500 | 0.643 | |
## | 0.167 | 0.133 | 0.300 | |
## --------------|----------------------------------|----------------------------------|----------------------------------|----------------------------------|
## Mujer | 3 | 4 | 5 | 12 |
## | 0.013 | 0.200 | 0.064 | |
## | 0.250 | 0.333 | 0.417 | 0.400 |
## | 0.375 | 0.500 | 0.357 | |
## | 0.100 | 0.133 | 0.167 | |
## --------------|----------------------------------|----------------------------------|----------------------------------|----------------------------------|
## Column Total | 8 | 8 | 14 | 30 |
## | 0.267 | 0.267 | 0.467 | |
## --------------|----------------------------------|----------------------------------|----------------------------------|----------------------------------|
##
##
###alternativa crosstable
library(crosstable)
library(flextable)
library(dplyr)
crosstable(Encuesta, c(Sexo), by= Financiamiento) %>% as_flextable(keep_id=TRUE)
.id | label | variable | Financiamiento | ||
|---|---|---|---|---|---|
Beca patrocinada por el gobierno | Matricula Cero | Padres y/o parientes | |||
Sexo | Sexo | Hombre | 5 (27.78%) | 4 (22.22%) | 9 (50.00%) |
Mujer | 3 (25.00%) | 4 (33.33%) | 5 (41.67%) | ||
table(Encuesta$Rendimiento,Encuesta$Sexo)
##
## Hombre Mujer
## Bueno 5 3
## Malo 2 1
## Regular 11 8
library(gmodels)
###CrossTable Sexo vs Rendimiento
library(crosstable)
library(flextable)
library(dplyr)
crosstable(Encuesta, c(Sexo), by= Rendimiento) %>% as_flextable(keep_id=TRUE)
.id | label | variable | Rendimiento | ||
|---|---|---|---|---|---|
Bueno | Malo | Regular | |||
Sexo | Sexo | Hombre | 5 (27.78%) | 2 (11.11%) | 11 (61.11%) |
Mujer | 3 (25.00%) | 1 (8.33%) | 8 (66.67%) | ||
ahora en el cruce bivariado de categórica vs categórica, se trabajaron 2 casos, el primero una relación entre la variable sexo vs el financiamiento y el sexo de los encuestados vs el rendimiento académico. En la primera relación podemos notar que en los hombres el 50% su financiamiento es dirigido por padres y/o parientes, la otra mitad esta seccionada en un 27,78% beca patrocinada por el gobierno a y el 22,22% matricula cero, en las mujeres, sigue la misma tendencia siendo el financiamiento de los encuestados por parte de los parientes tutores con un 41,67%, seguido por matricula cero con un 33,33% y beca patrocinada por el gobierno 25%.
En la estadística descriptiva de las variables sexo y rendimiento académico, tanto en los hombres y las mujeres consideran que en el semestre 2022-2 su desempeño fue regular, siendo un un 66,67% para las mujeres y 61,11% para los hombres.
finalizada la estadistica descriptiva de las variables de estudio, se requieren tener dos aplicaciones de probabilidad de acuerdo a los datos de la encuesta, para ello se formularon los siguientes cuestionamientos.
Datos para tener en cuenta:
Numero de Hombres: 18 Numero de Mujeres: 12 Total de Encuestados:30
Notacion de Combinación: \(nCk=\frac{(n!)}{((n-k)!*(k!))}\)
\(probabilidad_1=\frac{(18C1)(12C1)+(18C2)(12C0)+(18C0)(12C2)}{(30C2)}=\frac{18+12+153+1+166}{435}=0,5770\)
\(probabilidad_2=\frac{(8C2)(22C1)+(8C1)(22C2)+(8C3)(22C0)+(8C0)(22C3)}{(30C3)} =\frac{28+22+8+231+56+1+1+1540}{4060}=0,4635\)
El plan de estudios, métodos de enseñanza, las instalaciones y servicios universitarios, juegan un parte importante en el desempeño académico de los estudiantes de 5 semestre de ingería civil. Los resultados de la encuestan indican que en parte, los servicios ofertados por bienestar, y los espacio como los salones y centros de estudio presentan un grado de satisfacción sobresaliente por encima del 7, en cambio en las asignaciones académicas, metodología docente y tutorías presenta algunos valores inferiores a 5. La UIS debe seguir en su camino de mejorar para poder garantizar a sus estudiantes una formación integral a sus ingresados en todos los niveles de estudio.
En conclusión, con la investigación se puede notar que los estudiantes de quinto semestre de ingeniería civil , la mayoría sienten que en este semestre 2022-2 su rendimiento académico ha sido regular siendo esta una de nuestras variables categóricas , además se puede notar qué en la encuesta realizada hay más hombres que mujeres de los que contestaron , para finalizar la mayoría de los estudiantes recomiendan la universidad por su alto estándar
##Referencias
Code Chunks. (s.f.). https://rmarkdown.rstudio.com/lesson-3.html
Coder, R. (2020, 30 agosto). Gráfico de barras en R. R CODER. https://r-coder.com/grafico-barras-r/
Paredes-Ayrac, D. (2019). Estrategias cognitivas, metacognitivas y rendimiento académico de estudiantes de ingeniería de la Universidad Nacional Santiago Antúnez de Mayolo, Perú. Sciendo, 22(4), 307-314.
González, C., & Guadalupe, E. (2017). Factores que inciden en el rendimiento académico de los estudiantes de la Universidad Politécnica del Valle de Toluca.