El presente trabajo busca identificar los distintos medios de transporte que emplean los estudiantes de Ingeniería Civil (Sede Bucaramanaga) para desplazarse hasta la Universiddad Industrial de Santander y los distintos factores que intervienen (Dinero, tiempo, comodidad, rendimiento académico,etc.). Así mismo, se plantearán distintos análisis entre los factores ya mencionados para identificar ciertas relaciones y comportamientos de las variables involucradas.
El presente documento tuvo como apoyo el software R y siguio la siguiente linea de acción para su respectivo desarrollo:
En primera instancia, se estableció un tema (Medio de transporte de los estudiantes de la Universidad Industrial de Santander) y continuamente se elaboró una encuesta con variables continuas y categóricas.
Seguidamente se realizo una prueba piloto de 10 encuestas con el propósito de encontrar la muestra de la población, para este calculo se tuvo en cuenta las respuestas de la variable continua que engloba la pregunta:¿Cuánto tiempo le toma llegar a la Universidad UIS? (Escriba su cifra en minutos, ejemplo:“55”). Cabe mencionar que la población escogida fue la escuela de Ingenieria Civil la cual en el momento de encuestar tenia un total de 1271 estudiantes matriculados en la sede de Bucaramanga (N=1271). Link encuesta piloto: https://1drv.ms/x/s!AuTva1k5e39jgUzRPMM6NB7hWBVc?e=uO7tdC
library(readxl)
encuestapiloto <- read_excel("encuestapiloto.xlsx")
View(encuestapiloto)
colnames(encuestapiloto)=c("P1", "P2", "P3", "P4", "P5",
"P6", "P7", "P8","P9",
"P10","P11","P12")
attach(encuestapiloto)
names(encuestapiloto)
## [1] "P1" "P2" "P3" "P4" "P5" "P6" "P7" "P8" "P9" "P10" "P11" "P12"
N=1271
var_piloto=var(encuestapiloto$P10)
desv_piloto=sd(encuestapiloto$P10)
desv_deseada=desv_piloto/8
var_deseada=desv_deseada^2
n=(N*var_piloto)/((N*var_deseada)+var_piloto)
muestra=n
muestra
## [1] 60.93184
Como se puede observar se obtuvo una muestra n=60.93184, la cual podriamos aproximar a un n=61 personas a encuestar.
En tercer lugar se realizó un muestreo con el fin de escoger a que grupo o personas se les deberia hacer la encuesta. Para ello, se empleo ciertas aleatorizaciones simples para reducir el tamaño de la poblacion(cabe recordar que todas las aleatorizaciones se hicieron en base a la escuela de Ingeniería Civil). * Primero se hizo una aleatorización para escoger un semetre (1 semestre a 10 semestre).
set.seed(8)
semestre=sample(1:10,1)
semestre
## [1] 4
Se obtuvo el semestre 4.
vector_materia=c("Mecánica de Sólidos", "Geología para Ingenieros", "Métodos Numéricos")
set.seed(1)
materia=sample(vector_materia,1)
materia
## [1] "Mecánica de Sólidos"
Materia = Mecánica de Sólidos.
vector_grupos=c("Profesor Cotes","Profesor Benjumea")
set.seed(9)
grupos=sample(vector_grupos,1)
grupos
## [1] "Profesor Cotes"
grupos = Profesor Cotes.
Por último, despues de plantear la prueba piloto, encontrar la muestra y definir la población a encuestar; se procede a realizar la encuesta a la muestra poblacional y el respectivo análisis de datos.
Se efectuó la encuesta a la muestra seleccionada y en R se redifinio el nombre de las columnas de la encuesta para facilitar el desarrollo del código (tambien se puede definir que variable es categórica o numérica a la hora de importar las respuestas de la encuesta a R). Link encuesta muestra: https://1drv.ms/x/s!AuTva1k5e39jgVZIRDA6U4a-eKJP?e=h37vAN
library(readxl)
encuestamuestra <- read_excel("encuestamuestra.xlsx",
col_types = c("numeric", "text", "text",
"numeric", "numeric", "numeric",
"text", "text", "text", "numeric",
"numeric", "numeric"))
View(encuestamuestra)
colnames(encuestamuestra)=c("Fecha", "Correo", "Sexo", "Edad", "PromedioAcumulado",
"Estrato", "TransportePersonal", "AgradoTransporte",
"TransporteUniversidad", "TiempollegadaUIS",
"DineroMesTransporte",
"TransporteyRendimientoAcademico")
attach(encuestamuestra)
names(encuestamuestra)
## [1] "Fecha" "Correo"
## [3] "Sexo" "Edad"
## [5] "PromedioAcumulado" "Estrato"
## [7] "TransportePersonal" "AgradoTransporte"
## [9] "TransporteUniversidad" "TiempollegadaUIS"
## [11] "DineroMesTransporte" "TransporteyRendimientoAcademico"
Para facilidades del análisis se seleccionaron tres variables cuantitativas y tres variables categóricas, a cada una de estas se les realizará su respectivo análisis.
Esta variable es “TiempollegadaUIS”, dicha variable encierra la pregunta “¿Cuánto tiempo le toma llegar a la Universidad UIS? (Escriba su cifra en minutos, ejemplo:”55”)“. Se realiza la estadística descriptiva de la variable.
library(moments)
Desviacion1=sd(encuestamuestra$TiempollegadaUIS,na.rm=T)
Desviacion1
## [1] 20.29564
Promedio1=mean(encuestamuestra$TiempollegadaUIS,na.rm=T)
Promedio1
## [1] 30.22951
Asimetria1=skewness(encuestamuestra$TiempollegadaUIS,na.rm=T)
Asimetria1
## [1] 0.8856353
Curtosis1=kurtosis(encuestamuestra$TiempollegadaUIS,na.rm=T)
Curtosis1
## [1] 3.074058
Mediana1=median(encuestamuestra$TiempollegadaUIS,na.rm=T)
Mediana1
## [1] 30
library(modeest)
Moda1=mlv(encuestamuestra$TiempollegadaUIS)
Moda1
## [1] 17.80645
Dados los resultados de las 61 encuestas, podemos ver que las personas usando su medio de trasnporte predilecto para llegar a la Universidad gastan en promedio 30.22951 minutos con una desviación de 20.29564 minutos. Asi mismo, esta variable registra una moda de 17.80645 minutos, lo cual indica que hay respuestas proximas que registran frecuencias maximas (se debe sacar promedio).Por otro lado, se tiene una mediana de 30 minutos, una curtosis de 3.074058 lo cual representa una distribución en las respuestas un poco elevada (diferentes); y hay una asimetría de 0.8856353, esto nos indica que hay un sesgo positivo relativamente alto en la gráfica de la variable. (Ver gráfica 1)
Esta variable es “PromedioAcumulado”, dicha variable corresponde a la pregunta “¿Cuál es su promedio acumulado actualmente? (Escriba una cifra con máximo 2 decimales, utilice el punto, ejemplo:”3.75”)“. Se realiza la estadística descriptiva de la variable.
Desviacion2=sd(encuestamuestra$PromedioAcumulado,na.rm=T)
Desviacion2
## [1] 0.3145111
Promedio2=mean(encuestamuestra$PromedioAcumulado)
Promedio2
## [1] 3.82623
Asimetria2=skewness(encuestamuestra$PromedioAcumulado)
Asimetria2
## [1] 0.4433792
Curtosis2=kurtosis(encuestamuestra$PromedioAcumulado)
Curtosis2
## [1] 2.917444
Mediana2=median(encuestamuestra$PromedioAcumulado,na.rm=T)
Mediana2
## [1] 3.79
La variable PromedioAcumulado registra un promedio de 3.82623 con una desviación de 0.3145111. Así pues, se presenta un pequeño sesgo positivo con un coefiente de asimetría de 0.4433792 y una curtosis de 2.917444 lo cual indica que hay distribución un poco elevada con una concentración de valores baja en las colas de la gráfica y presenta una mediana de 3.79,dato que representa el valor central de todos los datos cuando estan ordenados (menor a mayor, mayor a menor). (Ver gráfica 2)
Esta variable es “DineroMesTransporte”, dicha variable engloba la pregunta “¿Cuánto dinero gasta aproximadamente en el mes transportándose hasta la universidad UIS? (escriba la cifra sin puntos y sin espacios, ejemplo: 100000)”. Se realiza la estadística descriptiva de la variable.
Desviacion3=sd(encuestamuestra$DineroMesTransporte,na.rm=T)
Desviacion3
## [1] 80694.47
Promedio3=mean(encuestamuestra$DineroMesTransporte,na.rm=T)
Promedio3
## [1] 71865.57
Asimetria3=skewness(encuestamuestra$DineroMesTransporte,na.rm=T)
Asimetria3
## [1] 0.8471314
Mediana3=median(encuestamuestra$DineroMesTransporte,na.rm=T)
Mediana3
## [1] 50000
Las respuestas de esta variable registra un sesgo positivo alto con un coeficiente de asimetría de 0.8471314, una mediana de 50000 COP (Pesos Colombianos) que representa el valor central de todos los datos. Así mismo, se tiene un promedio de 71865.57 COP con una desviación de 80694.47 COP, este promedio no es tan acertado ya que esta sujeto a errores debido a valores atípicos y discordancias en los rangos de respuestas. (Ver gráfica 3)
Esta variable es “TransporteyRendimientoAcademico”, dicha variable encierra la pregunta “En una escala de 1 a 10 califique cuanto cree que afecta la posible tardía del medio más frecuente que usa para transportarse, en su rendimiento academico, siendo 1 (poco afectado) y 10(muy afectado)”. Se realiza la estadística descriptiva de la variable.
library(fdth)
tipo1=as.factor(encuestamuestra$TransporteyRendimientoAcademico)
tipo1
## [1] 1 1 5 2 1 3 8 9 8 10 3 8 8 8 1 3 1 10 4 1 1 8 4 10 5
## [26] 5 2 4 5 5 2 2 4 6 8 2 7 10 4 2 1 1 2 5 2 2 8 4 10 1
## [51] 5 10 5 2 1 3 2 1 2 10 1
## Levels: 1 2 3 4 5 6 7 8 9 10
tabla1=fdt_cat(tipo1, sort=F)
tabla1
## Category f rf rf(%) cf cf(%)
## 1 13 0.21 21.31 13 21.31
## 2 12 0.20 19.67 25 40.98
## 3 4 0.07 6.56 29 47.54
## 4 6 0.10 9.84 35 57.38
## 5 8 0.13 13.11 43 70.49
## 6 1 0.02 1.64 44 72.13
## 7 1 0.02 1.64 45 73.77
## 8 8 0.13 13.11 53 86.89
## 9 1 0.02 1.64 54 88.52
## 10 7 0.11 11.48 61 100.00
La Tabla 1, define una categoría donde 1 es poco afectado y 10 muy afectado, tenemos que de las 61 personas encuestadas 13 de ellas dan una nota de 1 afirmando que su rendimiento académico se ve poco afectado por el tiempo que se demoran en su transporte elegido para llegar a la Universidad; 12 personas le dan una nota de 2; 4 personas una nota de 3; 6 encuestados una nota de 4; 8 peronas una nota de 5; 1 perona una nota de 6; 1 persona una nota de 7; 8 personas una nota de 8; 1 persona una nota de 9; 7 personas dan una nota de 10, lo cual afirma que sienten que su promedio acumulado es muy afectado por el tiempo que gastan desplazandose a la Universidad. (Ver gráfica 4)
Esta variable es “TransportePersonal”, dicha variable define la pregunta “¿Cuál medio de transporte utiliza frecuentemente para llegar a la universidad UIS?”. Se realiza la estadística descriptiva de la variable.
tipo2=as.factor(encuestamuestra$TransportePersonal)
tipo2
## [1] Bici A pie A pie Ca/Mo Propia
## [5] Ca/Mo Propia Ca/Mo Propia Ca/Mo Propia Ca/Mo Propia
## [9] A pie Ca/Mo Propia Trans. Público. Trans. Informal
## [13] Trans. Público. Trans. Informal A pie Trans. Público.
## [17] A pie Trans. Público. Trans. Público. Ca/Mo Propia
## [21] A pie Trans. Público. Trans. Público. A pie
## [25] A pie A pie Ca/Mo Propia A pie
## [29] A pie A pie Trans. Informal A pie
## [33] Ca/Mo Propia Trans. Público. Trans. Público. A pie
## [37] Trans. Público. A pie A pie A pie
## [41] A pie Ca/Mo Propia A pie Trans. Público.
## [45] Ca/Mo Propia A pie Trans. Público. Ca/Mo Propia
## [49] Trans. Público. A pie Trans. Informal Ca/Mo Propia
## [53] Ca/Mo Propia A pie Bici Ca/Mo Propia
## [57] Ca/Mo Propia Ca/Mo Propia Bici Trans. Público.
## [61] A pie
## Levels: A pie Bici Ca/Mo Propia Trans. Informal Trans. Público.
tabla2=fdt_cat(tipo2, sort=F)
tabla2
## Category f rf rf(%) cf cf(%)
## A pie 23 0.38 37.70 23 37.70
## Bici 3 0.05 4.92 26 42.62
## Ca/Mo Propia 17 0.28 27.87 43 70.49
## Trans. Informal 4 0.07 6.56 47 77.05
## Trans. Público. 14 0.23 22.95 61 100.00
De la Tabla 2, se deduce que de las 61 personas encuestadas 23 llegan a la Universidad caminando, 3 llegan en bicicleta, 17 llegan en carro o moto propia, 4 personas usan transporte informal (didi,uber,etc) y 14 de las personas encuestadas usan transporte público para llegar a la Universidad.
Esta variable es “AgradoTransporte”, dicha variable engloba la pregunta “¿Qué tan satisfecho se siente con el medio de transporte que utiliza para llegar a la universidad UIS?”. Se realiza la estadística descriptiva de la variable.
tipo3=as.factor(encuestamuestra$AgradoTransporte)
tipo3
## [1] Muy satisfecho. Bien. Muy satisfecho. Muy satisfecho.
## [5] Muy satisfecho. Muy satisfecho. Muy satisfecho. Muy satisfecho.
## [9] Regular. Muy satisfecho. Poco satisfecho. Bien.
## [13] Regular. Bien. Bien. Poco satisfecho.
## [17] Muy satisfecho. Poco satisfecho. Bien. Regular.
## [21] Muy satisfecho. Regular. Bien. Poco satisfecho.
## [25] Bien. Bien. Muy satisfecho. Muy satisfecho.
## [29] Bien. Bien. Bien. Bien.
## [33] Muy satisfecho. Regular. Poco satisfecho. Bien.
## [37] Bien. Bien. Bien. Bien.
## [41] Muy satisfecho. Muy satisfecho. Bien. Bien.
## [45] Muy satisfecho. Bien. Poco satisfecho. Bien.
## [49] Poco satisfecho. Muy satisfecho. Regular. Muy satisfecho.
## [53] Bien. Poco satisfecho. Bien. Muy satisfecho.
## [57] Bien. Muy satisfecho. Bien. Poco satisfecho.
## [61] Poco satisfecho.
## Levels: Bien. Muy satisfecho. Poco satisfecho. Regular.
tabla3=fdt_cat(tipo3, sort=F)
tabla3
## Category f rf rf(%) cf cf(%)
## Bien. 25 0.41 40.98 25 40.98
## Muy satisfecho. 20 0.33 32.79 45 73.77
## Poco satisfecho. 10 0.16 16.39 55 90.16
## Regular. 6 0.10 9.84 61 100.00
La Tabla 3 nos muestra que de las 61 personas encuestadas, 25 de ellas se siente bien con el medio de transporte que usa para llegar a la Universidad, 20 personas se sienten muy satisfechas con el transporte que usan, 10 de los encuestados se sienten poco satisfechos con el transporte que usan y 6 personas se sienten regular (presenta incovenientes a veces) con el medio de transporte que usan para llegar a la Universidad.
El primer cruce entre variables categóricas se realizó con las variables “TransportePersonal” vs “AgradoTransporte”. De este cruce se obtuvo una tabla de Contingencia que establece las posibles relaciones entre las dos variables involucradas.
library(gmodels)
#Contingencia Relativa Columna
CrossTable(AgradoTransporte, TransportePersonal, prop.r=F,
prop.t=F, expeced=F,prop.chisq=F)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | N / Col Total |
## |-------------------------|
##
##
## Total Observations in Table: 61
##
##
## | TransportePersonal
## AgradoTransporte | A pie | Bici | Ca/Mo Propia | Trans. Informal | Trans. Público. | Row Total |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Bien. | 13 | 2 | 3 | 3 | 4 | 25 |
## | 0.565 | 0.667 | 0.176 | 0.750 | 0.286 | |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Muy satisfecho. | 6 | 1 | 13 | 0 | 0 | 20 |
## | 0.261 | 0.333 | 0.765 | 0.000 | 0.000 | |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Poco satisfecho. | 3 | 0 | 0 | 0 | 7 | 10 |
## | 0.130 | 0.000 | 0.000 | 0.000 | 0.500 | |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Regular. | 1 | 0 | 1 | 1 | 3 | 6 |
## | 0.043 | 0.000 | 0.059 | 0.250 | 0.214 | |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Column Total | 23 | 3 | 17 | 4 | 14 | 61 |
## | 0.377 | 0.049 | 0.279 | 0.066 | 0.230 | |
## -----------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
##
##
Por cuestiones de margen de pantalla se puede observar que hay una columna (Row Total) que queda sobrepuesta sobre la primer columna (AgradoTransporte) de la tabla; la columna Row Total es la última columna que hace parte de la tabla y se ubica al lado derecho de la columna Trans. Público con los valores y orden que se muestra a continuación:
Row Total
25
20
10
6
61
Continuando con el análisis de la tabla, se puede apreciar que de las 23 personas que llegan a la Universidad caminando, 13 de ellas se sienten bien , 6 se sienten muy satisfechas, 3 personas se sienten poco satisfechas al tener que desplazarse a la Universidad caminando y 1 se siente de manera regular.
De las 3 personas que llegan a la Universidad en bicicleta, 2 de ellas se siente bien y 1 esta muy satisfecha con su medio transporte.
De las 17 personas que llegan a la Universidad en carro o moto propia, 3 de ellas se sienten bien, 13 se sienten muy satisfechas y 1 se siente regular con su medio de tranporte que usa para llegar a la Universidad.
De las 4 personas que usan transporte informal para llegar a la Universidad, 3 se sienen bien y 1 se siente regular con el medio de tranpsorte que usa.
De las 14 personas que usan el transporte público para llegar a la Universidad, 4 de ellas se sienten bien, 7 se encuentran poco satisfechas y 3 de ellas se sienten regular con el medio de transporte en el que se movilizan para llegar a la Universidad.
El segundo cruce entre variables categóricas se realizó con las variables “TransportePersonal” vs “TransporteyRendimientoAcademico”.
#Contingencia Relativa Columna
CrossTable(TransporteyRendimientoAcademico, TransportePersonal, prop.r=F,
prop.t=F, expeced=F,prop.chisq=F)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | N / Col Total |
## |-------------------------|
##
##
## Total Observations in Table: 61
##
##
## | TransportePersonal
## TransporteyRendimientoAcademico | A pie | Bici | Ca/Mo Propia | Trans. Informal | Trans. Público. | Row Total |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 1 | 7 | 2 | 4 | 0 | 0 | 13 |
## | 0.304 | 0.667 | 0.235 | 0.000 | 0.000 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 2 | 6 | 1 | 4 | 1 | 0 | 12 |
## | 0.261 | 0.333 | 0.235 | 0.250 | 0.000 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 3 | 0 | 0 | 2 | 0 | 2 | 4 |
## | 0.000 | 0.000 | 0.118 | 0.000 | 0.143 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 4 | 2 | 0 | 2 | 0 | 2 | 6 |
## | 0.087 | 0.000 | 0.118 | 0.000 | 0.143 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 5 | 5 | 0 | 1 | 1 | 1 | 8 |
## | 0.217 | 0.000 | 0.059 | 0.250 | 0.071 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 6 | 0 | 0 | 0 | 0 | 1 | 1 |
## | 0.000 | 0.000 | 0.000 | 0.000 | 0.071 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 7 | 0 | 0 | 0 | 0 | 1 | 1 |
## | 0.000 | 0.000 | 0.000 | 0.000 | 0.071 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 8 | 1 | 0 | 1 | 2 | 4 | 8 |
## | 0.043 | 0.000 | 0.059 | 0.500 | 0.286 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 9 | 0 | 0 | 1 | 0 | 0 | 1 |
## | 0.000 | 0.000 | 0.059 | 0.000 | 0.000 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## 10 | 2 | 0 | 2 | 0 | 3 | 7 |
## | 0.087 | 0.000 | 0.118 | 0.000 | 0.214 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
## Column Total | 23 | 3 | 17 | 4 | 14 | 61 |
## | 0.377 | 0.049 | 0.279 | 0.066 | 0.230 | |
## --------------------------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|
##
##
Por cuestiones de margen de pantalla se puede observar que hay dos columnas (Trans. Público y Row Total) que quedan sobrepuestas sobre la primer columna (TransporteyRendimientoAcademico) de la tabla; la columna Trans. Público va despues de la columna Trans. Informal y la columna Row Total es la última columna que hace parte de la tabla y se ubica al lado derecho de la columna Trans. Público, dichas columnas tiene los siguientes valores y orden en la tabla original:
Trans. Público Row Total
0 13
0.000
0 12
0.000
2 4
0.143
2 6
0.143
1 8
0.071
1 1
0.071
1 1
0.071
4 8
0.286
0 1
0.000
3 7
0.214
14 61
0.230
Pasando al análisis de la tabla se debe tener en cuenta que la variable TransporteyRendimientoAcademico establece un rango, donde 1 es poco afectado y 10 es muy afectado, esto hace referencia al como perciben los encuestados que su medio de transporte influye en su rendimiento académico. 13 personas dan nota de 1 (poco afectado), 7 de ellas llegan caminando, 2 en bicicleta, 4 en carro o moto propia.
12 personas dan una nota de 2, 6 de ellas llegan caminando, 1 en bicicleta, 4 en carro o moto propia y 1 en transporte informal.
4 personas dan una nota de 3, 2 de ellas llegan en carro o moto propia y las otras 2 llegan en transporte público.
6 personas dan una nota de 4, 2 de ellas llegan caminando, 2 en carro o moto propia y 2 en transporte público.
8 personas dan una nota de 5, 5 de ellas llegan caminando, 1 en carro o moto propia, 1 en transporte informal y 1 en transporte público.
1 persona da una nota de 6 y llega en transporte público.
1 persona da una nota de 7 y llega en transporte público.
8 personas dan una nota de 8, 1 de ellas llega caminando, 1 en carro o moto propia, 2 en transporte informal y 4 en transporte público.
1 persona da una nota de 9 y llega en carro o moto propia.
7 personas dan una nota de 10 (muy afectado), 2 de ellas llegan caminando, 2 en carro o moto propia y 3 en transporte público.
El primer cruce entre variable categórica vs variable cuantitativa se efectuó entre “TransporteyRendimientoAcademico” vs “PromedioAcumulado”. En este caso a nuestra variable TransporteyRendimientoAcademico debemos convertirla a una variable categórica ya que R la toma en un principio como una variable numérica, por ende debemos hacer esa conversión y luego realizar el respectivo cruce con la variable numérica PromedioAcumulado.
library(crosstable)
encuestamuestra$TransporteAcaRen1=as.character(encuestamuestra$TransporteyRendimientoAcademico)
class(encuestamuestra$TransporteAcaRen1)
## [1] "character"
class(encuestamuestra$PromedioAcumulado)
## [1] "numeric"
crosstable(encuestamuestra,c(PromedioAcumulado), by=c(TransporteAcaRen1))%>%
as_flextable(keep_id=TRUE)
.id | label | variable | TransporteAcaRen1 | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 10 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |||
PromedioAcumulado | PromedioAcumulado | Min / Max | 3.3 / 4.4 | 3.5 / 4.2 | 3.5 / 4.5 | 3.5 / 4.0 | 3.3 / 4.4 | 3.1 / 4.5 | 4.5 / 4.5 | 3.8 / 3.8 | 3.4 / 4.1 | 4.0 / 4.0 |
Med [IQR] | 3.8 [3.7;3.9] | 3.7 [3.6;3.8] | 3.8 [3.7;4.1] | 3.7 [3.6;3.8] | 3.9 [3.6;4.0] | 3.8 [3.7;4.0] | 4.5 [4.5;4.5] | 3.8 [3.8;3.8] | 3.7 [3.5;4.0] | 4.0 [4.0;4.0] | ||
Mean (std) | 3.8 (0.3) | 3.8 (0.2) | 3.9 (0.3) | 3.7 (0.2) | 3.9 (0.4) | 3.8 (0.4) | 4.5 (NA) | 3.8 (NA) | 3.7 (0.3) | 4.0 (NA) | ||
N (NA) | 13 (0) | 7 (0) | 12 (0) | 4 (0) | 6 (0) | 8 (0) | 1 (0) | 1 (0) | 8 (0) | 1 (0) | ||
De esta tabla resultante, vamos a tomar dos categorias, una que va a tomar las notas de [1 a 5, y hará alución a poco afectado] y la otra va a tener notas de [6 a 10, se referirá al estado muy afectado]; con estas dos categorias podemos ver que las personas que sienten que su promedio acumulado se ve muy afectado por el medio de transporte que usan (se relaciona directamente con el tiempo de viaje o lo que tarda el medio de transporte para llegar a su destino) presentan un mejor promedio que los que sienten que su medio de transporte afecta poco su promedio acumulado. Un caso particular es que las personas que dan una nota de 1 tienen un promedio acumulado aproximado a 3.8 con una desviación de 0.3 y las personas que dan una nota de 9 tienen un promedio acumulado aproximado a 4.0.
El segundo cruce entre variable categórica vs variable cuantitativa se efectuó entre “TransportePersonal” vs “PromedioAcumulado”.
class(encuestamuestra$TransportePersonal)
## [1] "character"
class(encuestamuestra$PromedioAcumulado)
## [1] "numeric"
crosstable(encuestamuestra,c(PromedioAcumulado), by=c(TransportePersonal))%>%
as_flextable(keep_id=TRUE)
.id | label | variable | TransportePersonal | ||||
|---|---|---|---|---|---|---|---|
A pie | Bici | Ca/Mo Propia | Trans. Informal | Trans. Público. | |||
PromedioAcumulado | PromedioAcumulado | Min / Max | 3.1 / 4.4 | 3.7 / 3.9 | 3.5 / 4.5 | 3.4 / 4.1 | 3.3 / 4.5 |
Med [IQR] | 3.8 [3.5;3.9] | 3.7 [3.7;3.8] | 3.9 [3.7;4.0] | 3.8 [3.6;4.0] | 3.8 [3.6;4.0] | ||
Mean (std) | 3.8 (0.3) | 3.8 (0.1) | 3.9 (0.2) | 3.8 (0.3) | 3.9 (0.4) | ||
N (NA) | 23 (0) | 3 (0) | 17 (0) | 4 (0) | 14 (0) | ||
De la tabla se puede apreciar, que el promedio del promedio acumulado de las personas que llegan caminando a la Universidad es de 3.8 con una desviación de 0.3; el de las personas que llegan en bicicleta es de 3.8 con una desviación de 0.1; así mismo, el de las personas que llegan en carro o moto propia es de 3.9 con una desviación de 0.2; el de las personas que llegan en transporte informal es de 3.8 con una desviación de 0.3 y el de las personas que llegan en transporte público es de 3.9 con una desviación de 0.4.
Las personas con carro o moto propia registran el mejor promedio acumulado en promedio.
El cruce entre variable cuantitativa vs variable cuantitativa se desarrolló entre “TiempollegadaUIS” vs “PromedioAcumulado”.
library(ggplot2)
ggplot(encuestamuestra, aes(x = PromedioAcumulado, y = TiempollegadaUIS))+
geom_point(color="#C4961A", size=1, shape=8)
##cor, coeficiente de correlacion de Pearson.
CORRELACIONPEARSON=cor(PromedioAcumulado,TiempollegadaUIS)
CORRELACIONPEARSON
## [1] -0.02777396
En este caso el coeficiente que nos permite relacionar las dos variables numéricas “PromedioAcumulado” y “TiempollegadaUIS”, es el coeficiente de PEARSON, dicho coeficiente en este caso particular dio un valor de -0.02777396, lo cual nos indica que al aumentar el valor de una variable, el valor de la otra tiende a disminuir un porcentaje relativamente bajo.
En el desarrollo del proyecto se pudo apreciar que el 37.70% de los encuestados llega a la Universidad caminando, el 4.92% llega en bicicleta, el 27.87% llega en carro o moto propia, el 6.56% en transporte informal y el 22.95% de los encuestados llega en transporte público.
Así mismo, se pudo observar que aunque algunos de los encuestados sienten que el tiempo que tardan desplazándose a la Universidad en su respectivo medio de transporte ha afectado su rendimiento académico, el cruce de variables numéricas nos muestra que aunque dicho factor incide en el desempeño del estudiante académicamente hablando, no es una influencia tan crítica o significativa, ya que los promedios obtenidos de la muestra poblacional se encuentran entre 3.7 y 4.5.
En el siguiente link se encontrará un pequeño video en el que se desarrollará una descripcion breve del informe y de los resultados que se obtuvieron al realizar el presente proyecto. Link https://youtu.be/nyCmJb3DHPs