Planteamiento del Problema
Objetivo General
Objetivos Específicos
Antecedentes
Desarrollo del Proyecto
Resultados
Conclusiones
Bibliografía
En muchas universidades, la movilidad estudiantil es un aspecto crítico que influye directamente en la puntualidad, el rendimiento académico y la calidad de vida de los estudiantes. En este contexto, resulta relevante conocer los medios de transporte más utilizados, especialmente diferenciando entre transporte público y privado.
¿Existe una diferencia estadísticamente significativa entre la proporción de estudiantes que utilizan transporte público y la proporción que utilizan transporte privado en la universidad?
Estimar y comparar las proporciones de estudiantes que utilizan transporte público y privado en la universidad mediante métodos de inferencia estadística basados en datos recolectados a través de encuestas.
Diseñar y aplicar una encuesta para recolectar datos sobre el tipo de transporte utilizado por los estudiantes.
Calcular las proporciones muestrales y construir intervalos de confianza para estimar la proporción de estudiantes que usan transporte público y privado.
Realizar una prueba estadística para determinar si existe una diferencia significativa entre las proporciones de usuarios de transporte público y privado.
Revisión breve de literatura o fuentes relacionadas con nuestro proyecto.
Resultados y antecedentes
Objetivo principal: Determinar las variables que influyen en la elección de medios de transporte de los estudiantes para desplazarse al campus Lagos del Cacique.
Variables analizadas: Distancia residencia-universidad, costos, disponibilidad y frecuencia de medios de transporte, características socioeconómicas, tiempo de viaje y preferencias personales.
Metodología: Revisión de literatura y encuestas a una muestra representativa de estudiantes.
Hallazgos: El estudio identificó que el costo, la distancia y la disponibilidad de transporte influyen significativamente en la elección modal. El transporte informal (vehículos compartidos) es muy utilizado entre los estudiantes, seguido del transporte público y privado.
Relevancia: La investigación contribuye a la planificación de la movilidad urbana y la sostenibilidad ambiental en Bucaramanga.
Servicio universitario: UDES cuenta con una ruta de bus exclusiva, segura y económica ($2.200 por trayecto), adaptada a los horarios de clase, que facilita la movilidad y reduce la huella de carbono.
“C. A. Puentes-Suarez, “Determinación de las Variables en la Utilización de los Diferentes Medios de Transporte en los Desplazamientos de los Estudiantes a la Universidad de Santander – Campus Lagos del Cacique, Bucaramanga”, Trabajo de Grado Pregrado, Fac. de Ing. y Tec., Ing. Civil, Univ. de Santander, Bucaramanga, Colombia, 2023. Repositorio Digital Univ. de Santander”
Resultados y antecedentes
Objetivo principal: Analizar la percepción del sector universitario sobre el sistema de transporte público en Bogotá.
Metodología: Encuestas a estudiantes, profesores y trabajadores de la zona centro de la ciudad, comparando rutas del SITP y el antiguo TPC.
Hallazgos: El estudio revela que el 71% de las rutas analizadas presenta fallas, lo que afecta la percepción de los usuarios universitarios. Se identificó que la percepción de inseguridad y la falta de confiabilidad son factores clave en la elección modal.
Relevancia: El análisis aporta información valiosa para la mejora del sistema de transporte y la satisfacción de los usuarios universitarios.
“Transporte público en Bogotá; percepción del sector universitario”, Universidad de los Andes, 2015. Disponible en el repositorio institucional”
En el ámbito europeo, Osorio-Arjona y García-Palomares (2019) realizaron un análisis de movilidad estudiantil en universidades del Área Metropolitana de Madrid utilizando datos geolocalizados de Twitter y fuentes oficiales para comparar tiempos de viaje en transporte público y privado. Encontraron que los tiempos promedio de viaje en transporte público son considerablemente mayores y más variables que en transporte privado, lo que influye en la elección del medio (Osorio-Arjona & García-Palomares, 2019).
Miralles-Guasch, C., & Domène, E. (2017).
En Colombia, Suárez-Ramírez (2018) investigó los determinantes de la demanda de transporte público y privado en estudiantes universitarios de la Universidad del Norte, aplicando modelos logísticos para identificar variables como sexo, ingreso, tiempo y costo del viaje que afectan la elección del modo de transporte (Suárez-Ramírez, 2018). Este estudio enfatiza la utilidad de la estadística inferencial para estimar probabilidades y proporciones en contextos reales.
Suárez-Ramírez, Ó. (2018).
La importancia de realizar un análisis estadístico sobre la elección de medios de transporte entre estudiantes universitarios, como en el caso de la Universidad de Santander (UDES) en Bucaramanga y otras instituciones colombianas, radica en varios aspectos clave que emergen de los antecedentes y resultados de investigaciones previas:
Identificación de variables determinantes El estudio en la UDES destaca que factores como el costo, la distancia residencia-universidad, la disponibilidad y frecuencia de transporte, así como características socioeconómicas y preferencias personales, influyen significativamente en la elección modal (Puentes-Suarez, 2023). Conocer estas variables permite comprender mejor las decisiones de movilidad de los estudiantes y diseñar soluciones ajustadas a sus necesidades reales.
Contribución a la planificación y sostenibilidad Estos análisis aportan información valiosa para la planificación de la movilidad urbana y universitaria, promoviendo la sostenibilidad ambiental. Por ejemplo, el servicio de transporte universitario exclusivo de la UDES, con tarifas accesibles y frecuencias adaptadas a los horarios académicos, facilita la movilidad segura y económica, además de contribuir a la reducción de la huella de carbono (UDES, 2025). Esto evidencia cómo el conocimiento estadístico puede respaldar políticas institucionales y ambientales.
Mejora de la percepción y calidad del servicio Estudios en la Universidad de los Andes (2015) muestran que la percepción de inseguridad y la falta de confiabilidad en el transporte público afectan la elección modal. Realizar análisis estadísticos permite identificar estas barreras y orientar mejoras en el sistema de transporte, aumentando la satisfacción y seguridad de los usuarios.
Apoyo a políticas públicas y toma de decisiones En la Universidad del Norte, Barranquilla, se identificaron factores como la posesión de vehículo, edad, ingreso y tiempo de viaje que determinan la elección entre transporte público y privado (Suárez Ramírez, 2017). Estos hallazgos sustentan la formulación de políticas públicas orientadas a optimizar la movilidad y reducir la congestión vehicular, demostrando la utilidad práctica de los análisis estadísticos.
Relevancia para la comunidad universitaria El conocimiento de las proporciones de uso de transporte público y privado, junto con sus determinantes, permite a las universidades ofrecer servicios adecuados, como rutas exclusivas, subsidios tarifarios y campañas de promoción del transporte sostenible, mejorando la calidad de vida estudiantil y facilitando el acceso a la educación.
En resumen, realizar este tipo de análisis estadístico es fundamental para entender las dinámicas de movilidad estudiantil, apoyar la planificación institucional y urbana, promover la sostenibilidad ambiental y mejorar la experiencia de los estudiantes en su desplazamiento diario.
Datos_Encuesta <- read_excel("DATOS/Datos Encuesta.xlsx")
head(Datos_Encuesta)
## # A tibble: 6 × 14
## Dirección de correo electrón…¹ EstudianteUPTC Edad Sexo Transporte diasdeuso
## <chr> <chr> <dbl> <chr> <chr> <dbl>
## 1 yenni.bernal@uptc.edu.co Si 27 Feme… No 0
## 2 anthony.mateus@uptc.edu.co Si 24 Masc… No 2
## 3 sandra.urbano13@uptc.edu.co Si 23 Feme… Si 2
## 4 jaider.roa@uptc.edu.co Si 22 Masc… Si 4
## 5 faber.ronderos01@uptc.edu.co Si 21 Masc… Si 1
## 6 jimena.rodriguez02@uptc.edu.co Si 18 Feme… Si 5
## # ℹ abbreviated name: ¹`Dirección de correo electrónico`
## # ℹ 8 more variables: mediodetransporte <chr>, promedioenllegar <dbl>,
## # eficienciadetransporte <chr>, razondeuso <chr>, porquenoseusa <chr>,
## # ingresomensual <chr>, codificacionmedio <lgl>, codificacionsexo <lgl>
Media_Edad <- mean(Datos_Encuesta$Edad)
cat("La media de la edad es:", Media_Edad)
## La media de la edad es: 22.61765
Mediana_Edad <- median(Datos_Encuesta$Edad, na.rm = TRUE)
cat("La mediana de la edad es:", Mediana_Edad)
## La mediana de la edad es: 22
moda <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
Moda_Edad <- moda(Datos_Encuesta$Edad)
cat("La moda de la edad es:", Moda_Edad)
## La moda de la edad es: 21
rango <- range(Datos_Encuesta$Edad) # Esto te da el mínimo y el máximo
diferencia_rango <- diff(rango) # Esto calcula la diferencia (max - min)
cat("El rango de la edad es:", rango)
## El rango de la edad es: 17 31
cat(" y La diferncia del rango de la edad es:", diferencia_rango)
## y La diferncia del rango de la edad es: 14
desviacion_estandar <- sd(Datos_Encuesta$Edad)
cat("La desviacion estandar de la edad es:", desviacion_estandar)
## La desviacion estandar de la edad es: 3.13354
# Crear tabla de frecuencia
tabla_frecuenciaedad <- table(Datos_Encuesta$Edad)
# Mostrar tabla
print(tabla_frecuenciaedad)
##
## 17 18 19 20 21 22 23 24 25 27 31
## 1 1 1 4 8 5 3 3 4 2 2
# Graficar tabla de frecuencia con barplot
barplot(tabla_frecuenciaedad,
main = "Frecuencia de Edad",
xlab = "Edad",
ylab = "Frecuencia",
col = "skyblue",
las = 2) # gira etiquetas del eje x para mejor lectura
boxplot(Datos_Encuesta$Edad,
main = "Diagrama de Caja de Edad",
ylab = "Edad",
col = "lightgreen",
border = "black",
horizontal = TRUE) # Opcional: lo pone en horizontal
Datos_Encuesta <- readxl::read_excel("DATOS/Datos Encuesta.xlsx")
Datos_Encuesta$codificacionsexo <- ifelse(Datos_Encuesta$Sexo == "Masculino", 1, 0)
# Supongamos que ya tienes tu dataframe con codificacionsexo
# Paso 1 y 2: contar y calcular porcentajes
sexo_tabla <- Datos_Encuesta %>%
count(codificacionsexo) %>% # Cuenta por grupo 0 y 1
mutate(
label = ifelse(codificacionsexo == 0, "Femenino", "Masculino"), # Etiquetas claras
porcentaje = n / sum(n) # Porcentaje
)
# Paso 3: gráfica de torta con porcentajes
ggplot(sexo_tabla, aes(x = "", y = porcentaje, fill = label)) +
geom_col(color = "white") + # Barras proporcionales
coord_polar(theta = "y") + # Convierte en torta
geom_text(aes(label = percent(porcentaje)),
position = position_stack(vjust = 0.5),
color = "white", size = 5) + # Texto con porcentaje dentro de cada sector
labs(title = "Distribucion porcentual por sexo", fill = "Sexo") +
theme_void() + # Sin ejes ni fondo
scale_fill_manual(values = c("Femenino" = "pink", "Masculino" = "steelblue"))
ggplot(Datos_Encuesta, aes(x = factor(codificacionsexo, levels = c(0, 1), labels = c("Femenino", "Masculino")),
y = Edad)) +
geom_boxplot(fill = "lightgreen", color = "black", outlier.color = "red", outlier.size = 2) +
scale_y_continuous(breaks = seq(floor(min(Datos_Encuesta$Edad, na.rm = TRUE)),
ceiling(max(Datos_Encuesta$Edad, na.rm = TRUE)),
by = 1)) +
labs(title = "Diagrama de Cajas: Edad contra Sexo",
x = "Sexo",
y = "Edad") +
theme_minimal()
Datos_Encuesta <- read_excel("DATOS/Datos Encuesta.xlsx")
Datos_Encuesta$codificacionmedio <- ifelse(Datos_Encuesta$Transporte == "Si", 1, 0)
table(Datos_Encuesta$Transporte)
##
## No Si
## 14 20
prop.table(table(Datos_Encuesta$Transporte))
##
## No Si
## 0.4117647 0.5882353
ggplot(Datos_Encuesta, aes(x = factor(codificacionmedio, levels = c(0,1), labels = c("Publico", "Privado")))) +
geom_bar(fill = "steelblue") +
labs(title = "Distribucion uso de transporte", x = "Uso de transporte", y = "Frecuencia")
datos_caminando <- Datos_Encuesta %>%
filter(tolower(mediodetransporte) == "caminando") %>%
mutate(Transporte = "Caminando") %>%
count(Transporte)
# Gráfica de barras
ggplot(datos_caminando, aes(x = Transporte, y = n, fill = Transporte)) +
geom_bar(stat = "identity") +
labs(title = "Cantidad de personas que caminan segun uso de transporte",
x = "Medio de transporte", y = "Cantidad de personas") +
scale_fill_manual(values = c("Caminando" = "orange")) +
theme_minimal()
# Gráfica 1: Uso de transporte
g1 <- ggplot(Datos_Encuesta, aes(x = factor(codificacionmedio, levels = c(0,1), labels = c("Publico", "Privado")))) +
geom_bar(fill = "steelblue") +
labs(title = "Distribucion tipo de trasnporte", x = "Medio de transporte", y = "Cantidad de personas")
# Datos caminando
datos_caminando <- Datos_Encuesta %>%
filter(tolower(mediodetransporte) == "caminando") %>%
mutate(Transporte = "Caminando") %>%
count(Transporte)
# Gráfica 2: Caminando
g2 <- ggplot(datos_caminando, aes(x = Transporte, y = n, fill = Transporte)) +
geom_bar(stat = "identity") +
labs(title = "Cantidad de personas que caminan",
x = "Medio de transporte", y = "Cantidad de personas") +
scale_fill_manual(values = c("Caminando" = "orange")) +
theme_minimal()
# Mostrar juntas
g1 + g2 # Las une horizontalmente
total <- nrow(Datos_Encuesta)
z <- 1.96 # para 95% confianza
# Para datos_caminando
datos_caminando <- Datos_Encuesta %>%
filter(tolower(mediodetransporte) == "caminando") %>%
summarise(n = n()) %>%
mutate(
prop = n / total,
error = z * sqrt(prop * (1 - prop) / total),
lower = prop - error,
upper = prop + error,
lower = pmax(lower, 0),
upper = pmin(upper, 1),
Transporte = "Caminando"
)
# Para transporte público y privado
conteo_transporte <- Datos_Encuesta %>%
group_by(codificacionmedio) %>%
summarise(n = n()) %>%
mutate(
prop = n / total,
error = z * sqrt(prop * (1 - prop) / total),
lower = prop - error,
upper = prop + error,
lower = pmax(lower, 0),
upper = pmin(upper, 1),
Transporte = factor(codificacionmedio, levels = c(0,1), labels = c("Publico", "Privado"))
)
# Gráfica 1: Transporte público/privado con intervalo
g1 <- ggplot(conteo_transporte, aes(x = Transporte, y = prop, fill = Transporte)) +
geom_col() +
geom_errorbar(aes(ymin = lower, ymax = upper), width = 0.2) +
scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
labs(title = "Proporcion de uso de transporte", x = "Tipo de transporte", y = "Proporcion (%)") +
theme_minimal()
# Gráfica 2: Proporción de personas caminando con intervalo
g2 <- ggplot(datos_caminando, aes(x = Transporte, y = prop, fill = Transporte)) +
geom_col() +
geom_errorbar(aes(ymin = lower, ymax = upper), width = 0.2) +
scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
labs(title = "Proporcion de personas que caminan", x = "Medio de transporte", y = "Proporcion (%)") +
theme_minimal()
# Mostrar juntas (horizontal)
g1 + g2
Datos_Encuesta$edad <- as.numeric(Datos_Encuesta$Edad)
ggplot(Datos_Encuesta, aes(x = factor(codificacionmedio, levels = c(0, 1), labels = c("No", "Sí")),
y = edad)) +
geom_jitter(width = 0.2, height = 0, color = "steelblue", alpha = 0.6) +
scale_y_continuous(breaks = seq(18, 30, by = 1)) +
labs(title = "Distribución de edad según uso de transporte privado",
x = "Uso de transporte privado",
y = "Edad") +
theme_minimal()