Introducción

El transporte público es un componente esencial para la movilidad urbana, especialmente en ciudades como San Fernando del Valle de Catamarca, donde una gran parte de la población depende de este servicio para sus actividades diarias. La calidad y eficiencia del transporte público afectan directamente la vida de los usuarios, por lo que es fundamental entender las dificultades que enfrentan en su día a día y su nivel de satisfacción con el servicio. Este trabajo se fundamenta en una encuesta, que recopila información sobre distintos aspectos de la experiencia del usuario. Los datos obtenidos se analizarán utilizando el software R y RStudio, herramientas ampliamente reconocidas en el ámbito del análisis estadístico.

Objetivo

El objetivo de esta encuesta es conocer el nivel de satisfacción y las dificultades que enfrentan los usuarios del servicio de transporte público, en San Fernando del Valle de Catamarca.

Materiales y Métodos

Resultados

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(readxl)
library(summarytools)
## Warning: package 'summarytools' was built under R version 4.4.2
## 
## Adjuntando el paquete: 'summarytools'
## 
## The following object is masked from 'package:tibble':
## 
##     view
TRANSPORTE <- read_excel("TRANSPORTE.ENCUESTA.xlsx")

1. Caracterización de la muestra

Edad de los Encuestados

  • Tabla de Frecuencias
st_options(lang = "es")
freq(TRANSPORTE$EDAD,
     justify =  "center", 
    report.nas = FALSE,
    headings = FALSE)
## 
##              Frec.     %      % Acu. 
## ----------- ------- -------- --------
##     13         3      7.32     7.32  
##     14         2      4.88    12.20  
##     16         1      2.44    14.63  
##     20         1      2.44    17.07  
##     21         6     14.63    31.71  
##     22         6     14.63    46.34  
##     23         2      4.88    51.22  
##     24         3      7.32    58.54  
##     25         1      2.44    60.98  
##     26         1      2.44    63.41  
##     28         3      7.32    70.73  
##     30         3      7.32    78.05  
##     31         1      2.44    80.49  
##     32         2      4.88    85.37  
##     33         1      2.44    87.80  
##     37         1      2.44    90.24  
##     38         1      2.44    92.68  
##     40         1      2.44    95.12  
##     56         1      2.44    97.56  
##     57         1      2.44    100.00 
##    Total      41     100.00   100.00

En la tabla de frecuencias podemos notar que las edades varían entre los 13 y 57 años, con una mayor concentración entre los 21 y 22 años (14.63% cada una). Tambien podemos notar que el 46.34% de los encuestados tiene 22 años o menos, lo que implica que casi la mitad de los usuarios son jóvenes.

Género de los Encuestados

  • Grafico de Barras
ggplot(TRANSPORTE,aes(GENERO,fill = GENERO))+
  geom_bar()+ 
  ggtitle('GENERO DE LOS ENCUESTADOS')+
  theme_classic()+
  labs(x= "Genero", y = "Frecuencia",caption = "Imagen 1")+
  theme(axis.title = element_text(size = 12,
                                  color = "darkolivegreen",
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  color = "darkolivegreen",
                                  family = "mono"))+
  scale_fill_manual(values=c("palevioletred1","#8B4789"))

El gráfico de barras muestra la distribución del género entre los encuestados. Se puede observar que la distribución es relativamente equilibrada entre hombres y mujeres, con una ligera predominancia del género femenino.

Principal uso del transporte

  • Grafico de Barras
ggplot(TRANSPORTE,aes(USO,fill = USO))+
  geom_bar()+
ggtitle('PRINCIPALES USOS DEL TRANSPORTE')+
theme_classic()+
labs(x= "Usos", y = "Frecuencia",caption = "Imagen 2")+
theme(axis.title = element_text(size = 12,
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  family = "mono"))+
scale_fill_manual(values=c("purple2","pink1","palevioletred","#8B4789"))+
  scale_x_discrete(limits = c("Tramites", "Cuidado.familiar", "Trabajo","Estudio"))

La imagen 2,presenta los usos principales del transporte público (trabajo, estudio, trámites, cuidado familiar). En esta se puede observar que los principales usos son “Estudio” y “Trabajo”.

2.Frecuencia y Uso del Transporte Público:

Frecuencia de Uso Semanal:

  • Grafico de Barras
ggplot(TRANSPORTE,aes(factor(FREC),fill =factor(FREC) ))+
         geom_bar()+
  ggtitle('FRECUENCIA DE USO SEMANAL')+
theme_classic()+
  guides(fill = guide_legend(title = "N° de Usos"))+
labs(x= "Cantidad de usos por semana", y = "Frecuencia",caption = "Imagen 3")+
theme(axis.title = element_text(size = 12,
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  family = "mono"))+ 
scale_fill_manual(values=c("purple2","pink1","palevioletred","#8B4789","orchid2","#CD96CD"))

El gráfico representa la cantidad de veces que los usuarios utilizan el transporte semanalmente. Se puede observar que la mayoría de los usuarios utiliza el servicio entre 10 y 12 veces por semana, lo cual sugiere un uso regular.

  • Medidas de Resumen
TRANSPORTE%>%
  summarise(MINIMUM = min(FREC),
            MEAN = mean(FREC),
            MEDIAN = median(FREC),
            MAXIMUM = max(FREC))
## # A tibble: 1 × 4
##   MINIMUM  MEAN MEDIAN MAXIMUM
##     <dbl> <dbl>  <dbl>   <dbl>
## 1       6  11.2     10      20

Podemos observar una gran diferencia entre el valor mínimo (6) y máximo (20) lo cual refleja variabilidad.La media de 11.2 indica un gran uso del servicio y la mediana de 10 sugiere queal menos el 50% de los encuestados utiliza 10 veces o mas, a la semana, el transporte publico,lo cual coincide con el grafico analisado anteriormente.

Tiempo de Salida con Antelacion para llegar Puntual por Genero

  • Grafico
ggplot(data = TRANSPORTE, aes(TIEMP.SALID))+
  geom_freqpoly( binwidth = 15, color = "purple2", linewidth = 1 )+
  facet_grid(.~ GENERO)+
  ggtitle('TIEMPO DE ANTELACION PARA LLEGAR PUNTUAL')+
  theme_classic()+
  labs(x= "tiempo (minutos)", y = "Frecuencia",caption = "Imagen 5")+
  theme(axis.title = element_text(size = 12,
                                  color = "darkolivegreen",
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  color = "darkolivegreen",
                                  family = "mono"))

En el gráfico de líneas se muestra la distribución del tiempo de salida con anticipación (en minutos) necesario para llegar puntual a su destino, desglosado por género. En este caso, se notan picos en el rango de 30 a 60 minutos para el genero femenino y picos desde los 50 a 60 minutos,aproximadamente, en el genero masculino.

3. Evaluación de Calidad del Servicio:

Tiempo de Espera en la parada por Genero

  • Grafico de Histograma
ggplot(data = TRANSPORTE, aes(TIEMP.ESPER))+
  geom_histogram( binwidth = 15, color="#8B4789", fill="palevioletred1" )+
  facet_grid(.~ GENERO)+
  ggtitle('TIEMPO PROMEDIO DE ESPERA EN LA PARADA')+
  theme_classic()+
  labs(x= "Tiempo de Espera", y = "Frecuencia",caption = "Imagen 6")+
  theme(axis.title = element_text(size = 12,
                                  color = "darkolivegreen",
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  color = "darkolivegreen",
                                  family = "mono"))

El histograma representa el tiempo de espera en la parada, segmentado por género. En el se puede ver que la mayoría de los usuarios espera entre 10 y 30 minutos, con pocos casos de tiempos más largos.

Dificultades Enfrentadas por Genero

  • Grafico de Barras
ggplot(data = TRANSPORTE, aes(DIFIC))+
  geom_bar( color="#8B4789", fill="palevioletred1")+
  facet_grid(GENERO~.)+
  ggtitle('DIFICULTADES EN EL TRASPORTE PUBLICO')+
  theme_light()+
  labs(x= "Dificultades", y = "Frecuencia",caption = "Imagen 7")+
  theme(axis.title = element_text(size = 12,
                                  color = "darkolivegreen",
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  color = "darkolivegreen",
                                  family = "mono"))

En la imagen 7 se puede observar que las dificultades más frecuentes son compartidas por ambos géneros (espera y frecuencia).

4. Satisfacción General:

Tiempo Diario en el Transporte

  • Medidas de Resumen
TRANSPORTE%>%
  descr(TIEMP.DIARIO,
        headings = FALSE)
## 
##                      TIEMP.DIARIO
## ------------------ --------------
##              Media         135.61
##           Dev.std.          54.91
##                Min          60.00
##                 Q1         120.00
##            Mediana         120.00
##                 Q3         150.00
##                Max         240.00
##                DAP           0.00
##                 RI          30.00
##                 CV           0.40
##          Asimetría           0.83
##       ES-Asimetría           0.37
##           Curtosis          -0.27
##         Num.Válido          41.00
##         Pct.Válido         100.00

Se puede observar que la media es de casi 136 minutos , lo que indica que el promedio de los encuestados gasta mas de 2hs diarias en el transporte publico. La mediana es de 120 minutos lo que demuestra que por lo menos el 50% de los encuestados gasta 2hs o mas diarias en el transporte, aqui se puede notar que la media y la mediana son relativamente cercanas, lo que indica que el tiempo diario utilizado en el transporte están distribuidos de manera relativamente uniforme, aunque con algunos usuarios que pasan más tiempo en el mismo. La desviación estándar, de casi 55, sugiere que existen diferencias significativas en los tiempos de viaje, lo que podría estar relacionado con la ubicación de los usuarios o la frecuencia del servicio. El coeficiente de variación del 40% indica una dispersión moderada en relación con la media. La asimetría positiva implica que hay algunos usuarios con tiempos de viaje significativamente más largos.

Percepción del Precio del Pasaje

  • Grafico de Barras
ggplot(TRANSPORTE,aes(VALOR,fill = VALOR))+
  geom_bar()+
  theme_classic()+
ggtitle("PERCEPCIÓN DEL PRECIO EN LOS ENCUESTADOS")+
  labs(x="Percepción de Precio", y= "Frecuencia", caption = "imagen 8")+
  theme(axis.title = element_text(size = 12,
                                  family = "mono"),
                    plot.title = element_text(size = 12,
                                              family = "mono"),
                   plot.caption = element_text(size = 8,
                                               family = "mono"))+
   guides(fill = guide_legend(title = "Grado de Percepción"))+
   scale_fill_manual(values=c("purple2","pink1","palevioletred"))

En este caso, podemos observar que la mayoría de los encuestados considera que el precio del boleto es “Alto”,algunos otros consideran que es un valor ” Adecuado” y pocos que el valor es “Muy Alto”.

Nivel de Satisfacción

  • Grafico de Barras
ggplot(data = TRANSPORTE, aes(SATISFACC))+
  geom_bar( color="#8B4789", fill="palevioletred1")+ 
  ggtitle('NIVEL DE SATISFACCIÓN ')+
  theme_classic()+
  labs(x= "Nivel", y = "Frecuencia",caption = "Imagen 9")+
  theme(axis.title = element_text(size = 12,
                                  color = "darkolivegreen",
                                  family = "mono"),
                      plot.title = element_text(size = 15,
                                  family = "mono"),
                      plot.caption = element_text(size = 10,
                                  color = "darkolivegreen",
                                  family = "mono"))+
  scale_x_discrete(limits = c("Muy.insatisfecho", "Insatisfecho", "Satisfecho"))

En la imagen 9 se puede apreciar que la mayoría de los usuarios están “insatisfechos” y “muy insatisfechos” con el servicio.Aunque existe una proporción significativa que expresa “satisfacción” con el servicio de transporte publico.

Frecuencia de Uso y Nivel de Satisfacción

  • Grafica de Barras Apiladas
ggplot(TRANSPORTE,aes(FREC, fill = SATISFACC))+
        geom_bar() +
  ggtitle('COMPARACIÓN DE LA FRECUENCIA DE USO CON EL NIVEL DE SATISFACCIÓN')+
  theme_classic()+
  labs(x= "Frecuencia de Uso Semanal", y = "Frecuencia",caption = "Imagen 10")+
  theme(axis.title = element_text(size = 10,
                                 family = "mono"),
                     plot.title = element_text(size = 10,
                                  family = "mono"),
                     plot.caption = element_text(size = 8,
                                  family = "mono"))+
  scale_fill_manual(values=c("purple2","pink1","palevioletred"))

En el grafico se puede notar que exite variedad de opiniones entre los usuarios más frecuente, ya que muestran tanto satisfacción como insatisfacción, con un predominio de los usuarios insatisfechos. Por otro lado podemos notar que los usuarios menos frecuentes del transporte público muestran más satisfacción con el servicio.

Conclusión

Los datos descriptivos muestran que la experiencia del transporte público en San Fernando del Valle de Catamarca es variada y depende en gran parte del contexto individual del usuario. La percepción del servicio, en términos de dificultades, es uniforme entre los géneros, lo que indica una experiencia compartida. El analisis muestra que uno de los aspectos más importantes para los usuarios es el tiempo de espera. Aunque los niveles de satisfacción son variados, la distribución de opiniones refleja que los usuarios que utilizan el transporte con mas frecuencia semanal se encuentran, en su mayoria, insatisfechos con el servicio y consideran que el precio del pasaje es alto.

Anexo

Enlace a la encuesta del trabajo https://docs.google.com/forms/d/e/1FAIpQLSeJzXItMKOd5N1v4jmCOi8BdO0GmvnYhPvARAEhFB1zoY0c9w/viewform?usp=sf_link