Data Analytics con R - EANT

Trabajo Final

“Hacia una nueva tendencia de transporte: la bicicleta como vehículo complementario en el sistema de transporte público en la ciudad de Buenos Aires”

Grupo 6: Gonzalo Cerqueiro, Germán Driemel, Mariana Greco, Matías Martínez, Federico Mazza



Durante la pandemia del COVID-19 el transporte público se vio sustancialmente alterado debido a la reducción de su capacidad impuesta por el distanciamiento social, conllevando a usos alternativos de medios de desplazamiento en la ciudad como la bicicleta. Conocer la modificación del comportamiento del ciudadano, impulsado por un efecto externo como el COVID-19, podría ser una herramienta para el diseño de políticas públicas que mejoren el sistema de transporte público.


“IDEAL”:Sumar más bicicletas en las estaciones/zonas de mayor demanda con perspectiva post-pandemia

Sin embargo, al analizar los datasets correspondientes a los recorridos realizados durante los años 2019 y 2020, se encontró que hubo una reducción en la cantidad de estaciones disponibles:

Año N°de estaciones
2019 396
2020 188

En consecuencia, en el presente trabajo se decidió analizar la interacción entre los usuarios de las bicicletas públicas y gratuitas del Gobierno de la Ciudad de Buenos Aires y la cuenta oficial de Twitter “BAecobici”, ya que la información obtenida en base a este análisis puede ser utilizada para mejorar y optimizar el servicio.


“Análisis de texto y opinión de la cuenta de Twitter @BAecobici

El análisis del contenido de los tweets permite establecer cuáles son son las quejas más frecuentes y sugerencias de los usuarios.

El período de muestreo abarca cuatro semanas:

Semana Fecha
1 28-09-2020 / 06-10-2020
2 07-10-2020 / 13-10-2020
3 14-10-2020 / 20-10-2020
4 21-10-2020 / 27-10-2020

Cantidad de tweets de @BAecobici por semana

##     semana  n
## 1 semana 1 42
## 2 semana 2 16
## 3 semana 3 15
## 4 semana 4 12

Cantidad de tweets de los usuarios por semana

##     semana   n
## 1 semana 1 255
## 2 semana 2  88
## 3 semana 3  94
## 4 semana 4  72

Cantidad de tweets por día de los usuarios en el período muestreado

Tweets de usuarios por día

Tweets filtrados

Se excluye adicionalmente tweets sobre el Día de la Educación Vial

Tweets de @BAecobici por día

Bigrams más frecuentes

Wordcloud de unigrams

Wordcloud de bigrams

Red semántica de bigrams

Análisis de opinión de los usuarios

Conclusiones

Se realizó un trabajo de análisis de opinión, basado en los tweets descargados con Python a un csv, y posteriormente analizados con RStudio. Se determinó y comparó la cantidad de estaciones disponibles durante el año 2019 y el año 2020, se analizó la cantidad de tweets por día y por semana, se realizó el análisis de unigrams, bigrams y de polarización. Encontramos que en ocasiones fue necesario filtrar determinados usuarios y bigrams para obtener una mejor comprensión de la información adquirida.

Las conclusiones puntuales son las siguientes:

* Se debe mejorar la aplicación

* Solucionar problemas vinculados a la tarjeta de crédito