Presentación

La idea de esta serie de publicaciones es mostrar algunas tecnicas útiles para el análisis de tweets. En esta ocasión el objeto de estudio serán instituciones políticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los números de sus actividades en la red y la repercusión de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo será primero abordar el análisis cuantitativo de los números que obtienen los mensajes de estas figuras, para lo cual elaboraremos una función que levantará las bases según el usuario deseado y limpiará la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a través del paquete Rtweet git. El análisis de sentimiento se determinó mediante el diccionario SDAL.

El trabajo se enmarca dentro del Proyecto de Investigación y Desarrollo en Áreas Estratégicas (PIDAE) “Separacion de residuos, desarrollo sustentable y políticas” en el cual ha investigado la comunicación en redes sociales de diferentes instituciones y figuras políticas, especialmente en temas referidos al desarrollo sustentable. La presente publicación es un aporte al proyecto por parte del Grupo de Investigación en Ciencia Política “Ciencia de Datos, Análisis de Redes y Gestión del Desarrollo Tecnológico” en el cual los investigadores en formación han podido aplicar las herramientas de análisis adquiridas en las capacitaciones del GICP, brindada a través de la plataforma La UNX, desarrollada por CETCOT - ACDES.

Descriptivos

Con nuestra función corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.

La Base del usuario SanFerMunicipio contiene un total de 3244 de tweets publicados desde 2017-03-18 hasta 2022-08-18.

Veamos ahora cual es la frecuencia de las interacciones según la hora del día

Ahora agreguemos al análisis la desagregación según dispositivo

## Rows: 8
## Columns: 3
## $ source <chr> "Buffer", "Google", "Hootsuite Inc.", "Twitter for Advertisers.…
## $ total  <int> 1450, 3, 61, 1, 579, 133, 631, 386
## $ prop   <dbl> 44.69790382, 0.09247842, 1.88039457, 0.03082614, 17.84833539, 4…

Tambien podemos ver los mensajes mas retuiteados y faveados

status_id text favorite_count Fecha_corta ext_media_expanded_url
962469938626744320 .@MicaViciconte es la primera invitada del #GranCorsoSanfer! <U+0001F600><U+0001F389> https://t.co/1zznBYlgZs 369 2018-02-10 https://twitter.com/SanFerMunicipio/status/962469938626744321/video/1
status_id text retweet_count Fecha_corta ext_media_expanded_url
962469938626744320 .@MicaViciconte es la primera invitada del #GranCorsoSanfer! <U+0001F600><U+0001F389> https://t.co/1zznBYlgZs 269 2018-02-10 https://twitter.com/SanFerMunicipio/status/962469938626744321/video/1

Nube de palabras

Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los términos de mayor uso mostrando su peso en relación a los otros.

Esta es la nube de palabras del año en Twitter de SanFerMunicipio

Palabras positivas

Palabras negativas

Captura de tweet con mayor cantidad de favs:

Captura de tweet con mayor cantidad de rt:


Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente


Palabra Cantidad
basura 23
reciclaje 19
ambiente 16
residuos 15
reciclar 8
ambiental 1