La idea de esta serie de publicaciones es mostrar algunas tecnicas útiles para el análisis de tweets. En esta ocasión el objeto de estudio serán instituciones políticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los números de sus actividades en la red y la repercusión de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo será primero abordar el análisis cuantitativo de los números que obtienen los mensajes de estas figuras, para lo cual elaboraremos una función que levantará las bases según el usuario deseado y limpiará la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a través del paquete Rtweet git. El análisis de sentimiento se determinó mediante el diccionario SDAL.
El trabajo se enmarca dentro del Proyecto de Investigación y Desarrollo en Áreas Estratégicas (PIDAE) “Separacion de residuos, desarrollo sustentable y políticas” en el cual ha investigado la comunicación en redes sociales de diferentes instituciones y figuras políticas, especialmente en temas referidos al desarrollo sustentable. La presente publicación es un aporte al proyecto por parte del Grupo de Investigación en Ciencia Política “Ciencia de Datos, Análisis de Redes y Gestión del Desarrollo Tecnológico” en el cual los investigadores en formación han podido aplicar las herramientas de análisis adquiridas en las capacitaciones del GICP, brindada a través de la plataforma La UNX, desarrollada por CETCOT - ACDES.
Con nuestra función corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.
La Base del usuario SanFerMunicipio contiene un total de 3244 de tweets publicados desde 2017-03-18 hasta 2022-08-18.
Veamos ahora cual es la frecuencia de las interacciones según la hora del día
Ahora agreguemos al análisis la desagregación según dispositivo
## Rows: 8
## Columns: 3
## $ source <chr> "Buffer", "Google", "Hootsuite Inc.", "Twitter for Advertisers.…
## $ total <int> 1450, 3, 61, 1, 579, 133, 631, 386
## $ prop <dbl> 44.69790382, 0.09247842, 1.88039457, 0.03082614, 17.84833539, 4…
Tambien podemos ver los mensajes mas retuiteados y faveados
| status_id | text | favorite_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 962469938626744320 | .@MicaViciconte es la primera invitada del #GranCorsoSanfer! <U+0001F600><U+0001F389> https://t.co/1zznBYlgZs | 369 | 2018-02-10 | https://twitter.com/SanFerMunicipio/status/962469938626744321/video/1 |
| status_id | text | retweet_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 962469938626744320 | .@MicaViciconte es la primera invitada del #GranCorsoSanfer! <U+0001F600><U+0001F389> https://t.co/1zznBYlgZs | 269 | 2018-02-10 | https://twitter.com/SanFerMunicipio/status/962469938626744321/video/1 |
Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los términos de mayor uso mostrando su peso en relación a los otros.
Esta es la nube de palabras del año en Twitter de SanFerMunicipio
Palabras positivas
Palabras negativas
Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente
| Palabra | Cantidad |
|---|---|
| basura | 23 |
| reciclaje | 19 |
| ambiente | 16 |
| residuos | 15 |
| reciclar | 8 |
| ambiental | 1 |