La idea de esta serie de publicaciones es mostrar algunas tecnicas útiles para el análisis de tweets. En esta ocasión el objeto de estudio serán instituciones políticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los números de sus actividades en la red y la repercusión de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo será primero abordar el análisis cuantitativo de los números que obtienen los mensajes de estas figuras, para lo cual elaboraremos una función que levantará las bases según el usuario deseado y limpiará la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a través del paquete Rtweet git. El análisis de sentimiento se determinó mediante el diccionario SDAL.
El trabajo se enmarca dentro del Proyecto de Investigación y Desarrollo en Áreas Estratégicas (PIDAE) “Separacion de residuos, desarrollo sustentable y políticas” en el cual ha investigado la comunicación en redes sociales de diferentes instituciones y figuras políticas, especialmente en temas referidos al desarrollo sustentable. La presente publicación es un aporte al proyecto por parte del Grupo de Investigación en Ciencia Política “Ciencia de Datos, Análisis de Redes y Gestión del Desarrollo Tecnológico” en el cual los investigadores en formación han podido aplicar las herramientas de análisis adquiridas en las capacitaciones del GICP, brindada a través de la plataforma La UNX, desarrollada por CETCOT - ACDES.
Con nuestra función corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.
La Base del usuario munimardelplata contiene un total de 3272 de tweets publicados desde 2020-01-06 hasta 2022-08-18.
Veamos ahora cual es la frecuencia de las interacciones según la hora del día
Ahora agreguemos al análisis la desagregación según dispositivo
## Rows: 5
## Columns: 3
## $ source <chr> "SocialGest", "TweetDeck", "Twitter for Android", "Twitter for …
## $ total <int> 18, 34, 154, 2970, 96
## $ prop <dbl> 0.5501222, 1.0391198, 4.7066015, 90.7701711, 2.9339853
Tambien podemos ver los mensajes mas retuiteados y faveados
| status_id | text | favorite_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1278761945257082880 | A partir de este viernes se retoma la actividad en las cafeter<ed>as de nuestra ciudad de 7 a 18. Es importante que sigamos siendo responsables, cumpliendo con las medidas de distanciamiento social, respetando un m<e1>ximo de 4 personas por mesa y usando el tapaboca al salir. https://t.co/BXXoLYsMA4 | 554 | 2020-07-02 | https://twitter.com/munimardelplata/status/1278761945257082880/photo/1 https://twitter.com/munimardelplata/status/1278761945257082880/photo/1 https://twitter.com/munimardelplata/status/1278761945257082880/photo/1 |
| status_id | text | retweet_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1238980784779866112 | Seguimos tomando medidas para evitar la propagaci<f3>n del coronavirus. En nuestra ciudad ya son m<e1>s de 60 las familias que se encuentran en cuarentena y esto nos lleva a tomar la decisi<f3>n de suspender las clases a partir del lunes hasta el 31 de marzo. https://t.co/skZ6U8ZH7S | 173 | 2020-03-15 | https://twitter.com/munimardelplata/status/1238980784779866112/video/1 |
Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los términos de mayor uso mostrando su peso en relación a los otros.
Esta es la nube de palabras del año en Twitter de munimardelplata
Palabras positivas
Palabras negativas
Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente
| Palabra | Cantidad |
|---|---|
| residuos | 106 |
| ambiente | 45 |
| basura | 36 |
| ambiental | 7 |
| reciclaje | 4 |
| reciclar | 2 |