La idea de este artĂculo es mostrar algunas tecnicas Ăºtiles para el anĂ¡lisis de tweets. En esta ocasiĂ³n el objeto de estudio serĂ¡n figuras polĂticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los nĂºmeros de sus actividades en la red y la repercusiĂ³n de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo serĂ¡ primero abordar el anĂ¡lisis cuantitativo de los nĂºmeros que obtienen los mensajes de estas figuras, para lo cual elaboraremos una funciĂ³n que levantarĂ¡ las bases segĂºn el usuario deseado y limpiarĂ¡ la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a travĂ©s del paquete Rtweet git. El anĂ¡lisis de sentimiento se determinĂ³ mediante el diccionario SDAL
Con nuestra funciĂ³n corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.
La Base del usuario Greenpeacearg contiene un total de 3248 de tweets publicados desde 2019-06-02 hasta 2022-01-06.
Veamos ahora cual es la frecuencia de las interacciones segĂºn la hora del dĂa
Ahora agreguemos al anĂ¡lisis la desagregaciĂ³n segĂºn dispositivo
## Rows: 7
## Columns: 3
## $ source <chr> "Emplifi", "TweetDeck", "Twitter for Android", "Twitter for iPh~
## $ total <int> 916, 146, 48, 84, 7, 2024, 23
## $ prop <dbl> 28.2019704, 4.4950739, 1.4778325, 2.5862069, 0.2155172, 62.3152~
Tambien podemos ver los mensajes mas retuiteados y faveados
| status_id | text | favorite_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1410298522998652928 | <U+0001F389> LO LOGRAMOS <U+0001F389> ¡Argentina se convierte en el primer paĂs del mundo que prohĂbe la salmonicultura! Hace instantes, la Legislatura de Tierra del Fuego aprobĂ³ de forma unĂ¡nime la ley que prohĂbe la instalaciĂ³n de cualquier tipo de cultivo y producciĂ³n de salmones. https://t.co/Z5cWBD0p7c | 5654 | 2021-06-30 | https://twitter.com/GreenpeaceArg/status/1410298522998652938/photo/1 |
| status_id | text | retweet_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1303026679007379456 | <U+0001F534> ALERTA: Salta estĂ¡ por autorizar el desmonte de 500 hectĂ¡reas de Selva Pedemontana de Yungas para la construcciĂ³n de un country, violando la Ley de Bosques. Abrimos hilo <U+0001F447> https://t.co/FgIXmCx40G | 5039 | 2020-09-07 | https://twitter.com/GreenpeaceArg/status/1303026679007379457/photo/1 |
Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los tĂ©rminos de mayor uso mostrando su peso en relaciĂ³n a los otros.
Esta es la nube de palabras del año en Twitter de Greenpeacearg
Palabras positivas
Palabras negativas
Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente
| Palabra | Cantidad |
|---|---|
| ambiente | 119 |
| ambiental | 103 |
| residuos | 46 |
| basura | 33 |
| reciclaje | 7 |
| reciclar | 6 |