La idea de este artĂculo es mostrar algunas tecnicas Ăºtiles para el anĂ¡lisis de tweets. En esta ocasiĂ³n el objeto de estudio serĂ¡n figuras polĂticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los nĂºmeros de sus actividades en la red y la repercusiĂ³n de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo serĂ¡ primero abordar el anĂ¡lisis cuantitativo de los nĂºmeros que obtienen los mensajes de estas figuras, para lo cual elaboraremos una funciĂ³n que levantarĂ¡ las bases segĂºn el usuario deseado y limpiarĂ¡ la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a travĂ©s del paquete Rtweet git. El anĂ¡lisis de sentimiento se determinĂ³ mediante el diccionario SDAL
Con nuestra funciĂ³n corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.
La Base del usuario gestion_a contiene un total de 3250 de tweets publicados desde 2020-10-19 hasta 2022-01-03.
Veamos ahora cual es la frecuencia de las interacciones segĂºn la hora del dĂa
Ahora agreguemos al anĂ¡lisis la desagregaciĂ³n segĂºn dispositivo
## Rows: 3
## Columns: 3
## $ source <chr> "TweetDeck", "Twitter for Android", "Twitter Web App"
## $ total <int> 181, 2806, 263
## $ prop <dbl> 5.569231, 86.338462, 8.092308
Tambien podemos ver los mensajes mas retuiteados y faveados
| status_id | text | favorite_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1332416337394737152 |
El trabajo de años que impulsĂ³ @MSierraDiputada hoy se vuelve una realidad. El @SenadoArgentina lo convirtiĂ³ en Ley y ya podemos decir orgullosamente que somos la #CapitalNacionalDelFĂºtbol Nuestra historia y la gloria de los clubes de #Avellaneda lo merecen. https://t.co/9yWb8DfrRG |
110 | 2020-11-27 | https://twitter.com/gestion_a/status/1332416337394737152/photo/1 |
| status_id | text | retweet_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1349017084949372928 |
#BuenosAiresVacunate es el plan pĂºblico, gratuito y optativo de vacunaciĂ³n contra el coronavirus en la Provincia Inscribite en este enlace: https://t.co/2k0wczUqru o acercate y anotate en la Unidad Sanitaria de #Avellaneda mĂ¡s cercana a tu domicilio. #SigamosCuidandonos https://t.co/ObCpmYLpoC |
33 | 2021-01-12 | https://twitter.com/gestion_a/status/1349017084949372933/photo/1 https://twitter.com/gestion_a/status/1349017084949372933/photo/1 https://twitter.com/gestion_a/status/1349017084949372933/photo/1 https://twitter.com/gestion_a/status/1349017084949372933/photo/1 |
Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los tĂ©rminos de mayor uso mostrando su peso en relaciĂ³n a los otros.
Esta es la nube de palabras del año en Twitter de gestion_a
Palabras positivas
Palabras negativas
Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente
| Palabra | Cantidad |
|---|---|
| ambiente | 24 |
| residuos | 18 |
| reciclaje | 11 |
| ambiental | 10 |
| basura | 8 |
| reciclar | 7 |