La idea de este artĂculo es mostrar algunas tecnicas Ăºtiles para el anĂ¡lisis de tweets. En esta ocasiĂ³n el objeto de estudio serĂ¡n figuras polĂticas relevantes con la idea de explorar su comportamiento en Twitter explorando por un lado los nĂºmeros de sus actividades en la red y la repercusiĂ³n de sus mensajes y, por el otro, las palabras utilizadas para conformar el mensaje que desean emitir. En este orden de ideas, la dinamica de trabajo serĂ¡ primero abordar el anĂ¡lisis cuantitativo de los nĂºmeros que obtienen los mensajes de estas figuras, para lo cual elaboraremos una funciĂ³n que levantarĂ¡ las bases segĂºn el usuario deseado y limpiarĂ¡ la misma. Las bases de trabajo fueron conformadas mediante la descarga de tweets a travĂ©s del paquete Rtweet git. El anĂ¡lisis de sentimiento se determinĂ³ mediante el diccionario SDAL
Con nuestra funciĂ³n corriendo es posible levantar las bases que previamente tenemos configuradas en nuestra carpeta de trabajo. Ahora analizaremos el dataset graficando algunos valores descriptivos.
La Base del usuario juancabandie contiene un total de 3245 de tweets publicados desde 2016-04-14 hasta 2022-01-04.
Se aprecia una fuerte actividad en los primeros meses del año que decae en junio para recomponerse en los Ăºltimos meses del año. Veamos ahora cual es la frecuencia de las interacciones segĂºn la hora del dĂa
Ahora agreguemos al anĂ¡lisis la desagregaciĂ³n segĂºn dispositivo
## Rows: 4
## Columns: 3
## $ source <chr> "Twitter for Android", "Twitter for iPhone", "Twitter Web App",~
## $ total <int> 1178, 1832, 2, 233
## $ prop <dbl> 36.30200308, 56.45608629, 0.06163328, 7.18027735
Tambien podemos ver los mensajes mas retuiteados y faveados
| status_id | text | favorite_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1384202576690761728 |
Ayer, 3 horas antes de la conferencia de prensa, @horaciorlarreta le pidiĂ³ a @carlavizzotti 60 respiradores porque la ciudad tiene su terapia intensiva colapsada. A pesar de esto, el jefe de gobierno siguiĂ³ jugando a la polĂtica electoral con alumnas, alumnos y docentes de CABA. |
6695 | 2021-04-19 |
| status_id | text | retweet_count | Fecha_corta | ext_media_expanded_url |
|---|---|---|---|---|
| 1384202576690761728 |
Ayer, 3 horas antes de la conferencia de prensa, @horaciorlarreta le pidiĂ³ a @carlavizzotti 60 respiradores porque la ciudad tiene su terapia intensiva colapsada. A pesar de esto, el jefe de gobierno siguiĂ³ jugando a la polĂtica electoral con alumnas, alumnos y docentes de CABA. |
3865 | 2021-04-19 |
Una buena manera de representar las palabras utilizadas consiste en conformar las nubes de palabras o bag of words. Basicamente se trata de visualizar cuales son los tĂ©rminos de mayor uso mostrando su peso en relaciĂ³n a los otros.
Esta es la nube de palabras del año en Twitter de juancabandie
Palabras positivas
Palabras negativas
Finalmente agregamos un cuadro resumen con la cantidad de palabras utilizadas vinculadas al medio ambiente
| Palabra | Cantidad |
|---|---|
| ambiental | 207 |
| residuos | 99 |
| ambiente | 98 |
| reciclar | 9 |
| reciclaje | 7 |
| basura | 5 |