Introducción

En este informe se presenta un análisis descriptivo de datos de publicaciones en redes sociales, enfocándose en cómo varían la actividad de publicación y el sentimiento expresado según el tiempo, la ubicación geográfica y la plataforma utilizada. Para ello, utilizamos un conjunto de datos de publicaciones con información sobre el texto, sentimiento clasificado, marca temporal, usuario, plataforma (Twitter, Instagram, Facebook), etiquetas, métricas de interacción (retweets, likes) y país de origen de la publicación.

Comenzaremos inspeccionando la estructura y contenido del conjunto de datos, luego realizaremos un procesamiento para estandarizar la columna de sentimiento en 12 macro-categorías emocionales definidas, y finalmente elaboraremos visualizaciones que nos permitan responder a la pregunta de investigación planteada.

Macro-categorías de sentimiento

Las macro-categorías de sentimiento se han definido para agrupar las emociones finas en categorías más generales. En este análisis usaremos 12 categorías macroemocionales propuestas, por ejemplo:

Alegría/Energía positiva (emociones de felicidad, entusiasmo, euforia, etc.).

Calma/Contentamiento (emociones de tranquilidad, paz, satisfacción, gratitud).

Amor/Afecto (emociones de amor, cariño, compasión, amistad).

Orgullo/Confianza (emociones de orgullo personal, logro, confianza, determinación).

Sorpresa/Asombro (emociones de sorpresa, asombro, admiración, curiosidad).

Ira/Frustración (emociones de enojo, frustración, odio, resentimiento).

Miedo/Ansiedad (emociones de temor, ansiedad, preocupación, estrés).

Tristeza/Depresión (emociones de tristeza, pena, melancolía, desesperanza).

Disgusto/Aversión (emociones de asco, aversión, desagrado, repulsión).

Vergüenza/Culpa (emociones de vergüenza, culpa, arrepentimiento).

Aburrimiento/Indiferencia (estados de apatía, indiferencia, aburrimiento).

Neutral (ausencia de emoción predominante o estado neutral)

Estas categorías nos permiten estandarizar y simplificar el análisis del sentimiento. Por ejemplo, sentimientos originalmente etiquetados como “Happy”, “Joy” o “Euphoria” se agrupan bajo Alegría/Energía positiva, mientras que “Anger” o “Frustration” se agrupan en Ira/Frustración, y así sucesivamente. De esta manera podemos comparar tendencias generales de sentimiento en lugar de analizar cada emoción específica por separado.

La pregunta central que guía este estudio es:

¿Cómo varía la actividad de publicación y el sentimiento expresado según el tiempo, la ubicación y la plataforma utilizada?

Esglosando esto, nos interesa explorar:

  • Variaciones temporales: por hora del día y por mes del año, ¿cuándo se publican más mensajes y cómo es el tono (positivo, negativo, neutral) de las publicaciones a distintas horas o meses?

  • Variaciones geográficas: ¿existen diferencias en el sentimiento promedio de las publicaciones según el país de origen?

  • Variaciones por plataforma: ¿ciertas plataformas (Twitter, Instagram, Facebook) tienden a tener un tono más positivo o más negativo en las publicaciones de sus usuarios?

A continuación, realizamos el análisis de datos para responder a estas cuestiones.

install.packages(“leaflet”)

install.packages(c( “tidyverse”, “lubridate”, “plotly”, “rnaturalearth”, “rnaturalearthdata” ))

## [1] 732  15
##  [1] "...1"       "Unnamed: 0" "Text"       "Sentiment"  "Timestamp" 
##  [6] "User"       "Platform"   "Hashtags"   "Retweets"   "Likes"     
## [11] "Country"    "Year"       "Month"      "Day"        "Hour"
## # A tibble: 5 × 14
##    ...1 Text      Sentiment Timestamp           User  Platform Hashtags Retweets
##   <dbl> <chr>     <chr>     <dttm>              <chr> <chr>    <chr>       <dbl>
## 1     0 "Enjoyin… Positive  2023-01-15 12:30:00 User… Twitter  #Nature…       15
## 2     1 "Traffic… Negative  2023-01-15 08:45:00 Comm… Twitter  #Traffi…        5
## 3     2 "Just fi… Positive  2023-01-15 15:45:00 Fitn… Instagr… #Fitnes…       20
## 4     3 "Excited… Positive  2023-01-15 18:20:00 Adve… Facebook #Travel…        8
## 5     4 "Trying … Neutral   2023-01-15 19:55:00 Chef… Instagr… #Cookin…       12
## # ℹ 6 more variables: Likes <dbl>, Country <chr>, Year <dbl>, Month <dbl>,
## #   Day <dbl>, Hour <dbl>

El resultado anterior muestra las primeras publicaciones en el dataset con sus atributos. Por ejemplo, vemos que la primera fila es una publicación cuyo texto expresa disfrute en el parque, etiquetada con sentimiento Positive, publicada el 15/01/2023 a las 12:30:00 por el usuario User123 en Twitter, con ciertos hashtags, 15 retweets, 30 likes, desde USA, etc.

## 
## Aburrimiento/Indiferencia  Alegría/Energía positiva               Amor/Afecto 
##                        27                       216                        37 
##      Calma/Contentamiento         Disgusto/Aversión           Ira/Frustración 
##                        88                         5                        51 
##            Miedo/Ansiedad                   Neutral         Orgullo/Confianza 
##                        16                        87                        52 
##          Sorpresa/Asombro        Tristeza/Depresión           Vergüenza/Culpa 
##                        54                        82                        17
## 
## Negativo  Neutral Positivo 
## 27.04918 19.26230 53.68852

(El resultado de arriba sugiere que aproximadamente 58% de las publicaciones en el conjunto de datos tienen sentimiento positivo, 30% negativo y 12% neutral. La categoría macro más frecuente es Alegría/Energía positiva, seguida a distancia por categorías negativas como Tristeza/Depresión o Ira/Frustración, lo cual indica que en general el tono de las publicaciones es predominantemente positivo.)

A continuación, realizamos análisis gráficos para cada aspecto de interés:

Publicaciones por hora del día (sentimiento apilado)

Para entender la actividad a lo largo del día, agrupamos las publicaciones por hora (Hour) y visualizamos cuántas publicaciones se realizan en cada hora. Además, apilamos las barras por tipo de sentimiento amplio (positivo, negativo o neutral) para ver la composición de sentimiento en cada franja horaria.

En el gráfico, cada barra muestra cuántas publicaciones se hicieron por hora y cómo se distribuyen en positivas, negativas y neutrales. Se observa un patrón diario claro: hay muy poca actividad en la madrugada (0–6) y el volumen aumenta desde la mañana, con picos en la tarde (14:00–15:00) y al inicio de la noche (18:00–20:00).

En cuanto al sentimiento, predomina lo positivo en todas las horas, pero con variaciones leves: a media mañana (9–10) y hacia finales de la noche (21–22) aparece una mayor proporción relativa de publicaciones negativas frente a otras horas. En cambio, cerca del mediodía (12–13) el tono tiende a ser más positivo. En conjunto, las diferencias por hora existen, pero son sutiles y no cambian el predominio general del sentimiento positivo.

El gráfico indica que, en el Top 20 por volumen, la mayoría de países tienen un sentimiento promedio positivo (puntos a la derecha de la línea 0), así que en general predominan más publicaciones positivas que negativas. Sin embargo, el análisis está fuertemente influido por los países con burbujas más grandes —principalmente USA, Canadá y UK— porque concentran la mayor cantidad de publicaciones.

También se ve que algunos países como Portugal, Dinamarca y Austria aparecen con promedios muy altos (cercanos a 1), pero sus burbujas son pequeñas, lo que sugiere poca muestra y por tanto esos valores pueden ser menos estables. En contraste, España destaca por ubicarse claramente a la izquierda de 0, indicando un sentimiento promedio negativo en esa muestra. El resto de países se agrupa en un rango positivo moderado, sin valores extremos.

El gráfico muestra que Facebook, Instagram y Twitter tienen distribuciones de sentimiento casi idénticas en este dataset: cerca de 57–58% positivas, alrededor de 30% negativas y 12–13% neutrales. Instagram presenta una ligera mayor proporción de neutrales, pero la diferencia es mínima.

Aunque suele asumirse que Twitter es más negativa, aquí no se observa una brecha frente a Instagram o Facebook. Es posible que con otros datos o mayor volumen aparezcan diferencias por plataforma, pero en esta muestra predominan los mensajes positivos y aproximadamente un tercio son negativos.

Algunas observaciones:

Desde una perspectiva temporal, la actividad de publicación depende fuertemente de la hora del día. La cantidad de publicaciones es menor durante la madrugada y aumenta progresivamente a lo largo del día, alcanzando sus picos en la tarde y primeras horas de la noche. En términos de sentimiento, el tono positivo predomina en todas las horas, aunque se observan ligeros incrementos de negatividad en momentos como la media mañana y la noche, en contraste con horas de mediodía o tarde temprana, donde el contenido tiende a ser más positivo. Esto sugiere la influencia de ritmos diarios y contextos cotidianos (estrés matutino, consumo de noticias nocturnas, o relajación tras la jornada laboral).

En cuanto a la variación geográfica, se observan diferencias moderadas entre países, pero en ninguno de los analizados el sentimiento promedio resulta negativo. En todos predomina un tono ligeramente positivo, con países como India o Australia mostrando una inclinación mayor hacia emociones positivas, mientras que otros como Reino Unido o Canadá presentan un perfil más equilibrado, aunque igualmente positivo en promedio. Estas diferencias pueden reflejar factores culturales o particularidades de la muestra, más que patrones universales.

CONCLUSIONES

Integrando los resultados, se concluye que la actividad en redes sociales sigue ritmos diarios bien definidos y presenta un sesgo general hacia la positividad emocional, independientemente del país o la plataforma utilizada. Aunque cerca de un tercio del contenido es negativo, las expresiones positivas son más frecuentes en todos los ejes analizados. La hipótesis de que ciertas plataformas son intrínsecamente más “tóxicas” no encuentra respaldo en este dataset; más bien, el individuo, el contexto y la temática de las publicaciones parecen tener un peso mayor que la plataforma en sí. Este análisis exploratorio sienta bases para estudios futuros que profundicen en las causas de estos patrones, incorporando variables como temáticas, eventos específicos o características demográficas, así como datasets más amplios y recientes.