En las elecciones presidenciales de 2018 de Colombia se vivieron tensos debates acerca de las propuestas de cada uno de los candidatos que aspiraban al cargo de ser el primer mandatario del país. Para este análisis me conecte a la API de youtube mediante la librería vosonSML para extraer los comentarios del video titulado “Debate presidencial Colombia Decide | Noticias Caracol” e hice uso de 2 librerías más como syuzhet y sentimentr para analizar los comentarios y aquí los resultados.
La estructura de los datos extraidos del video de los cuales haremos uso de la columna Comment
Tomando la columna de lo comentarios del video, utilizamos get_sentences() para tokenizar y después aplicamos la función get_nrc_sentiment(), que implementa el léxico NRC Emotion de Saif Mohammad. Según Mohammad, “el léxico de emociones de NRC es una lista de palabras y sus asociaciones con ocho emociones (ira, miedo, anticipación, confianza, sorpresa, tristeza, alegría y disgusto) y dos sentimientos (negativos y positivos)”. En la siguiente visualización podemos ver tenemos una tendencia a positivismo pero no tan marcada debido a la cantidad de palabras que contiene el sentimiento negativo.
La siguiente es la nube de palabras del análisis de sentimentos por NRC, bajo el esquema de colores de la bandera de Colombia usando la librería wordcloud2
En la siguiente graficá se muestran las palabras más frecuenteS según un sentimiento positivo y negativo
En mi opinión, no veo una clara tendencia a ser negativo o positivo y además no estoy muy de acuerdo con las palabras clasificadas, estaré actualizando este informe a medida que conozca más clasificaciones como la Afinn o Bing.
Si quieres contactarte conmigo puede ser por el correo morales-martines19@hotmail.com o en mi perfil de Linkedin