El Procesamiento del lenguaje natutal, conocido por su sigla en inglés como NLP es un campo de estudio, donde se involucra la Inteligencia Artificial y la Ciencia de Datos, que estudia las interacciones entre el computador y el lenguaje humano. Este conjunto de técnicas y algoritmos permiten realizar, entre varias tareas, análisis de sentimientos. Para este análisis se utilizó información obtenida a través de Twitter, de la cuenta de un noticiero.
.
En este análisis se consideró agrupar los contenidos publicados según el número de retweets, esta agrupación se hizo calculando el percentil 33 y 66, definiendo las categorías: bajo, medio y alto.
##
## alto bajo medio
## 0.3101089 0.3421462 0.3477449
En esta ocasión se consideraron las palabras del grupo de alto número de retweets que se estudiaron en el análisis de sentimiento.
La matriz de distancia se construyó utilizando la distancia de Jaro-Winkler. Se observa, por ejemplo, una similitud entre Cuarenta y vacuna, estas palabras forman un clúster, al igual que corrupción y revolución.
Se presenta otro ejemplo, esta vez utilizando la distancia de Levenshtein sobre el grupo de cantidad media de retweets.
Los resultados son similares a los del grupo anterior, altos.