Resumen

El Procesamiento del lenguaje natutal, conocido por su sigla en inglés como NLP es un campo de estudio, donde se involucra la Inteligencia Artificial y la Ciencia de Datos, que estudia las interacciones entre el computador y el lenguaje humano. Este conjunto de técnicas y algoritmos permiten realizar, entre varias tareas, análisis de sentimientos. Para este análisis se utilizó información obtenida a través de Twitter, de la cuenta de un noticiero.

.

En este análisis se consideró agrupar los contenidos publicados según el número de retweets, esta agrupación se hizo calculando el percentil 33 y 66, definiendo las categorías: bajo, medio y alto.

Segmentación de datos (%)

## 
##      alto      bajo     medio 
## 0.3101089 0.3421462 0.3477449

Palabras más frecuentes, segmentadas por cantidad de retweets.

Nube de palabras del contenido publicado.

Análisis de sentimiento.

_________ Contenido General. _________

Según categoría de cantidad de retweets.

_________- Bajo -__________

_______- Medio -________

_______- Alto.-_______

_____-Sentimientos a nivel global.-______

Análisis con métricas de similitud.

En esta ocasión se consideraron las palabras del grupo de alto número de retweets que se estudiaron en el análisis de sentimiento.

La matriz de distancia se construyó utilizando la distancia de Jaro-Winkler. Se observa, por ejemplo, una similitud entre Cuarenta y vacuna, estas palabras forman un clúster, al igual que corrupción y revolución.

Se presenta otro ejemplo, esta vez utilizando la distancia de Levenshtein sobre el grupo de cantidad media de retweets.

Los resultados son similares a los del grupo anterior, altos.