L. Ojeda Machuca 1

A. Tarazona Gutierrez 1

1 Universidad Nacional Agraria La Molina

Introducción

El análisis del discurso político es clave para comprender la forma en que los candidatos comunican sus ideas y emociones, influenciando la percepción de los votantes. Este estudio explora la diversidad léxica y los sentimientos expresados durante el debate presidencial de las Elecciones 2006 en Perú, utilizando herramientas avanzadas de procesamiento de lenguaje natural. A través de técnicas de análisis léxico y de sentimientos, se destaca la utilidad de la ciencia de datos en la evaluación de discursos políticos, ofreciendo una perspectiva innovadora para entender la comunicación en el ámbito electoral.

Objetivos

El objetivo de este trabajo es analizar la diversidad léxica y los sentimientos expresados por los candidatos Alan García y Ollanta Humala en el debate para las Elecciones Presidenciales en el año 2006, identificar los temas abordados, así como los bigramas y las palabras más frecuentes usadas por cada uno de los candidatos.

Para este trabajo, se realizó la siguiente metodología:

Nube de palabras según candidato

Como se observa las palabras más frecuentes por parte del candidato Alan García fueron: “debe”, “gobierno” y “país”. Por otro lado, el candidato Ollanta Humala repitió más las palabras: “señor”, “García” y “vamos”.

Cuando se realizó un análisis de las palabras diferentes entre ambos candidatos, se observó que Alan García mencionó en sus intervenciones los temas de empleo, descentralización, agricultura. Mientras que Ollanta Humala tocó temas económicos (las palabras mencionadas fueron: “económico”, “económicos”, “presupuesto”)

Cantidad de palabras por caracter

El candidato Alan García durante el debate pronunció hasta palabras compuestas por 19 caracteres y con mayor frecuencia entre 7 y 8 caracteres. Mientras que Ollanta Humala pronunció palabras de máximo 17 caracteres, y si bien usó más palabras de 7 y 8 caracteres, lo hizo con menor frecuencia que Alan García.

Correlación entre diálogos

Se halló que entre ambos candidatos reflejan discursos similares (correlación de 0.531).

Diversidad de léxico

Se observó que Alan García tuvo en promedio una mayor diversidad léxica que Ollanta Humala lo que significa que presentaba un mayor vocabulario durante el debate.

Bigramas

Los bigramas son par de palabras que van juntos en una oración. En este caso, Alan García utilizó con mayor frecuencia los bigramas “debe ser”, “seguridad ciudadana” y “Alejandro Toledo”. Mientras que Ollanta Humala repitió más los bigramas “recursos naturales”, “señor García” y “seguridad ciudadana”.

Evolución del sentimiento durante el debate

El candidato Alan García empezó el debate con una tendencia a sentimientos negativos, sin embargo, al final del debate, terminó con palabras que expresan sentimientos positivos. Por el contrario, Ollanta Humala se mantuvo neutro en promedio a lo largo del debate.

Análisis de sentimientos

Ambos candidatos expresaron sentimientos positivos, en especial reflejaban confianza. En el caso de Alan García, se expresa más el sentimiento de premonición que el candidato Ollanta Humala. Mientras que este último, expresó mayores sentimientos negativos como la tristeza.

Conclusiones

El análisis de las palabras y sentimientos asociados en el debate presidencial entre Alan García y Ollanta Humala reveló diferencias en sus estilos de comunicación. Alan García demostró una mayor diversidad léxica, lo que sugiere un discurso más variado y complejo. Por otro lado, Ollanta Humala expresó mayores sentimientos negativos, lo cual podría haber influido en la percepción emocional de los votantes. Además, García abordó una mayor variedad de temas durante el debate, lo que indica una estrategia de comunicación más amplia y posiblemente más efectiva para captar la atención de diferentes segmentos del electorado. Para este análisis se utilizaron distintos paquetes de RStudio como: “tidytext”, “igraph”, “ggraph”, “stringi”, “udpipe”, “echarts4r”, “posterdown”.

Análisis del Debate para Elecciones presidenciales 2006