Este proyecto aplica minería de texto al discurso presidencial de Gustavo Petro (2022–oct. 2025), usando tidytext y datos extraídos por web scraping desde la página oficial de la Presidencia. A través de visualizaciones como:
🔹 Top 20 términos
🔹 Nube de palabras
🔹 Ley de Zipf
🔹 N-gramas
🔹 Mapa semántico
🔹 Fases del discurso
🔹 Emociones y sentimiento
🔹 Tendencias temporales
🔹 Comparativos anuales
🔹 Hitos por fecha
se examinan patrones temáticos y emocionales para entender la evolución del discurso en el tiempo.
El gráfico muestra las palabras más frecuentes en los discursos (2022–2025). “Colombia” domina ampliamente, indicando un enfoque constante en el país. También destacan términos como “hoy”, “mundo” y “gobierno”, reflejando temas coyunturales y narrativas de contexto nacional.
La nube evidencia las palabras más usadas en los discursos; el tamaño indica mayor frecuencia. Predominan conceptos relacionados con país, acción y tiempo presente, lo que sugiere énfasis en transformación, contexto global y orientación hacia el ahora.
La gráfica muestra que la relación entre frecuencia y ranking sigue la tendencia esperada por la Ley de Zipf. Esto confirma que los discursos forman un corpus lingüístico natural y coherente, adecuado para procesos robustos de minería de texto y modelamiento estadístico.
Los n-gramas revelan la estructura profunda del discurso presidencial. Los bigramas muestran ejes simbólicos como vida, humanidad y pueblo. Los trigramas y tetragramas amplían estos marcos hacia lo institucional, histórico y climático. Los pentagramas y hexagramas consolidan lemas como potencia mundial de la vida y referencias a organismos internacionales. En conjunto, los n-gramas evidencian una narrativa coherente centrada en vida, territorio, memoria y legitimidad estatal.
Los bigramas muestran los conceptos núcleo del discurso. “La vida” y “la humanidad” sugieren una narrativa bioética y civilizatoria, mientras “el pueblo” y “la tierra” refuerzan una retórica comunitaria y territorial. Estos pares revelan los ejes simbólicos sobre los que se articula el mensaje presidencial.
Los trigramas permiten observar transiciones semánticas más precisas. “De la vida” conecta con un marco moral, mientras “de la república” ancla el discurso en legitimidad institucional. La presencia recurrente de “la crisis climática” evidencia una preocupación estructural que atraviesa múltiples intervenciones.
Los tetragramas revelan construcción de memoria y legitimidad histórica. El énfasis en “la historia de Colombia” y en la “constitución del 91” muestra un esfuerzo por contextualizar decisiones actuales en narrativas de largo plazo. También aparecen marcos institucionales (“estado social de derecho”) y problemáticas globales (“la crisis climática”).
Los pentagramas introducen eslóganes políticos. “Potencia mundial de la vida” opera como lema articulador del proyecto gubernamental. Frases como “la vida en el planeta” o “el país de la belleza” consolidan una identidad aspiracional que mezcla ecología, estética nacional y posicionamiento internacional.
Los hexagramas capturan formulaciones completas del relato presidencial. La repetición de “una potencia mundial de la vida” muestra una narrativa identitaria sostenida. Otros hexagramas aluden a organismos internacionales, seguridad y derechos humanos, lo que revela la dimensión diplomática y jurídica del discurso.
La gráfica muestra cómo varía el peso de los principales ejes del discurso presidencial a lo largo del tiempo. 📊 Transición Energética destaca por picos altos y recurrentes, evidenciando su centralidad en la narrativa gubernamental. 🌿 Reforma Agraria mantiene presencia estable, aunque con fluctuaciones asociadas a coyunturas políticas. 💧 Agua y Vida inicia fuerte y desciende gradualmente, mientras 🟣 Agenda Social/Pueblo crece de forma sostenida hacia 2025. 🔴 Paz Total presenta variaciones más irregulares. En conjunto, la curva muestra un discurso dinámico que responde a momentos críticos y prioridades estratégicas del gobierno.
El mapa semántico muestra cómo se agrupan las palabras según su coocurrencia en los discursos. 🔍 Los nodos más densos revelan temas estructurales como paz, campesinado, energía, agua, crisis climática y agenda social. 🌐 La cercanía entre términos evidencia relaciones conceptuales estables: el campo y la reforma agraria se conectan con transición energética; mientras que paz total se vincula con seguridad, víctimas y territorio. 📌 En conjunto, el mapa expone la arquitectura conceptual del discurso y las redes temáticas que sostienen la narrativa presidencial.
La gráfica muestra la prevalencia de emociones según el diccionario NRC. La emoción dominante es confianza, lo que refleja un tono orientado a la legitimidad, la seguridad y la construcción de credibilidad. 🟢 Le siguen miedo y anticipación, indicando un discurso que combina advertencias sobre riesgos con proyecciones de futuro. 😔 Tristeza, ira y aversión aparecen en niveles moderados, asociados a denuncias o críticas coyunturales. En conjunto, el espectro emocional revela un discurso mixto: mayormente afirmativo, pero atravesado por tensiones y alertas estructurales.
La gráfica identifica las palabras que más influyen en la polaridad emocional del discurso. 🔴 En el polo negativo destacan gobierno, violencia, crisis climática, pobreza y muerte, términos asociados a denuncias, problemáticas estructurales y llamados de alerta. 🟢 En el polo positivo predominan humanidad, tierra, acuerdo, paz y justicia, conceptos vinculados a proyectos colectivos, reconciliación y visión de futuro. En conjunto, el discurso alterna entre señalar riesgos y proponer horizontes transformadores, lo que configura una retórica dual: crítica y esperanzada a la vez.
La gráfica muestra cómo cambia el sentimiento neto de los discursos entre 2023 y 2025. 📉 Se observa una tendencia general a la baja: el tono inicia más optimista en 2023, pero desciende gradualmente hasta llegar a niveles más moderados e incluso cercanos al umbral neutro en 2025. 🔄 Las oscilaciones puntuales reflejan momentos coyunturales que generan repuntes o caídas en el ánimo presidencial. 📊 La curva suavizada evidencia un desgaste sostenido en el tono emocional, sugiriendo que los discursos se vuelven más cautos, críticos o defensivos con el paso del tiempo.
La comparación revela un giro claro hacia temas ambientales y globales. 🌍 En 2024 aumentan palabras como mundo, agua, el agua, inteligencia artificial, lo que sugiere mayor énfasis en visión global, ecosistemas y tecnología. Paralelamente, descienden términos asociados a justicia social y estructura institucional (la educación, la juventud, la sociedad, justicia), indicando un desplazamiento del foco social hacia uno más ambiental y tecnopolítico. Este cambio refleja una agenda discursiva más orientada a desafíos planetarios y transformaciones estructurales.
Entre 2024 y 2025 emerge un cambio más político y geopolítico. 🟥 Suben con fuerza términos como Colombia, Estados Unidos, Catatumbo, narcotráfico, salud, lo que evidencia un discurso más centrado en soberanía, seguridad territorial y conflictos internos. 🟦 En contraste, caen palabras asociadas a ambiente y territorio (mundo, poder, agua, crisis climática, el agua, la tierra), señalando un alejamiento parcial de la retórica ecológica dominante en años previos. El discurso 2025 se vuelve más reactivo, nacional y orientado a problemáticas internas.
La comparación entre efemérides revela cómo el discurso presidencial adapta su foco según el significado de cada fecha. 🇨🇴 El 1 de mayo enfatiza pueblo, acuerdo y trabajo, coherente con su carácter laboral. ⚔️ El 19 de abril destaca fuerzas militares, comando y guerras, vinculándose a memoria insurgente y seguridad. 🏛️ El 20 de julio gira hacia crédito, pobreza y economía, temas centrales en la agenda legislativa. 🕊️ El 6-7 de noviembre resalta vida, colapso climático y EPS, mezclando memoria histórica con crisis sociales. Finalmente, el 7 de agosto se orienta a ejército, seguridad, república, reforzando símbolos de poder estatal. En conjunto, la agenda simbólica muestra un discurso que utiliza las fechas históricas para reforzar narrativas específicas según el contexto político y emocional de cada conmemoración.
La distribución regional muestra cómo el discurso se adapta según la escala territorial. 🌐 En la Agenda Internacional predominan Colombia, mundo, humanidad y crisis climática, proyectando una narrativa globalista y diplomática. 🏔️ En la región Andina, temas como gobierno, poder y vida social indican un énfasis administrativo y político. 🌊 En el Pacífico y Sur, emergen territorio, pueblo y gente, reflejando preocupaciones históricas de desigualdad y presencia estatal. 🌴 En el Caribe, aparecen mar, tierra y La Guajira, evidenciando prioridades ambientales y energéticas. En conjunto, el discurso se territorializa, modulando su foco según las problemáticas y símbolos de cada región.