1 Introduccion

El contexto politico y social del Peru se vio agudizado como consecuencia de la renovacion de la Ley de Promocion Agraria promulgada por el ex-presidente Martin Vizcarra. Durante la ultima semana del mes de Noviembre y primeras semanas del mes de Diciembre del 2020, los conflictos sociales se agrabaron llegando a medidas extremas por parte de los trabajadores agrarios que reclamaban mejoras en los pagos y derechos fundamentales que la renovacion de la ley no les brindaba.

La importancia de poder analizar las noticias en relacion a las frases como: Reforma Agraria, Paro Agrario, Paro Rural entre otras frases, se vuelve relevante observar y analizar las noticias impartidas por los princiaples diarios en el medio peruano (El comercio, Gestion y RRP noticias).

Por tanto, el objetivo principal del presente reporte busca analizar a traves del analisis de Proceso de Lenguaje Natural (PLN) las noticias relacionadas en base la Ley de Promocion de la Reforma Agraria.

2 Proceso de Informacion de noticias

Se analizara el trabajo de texto para el presente trabajo en base a la secuencia de la imagen presentada lineas abajo.Se observa como primer paso definir un objetivo planteado, luego del cual se lleva a cabo la extracion de la informacion (estado no organizado), para el cual se realizara la tecnica de web-scrapping a fin de procesar las noticias emitidas por los titulares del mismo. El siguiente paso es poder realizar la organizacion , extracion de caracteriscas correspondiente a la informacion , para dicho caso seran los titulares y descripcion de la noticia. Por ultimo peor no menos importante, se realiza el analisis de la informacion y las recomendaciones producto del analisis realizados.

2.1 Pre-procesamiento

El primer paso del trabajo, se fundamento en la extraccion de las noticias refereidas a la frase Reforma Agraria y Paro Agrario. Para cumplir dichoobjetivo se implemento la tecnica de web-scrapping utilizando el software R. Las frases fueron estraidas a traves de los titulares de los diarios como: El comercio Peru, Diario Gestion y RPP Noticias, este ultimo a traves de la pagina web de los titulares del mismo.

La etapa de extraccion de informacion se realiza a traves de la construccion de una funcion (implementado en R software), el cual pueda extraer la informacion de las paginas web de los principales diarios bajo analisis, se utiliza R software para el proceso de automatizacion de web-scrapping.

noticiasRADF = obtieneNoticiasBusqueda(busqueda = "ley de promocion agraria")
noticiasPADF = obtieneNoticiasBusqueda(busqueda = "Paro agrario")

# Diarios
Diarios = c("El Comercio Peru", "Diario Gestion", "RPP Noticias")

3 Analisis de informacion

3.1 Nube de palabras

Luego de pre-procesamiento, dar un formato tidy a los datos, tokenizar, remover stopwords y lematizar se procedera a realizar un analisis expliratorio de las palabras mas usadas dentro de las noticias de Reforma Agraria.

Por tanto, a traves de un analisis de nube de palabras, como los diferentes titulares de los diarios previamente mencionados utilizan en su mayor frecuencia las plabras ley y promocion. Asimismo, se observa en una segunda escala el mayor uso de palabras tales como: trabajador,ica, gobierno y regimen. En consecuencia, se evidencia la importancia de la mejora de la Ley de Promocion Agraria como tema central entre los diferentes diarios.

library(ggraph)
# Nubes de palabras
library(echarts4r)
WC_Agraria = tidy_annotated %>% 
  filter(upos %in% c("NOUN", "PROPN", "ADJ", "VERB")) %>% 
  count(lemma, sort=T) %>% 
  filter(n > 2) %>% 
  e_color_range(n, color) %>% 
  e_chart() %>% 
  e_cloud(lemma, n, color) %>% 
  e_tooltip()

WC_Agraria

3.2 Algoritmo de aprendizaje no supervisado (LDA)

Luego de organizar la informacion producto de los textos de titulares de los princiaples diarios sobre la busqueda de Reforma Agraria, se realizara un analisis no supervisado de las palabras utilizadas en dicho titulares. En particular se utilizara el analisis de LDA.

El LDA realizara el patron de la presencia de cuatro topicos, los patrones albergan las 10 palabras mas comunes en cada topicos, observando o deduciendo un patron comun entre las mismas.

  • Por tanto, los topicos son:
  • Topico 1: La Reforma Agraria; se observa la figura lineas bajo las palabras mas usadas en este primer topico son agraria, proeycto y promocion, donde segun los titulares se obsera un patron propio de la Lay de Reforma Agraria, en base a la reforma laboral del sector agroexportador.
  • Topico 2: Los problemas sociales; el presente topico esta asociado a la situacion de conflictos sociales como consecuencia de la renovacion de la reforma agraria, se observa palabras mas comunes como: social, conflicto y pueblo.
  • Topico 3: El Regimen laboral; el titulo referencial del presente topico esta referido a la situacion del trabajo del sector agropecuario, dado que las palabras con mayor frecuencia son: trabajador, regimen y agrario.
  • Topico 4: La situacion del gobierno; el ultimo topico agrupa palabras asociadas al rol del gobierno, en particular se obser un patron de noticias relacionadas con la palabra ley producto de las demandas de los trabajadores agropecuarios en cuanto a la derogacion de la ley renovada. Asimismo, se presenta palabras asociadas con el ministerio, ica y presidencia.
# Modelado de topicos con LDA
library(topicmodels)
k = 4
seed = 123
lda = LDA(dtm_noticias, k=k, method = "GIBBS", control=list(seed=seed))
class(lda)

# Matriz beta (probabilidades por termino)
lda_tidy = tidy(lda, matrix="beta")
lda_tidy %>% filter(term=="cultura")

# Grafico del top 10 de palabras por tematica
lda_tidy %>% 
  arrange(topic, desc(beta)) %>% 
  group_by(topic) %>% 
  mutate(rn=1:n()) %>% 
  filter(rn<=8) %>% 
  ggplot(aes(x=reorder_within(term,beta,topic),
             y=beta,fill=as.factor(topic)))+
  scale_x_reordered()+
  geom_col()+
  facet_wrap(vars(topic), scales="free")+
  labs(x=NULL,y="Beta",title="Top 10 terminos LDA")+
  theme(text=element_text(size=9))+
  coord_flip()

4 Conclusion

Por lo tanto, el presente reporte y analisis de las noticias de los principales diarios peruanos bajo las frases: reforma agraria y paro agrario permite analizar de manera exploratoria la comunicacion por parte de los medios de prensa (virtuales) sobre la situacion del problema de la Ley de promocion agraria en el Peru.

Como se observa en el analisis, mucha de las palabras y agrupamientos no supervisados de los mismos muestra patrones asociados a la mejora laboral, donde la palabra mas usadas en las noticias que lejos de mostrar conflictos como primera plana (paros, toma de calles) se exije una mejora para la situacion de los trabajadores del sector Agro exportador.