¿por qué laborales?

library(rio)
## Warning: package 'rio' was built under R version 4.3.3
data= import("baseee.xlsx")
table(data$Reclamo)
## 
##   Ambientales    Económicos     Laborales     Políticos     Servicios 
##          1109          2494          8955         10037          1473 
## Territoriales 
##           357

¿por qué es periodo de tiempo?

str(data$Año)
##  num [1:24425] 1980 1980 1980 1980 1980 1980 1980 1980 1980 1980 ...
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
lugar5 = data %>%
  select(Año,Reclamo) %>%
   group_by(Reclamo) %>%
  filter(Reclamo == "Laborales")
lugar5 %>%
 group_by(Año) %>%
  summarize(Freq=n())
## # A tibble: 44 × 2
##      Año  Freq
##    <dbl> <int>
##  1  1980   676
##  2  1981   554
##  3  1982   343
##  4  1983   853
##  5  1984   612
##  6  1985   176
##  7  1986   181
##  8  1987   395
##  9  1988   276
## 10  1989   471
## # ℹ 34 more rows
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
lugar5 |>
  ggplot(aes(x=`Año`))+
  geom_histogram(fill = "red",
    color = "black",
    bins = 30,
    alpha = 0.7)+
  xlab("año") +
  ylab("Frecuencia de las protestas")+
   theme_minimal()

Filtrando data: Actores mineros

library(dplyr)
mineros = data %>%
  select(Año, Región, Reclamo, Actor_1, Adversario, Presidente) %>%
   group_by(Actor_1) %>%
  filter(Actor_1 == "Mineros")
mineros1 = data %>%
  select(Año, Región, Reclamo, Actor_1, Adversario, Presidente, Sub_Reclamo) %>%
   group_by(Año) %>%
  filter(Año >= 1980 & Año <= 2000)
mineros2 = mineros1 %>%
   group_by(Reclamo) %>%
  filter(Reclamo == "Laborales")
mineros3 = mineros2 %>%
   group_by(Actor_1) %>%
  filter(Actor_1 == "Mineros")
str(mineros3)
## gropd_df [739 × 7] (S3: grouped_df/tbl_df/tbl/data.frame)
##  $ Año        : num [1:739] 1980 1980 1980 1980 1980 1980 1980 1980 1980 1980 ...
##  $ Región     : chr [1:739] "Lima" "Arequipa" "Pasco" "Huancavelica" ...
##  $ Reclamo    : chr [1:739] "Laborales" "Laborales" "Laborales" "Laborales" ...
##  $ Actor_1    : chr [1:739] "Mineros" "Mineros" "Mineros" "Mineros" ...
##  $ Adversario : chr [1:739] "Empresas Privadas" "Empresas Privadas" "Empresas Estatates" "Empresas Privadas" ...
##  $ Presidente : chr [1:739] "Morales Bermúdez" "Morales Bermúdez" "Morales Bermúdez" "Morales Bermúdez" ...
##  $ Sub_Reclamo: chr [1:739] "Aumentos salariales" "Aumentos salariales" "Aumentos salariales" "Aumentos salariales" ...
##  - attr(*, "groups")= tibble [1 × 2] (S3: tbl_df/tbl/data.frame)
##   ..$ Actor_1: chr "Mineros"
##   ..$ .rows  : list<int> [1:1] 
##   .. ..$ : int [1:739] 1 2 3 4 5 6 7 8 9 10 ...
##   .. ..@ ptype: int(0) 
##   ..- attr(*, ".drop")= logi TRUE

analisis descriptivo

tabla1 = mineros3 |>
  count(Región = Región, name="Frecuencia") |>
  mutate(Porcentaje = round(Frecuencia / sum(Frecuencia)*100))
tabla1
## # A tibble: 17 × 4
## # Groups:   Actor_1 [1]
##    Actor_1 Región       Frecuencia Porcentaje
##    <chr>   <chr>             <int>      <dbl>
##  1 Mineros Arequipa             52          7
##  2 Mineros Ayacucho             21          3
##  3 Mineros Cajamarca             4          1
##  4 Mineros Callao               13          2
##  5 Mineros Cusco                12          2
##  6 Mineros Huancavelica         23          3
##  7 Mineros Huánuco              14          2
##  8 Mineros Ica                  47          6
##  9 Mineros Junín                76         10
## 10 Mineros La Libertad          12          2
## 11 Mineros Lima                187         25
## 12 Mineros Loreto                3          0
## 13 Mineros Moquegua            148         20
## 14 Mineros Pasco                31          4
## 15 Mineros Piura                 1          0
## 16 Mineros Tacna                71         10
## 17 Mineros Áncash               24          3
library(ggplot2)
library(dplyr)

# Ordenar las regiones según la frecuencia de mayor a menor
tabla1 <- tabla1 %>%
  arrange(desc(Frecuencia)) %>%
  mutate(Región = factor(Región, levels = Región))

# Crear el gráfico
ggplot(tabla1, aes(x=Región, y=Frecuencia, fill=Región)) + 
  geom_bar(stat = "identity") +
  ggtitle("N° de protestas por regiones- actores mineros") +
  xlab("Regiones") +
  ylab("Frecuencia") +
  geom_text(aes(label=round(Frecuencia, 1)), vjust=-0.3, color="white", size=3) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1), # Ajusta el ángulo y el espaciado de los nombres en el eje X
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"), # Centrar y ajustar tamaño del título
    axis.title.x = element_text(size = 14), # Ajustar tamaño del título del eje X
    axis.title.y = element_text(size = 14) # Ajustar tamaño del título del eje Y
  ) +
  scale_fill_brewer(palette = "Set3") # Agrega colores usando una paleta predefinida
## Warning in RColorBrewer::brewer.pal(n, pal): n too large, allowed maximum for palette Set3 is 12
## Returning the palette you asked for with that many colors

Tiempo

tabla2 = mineros3 |>
  count(Año = Año, name="Frecuencia") |>
  mutate(Porcentaje = round(Frecuencia / sum(Frecuencia)*100))
tabla2
## # A tibble: 21 × 4
## # Groups:   Actor_1 [1]
##    Actor_1   Año Frecuencia Porcentaje
##    <chr>   <dbl>      <int>      <dbl>
##  1 Mineros  1980         26          4
##  2 Mineros  1981        185         25
##  3 Mineros  1982         54          7
##  4 Mineros  1983        182         25
##  5 Mineros  1984         66          9
##  6 Mineros  1985         29          4
##  7 Mineros  1986         31          4
##  8 Mineros  1987         21          3
##  9 Mineros  1988         21          3
## 10 Mineros  1989         14          2
## # ℹ 11 more rows
library(ggplot2)
library(dplyr)

# Contar la frecuencia de cada año y ordenarlas
mineros3_count <- mineros3 %>%
  count(`Año`) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(mineros3_count, aes(x = (`Año`), y = n)) +
  geom_bar(stat = "identity", fill = "green", color = "black", alpha = 0.7) +
  xlab("Año") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Año") +
  theme_minimal() +
  theme(
  )

filtara por mes, fuji shock

Análisis SOLO con mis varibles elegidas

names(data)
##  [1] "ID"                   "Periódico"            "Periódico_id"        
##  [4] "Día"                  "Mes_id"               "Mes"                 
##  [7] "Año"                  "Fecha"                "Presidente_id"       
## [10] "Presidente"           "Región_id"            "Región"              
## [13] "Provincia_id"         "Provincia"            "Distrito_id"         
## [16] "Distrito"             "Sector_1"             "Sector_id_1"         
## [19] "Actor_1"              "Actor_1_id"           "Sector_2"            
## [22] "Sector_id_2"          "Actor_2"              "Actor_2_id"          
## [25] "Actor_t"              "Acción_1_id"          "Acción_1"            
## [28] "Acción_2_id"          "Acción_2"             "Acción_3_id"         
## [31] "Acción_3"             "Acción_4_id"          "Acción_4"            
## [34] "Acción_t"             "Duración_Horas"       "Número_Participantes"
## [37] "Número_Heridos"       "Número_Muertos"       "Número_Detenidos"    
## [40] "Adversario"           "Adversario_id"        "Institución_1"       
## [43] "Institución_2"        "Institución_3"        "Institución_id"      
## [46] "Reclamo_t"            "Reclamo"              "Reclamo_id"          
## [49] "Sub_Reclamo"          "Sub_Reclamo_id"       "Comentar_t"
library(dplyr)

data <- data %>%
  select(Año, Región, Actor_1, Reclamo, Sub_Reclamo, Adversario, Acción_1, Mes_id, Mes)
str(data)
## 'data.frame':    24425 obs. of  9 variables:
##  $ Año        : num  1980 1980 1980 1980 1980 1980 1980 1980 1980 1980 ...
##  $ Región     : chr  "Lima" "Lima" "Lima" "Lima" ...
##  $ Actor_1    : chr  "Comerciantes" "Enfermeras" "Reos" "Periodistas" ...
##  $ Reclamo    : chr  "Laborales" "Laborales" "Servicios" "Laborales" ...
##  $ Sub_Reclamo: chr  "Bonificaciones" "Aumentos salariales" "Alimentación" "Mejores condiciones laborales" ...
##  $ Adversario : chr  "Empresas Privadas" "Organismos Autónomos" "Poder Ejecutivo" "Empresas Privadas" ...
##  $ Acción_1   : chr  "Paro" "Huelga" "Motín" "Paro" ...
##  $ Mes_id     : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ Mes        : chr  "Enero" "Enero" "Enero" "Enero" ...

Análisis de Moquegua

#por años

tabla3 = data %>%
  select(Región, Actor_1, Reclamo, Año) %>%
  group_by(Año) %>%
  filter(Región == "Moquegua") %>%
  filter(Actor_1== "Mineros")  %>%
  filter(Reclamo== "Laborales")

filter(Año <= 2000) %>%

library(ggplot2)
library(dplyr)

# Contar la frecuencia de cada año y ordenarlas
tabla3_count <- tabla3 %>%
  count(`Año`) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(tabla3_count, aes(x = (`Año`), y = n)) +
  geom_bar(stat = "identity", fill = "blue", color = "black", alpha = 0.7) +
  xlab("Año") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Año en Moquegua") +
  theme_minimal() +
  theme(
  )

count(tabla3)
## # A tibble: 13 × 2
## # Groups:   Año [13]
##      Año     n
##    <dbl> <int>
##  1  1980     4
##  2  1981    68
##  3  1983    44
##  4  1984     7
##  5  1985     3
##  6  1986     1
##  7  1987     3
##  8  1988     2
##  9  1989     1
## 10  1990    15
## 11  2007    12
## 12  2012     2
## 13  2017     2

–> años con más protestas son 1981, 1983 y 1990

Mes 1981

tabla4 = data %>%
  select(Región, Actor_1, Reclamo, Año, Mes, Mes_id) %>%
  group_by(Año) %>%
  filter(Región == "Moquegua") %>%
  filter(Actor_1== "Mineros")  %>%
  filter(Reclamo== "Laborales")
para_grafico3 = tabla4%>%
  select(Región, Actor_1, Reclamo, Año, Mes, Mes_id) %>%
  group_by(Año) %>%
  filter(Año == "1981")
# Contar la frecuencia de cada año y ordenarlas
para_grafico3_count <- para_grafico3%>%
  count(`Mes_id`) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(para_grafico3_count, aes(x = (`Mes_id`), y = n)) +
  geom_bar(stat = "identity", fill = "darkblue", color = "black", alpha = 0.7) +
  xlab("Mes_id") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Mes (1981)  en Moquegua") +
  theme_minimal() +
  theme(
  )

# Contar la frecuencia de cada año y ordenarlas
para_grafico3_count <- para_grafico3%>%
  count(Mes) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(para_grafico3_count, aes(x = (Mes), y = n)) +
  geom_bar(stat = "identity", fill = "darkblue", color = "black", alpha = 0.7) +
  xlab("Mes_id") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Mes (1981)  en Moquegua") +
  theme_minimal() +
  theme(
  )

Mes 1983

library(dplyr)
para_grafico4 = tabla4%>%
  select(Región, Actor_1, Reclamo, Año, Mes, Mes_id) %>%
  group_by(Año) %>%
  filter(Año == "1983")
# Contar la frecuencia de cada año y ordenarlas
para_grafico4_count <- para_grafico4 %>%
  count(Mes) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(para_grafico4_count, aes(x = (Mes), y = n)) +
  geom_bar(stat = "identity", fill = "purple", color = "black", alpha = 0.7) +
  xlab("Mes_id") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Mes (1983)  en Moquegua") +
  theme_minimal() +
  theme(
  )

Mes 1984

para_grafico5 = tabla4%>%
  select(Región, Actor_1, Reclamo, Año, Mes, Mes_id) %>%
  group_by(Año) %>%
  filter(Año == "1984")
# Contar la frecuencia de cada año y ordenarlas
para_grafico5_count <- para_grafico5 %>%
  count(Mes) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(para_grafico5_count, aes(x = (Mes), y = n)) +
  geom_bar(stat = "identity", fill = "darkgreen", color = "black", alpha = 0.7) +
  xlab("Mes_id") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Mes (1984)  en Moquegua") +
  theme_minimal() +
  theme(
  )

Mes 1990

para_grafico6 = tabla4%>%
  select(Región, Actor_1, Reclamo, Año, Mes, Mes_id) %>%
  group_by(Año) %>%
  filter(Año == "1990")
# Contar la frecuencia de cada año y ordenarlas
para_grafico6_count <- para_grafico6 %>%
  count(Mes) %>%
  arrange(desc(n))

# Crear el gráfico de barras ordenado de mayor a menor
ggplot(para_grafico6_count, aes(x = (Mes), y = n)) +
  geom_bar(stat = "identity", fill = "orange", color = "black", alpha = 0.7) +
  xlab("Mes_id") +
  ylab("Frecuencia de protestas") +
  ggtitle("Frecuencia de Protestas actores mineros por Mes (1990)  en Moquegua") +
  theme_minimal() +
  theme(
  )

tipo de reclamo

data_mineros = data%>%
  filter(Actor_1=="Mineros")%>%
  group_by(Región)
para_grafico1=data_mineros %>%
  filter(Región=="Moquegua")%>%
 group_by(Reclamo) %>%
  summarize(Freq=n()) %>%
   mutate(Porcentaje = (Freq / sum(Freq))*100)
library(ggplot2)
 library(taylor) 
## Warning: package 'taylor' was built under R version 4.3.3
 ggplot(para_grafico1, aes(x=Reclamo, y=Porcentaje, fill=Reclamo)) + 
    ggtitle("Tipo de reclamo en protestas en Moquegua") +
  xlab("Protestas por actores mineros\n en Moquegua") + ylab("Porcentaje")+
geom_bar(stat = "identity")

tipo de subReclamo

para_grafico2 = data_mineros%>%
filter(Región=="Moquegua")
para_grafico2_summarized = para_grafico2 %>%
  filter(Reclamo == "Laborales") %>%
  group_by(Sub_Reclamo) %>%
  summarize(Freq = n()) %>%
  mutate(Porcentaje = (Freq / sum(Freq)) * 100)
 # Crear el gráfico
ggplot(para_grafico2_summarized, aes(x = Sub_Reclamo, y = Porcentaje, fill = Sub_Reclamo)) + 
  ggtitle("Tipo de Sub reclamo en protestas en Moquegua") +
  xlab("Protestas por actores mineros\n en Moquegua") + 
  ylab("Porcentaje") +
  geom_bar(stat = "identity")

Filtrar los datos para Moquegua

para_grafico2 = data_mineros %>% filter(Región == “Moquegua”)

Calcular frecuencias y porcentajes

para_grafico2_summarized = para_grafico2 %>% filter(Reclamo == “Laborales”) %>% group_by(Sub_Reclamo) %>% summarize(Freq = n()) %>% mutate(Porcentaje = (Freq / sum(Freq)) * 100)

Crear el gráfico

ggplot(para_grafico2_summarized, aes(x = Sub_Reclamo, y = Porcentaje, fill = Sub_Reclamo)) + ggtitle(“Tipo de Sub reclamo en protestas en Moquegua”) + xlab(“Protestas por actores minerosen Moquegua”) + ylab(“Porcentaje”) + geom_bar(stat = “identity”)

tipo de adversario grafico

# Calcular frecuencias y porcentajes
para_grafico_NOSE_summarized = para_grafico2 %>%
  filter(Reclamo == "Laborales") %>%
  group_by(Adversario) %>%
  summarize(Freq = n()) %>%
  mutate(Porcentaje = (Freq / sum(Freq)) * 100)
# Crear el gráfico
ggplot(para_grafico_NOSE_summarized, aes(x = Adversario, y = Porcentaje, fill = Adversario)) + 
  ggtitle("Tipo de adversario en protestas en Moquegua") +
  xlab("Protestas por actores mineros\n en Moquegua") + 
  ylab("Porcentaje") +
  geom_bar(stat = "identity")