# TABLA DE FRECUENCIAS pollutant_type


datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")
Pollutant <- datos$Pollutant_Type
# Tabla de distribuciones

TDF_pollutant <- data.frame(table(Pollutant))

# Frecuencia absoluta

ni <- TDF_pollutant$Freq

# Frecuencia relativa en %

hi <- round((ni / sum(ni)) * 100, 2)

#Graficas
# Diagrama de barrras local ni

barplot(ni, main = "Gráfica N°11: Distribución de frecuencias de los tipos de contaminantes encontrados ",
        xlab = "Tipos de contaminante",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0,600),
        las = 2,
        cex.names = 0.55,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global ni 

barplot(ni, main = "Gráfica N°12: Distribución de frecuencias de los tipos de contaminantes encontrados ",
        xlab = "Tipos de contaminante",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,3000),
        las=2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras local hi(%)

barplot(hi, main = "Gráfica N°13: Distribución de frecuencias porcentual de los tipos de contaminante encontrados",
        xlab = "Tipos de contaminante",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,20),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global hi(%)

barplot(hi, main = "Gráfica N°14: Distribución de frecuencias porcentual de 
los tipos de contaminante encontrados",
        xlab = "Tipos de contaminante",
        ylab = "Porcentaje",
        col = "blue",
        ylim = c(0,100),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

# Etiquetas con número + símbolo %
etiquetas <- paste0(hi, " %")


colores <- c("yellow", "khaki1", "gold", "orange", "darkorange", "red")


par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = "Gráfica N°15 Distribución porcentual de los países de estudio",
  cex = 1
)

legend(
  "topright",
  legend = TDF_pollutant$Pollutant,
  fill = colores,
  title = "Leyenda",
  cex = 0.9,
  xpd = TRUE
)