UNIVERSIDAD CENTRAL DEL ECUADOR

Facultad de Ingeniería en Geología, Minas, Petroleos y Ambiental

Ingeniería Ambiental

#Cargar datos
setwd("C:/Users/KEVIN/OneDrive - Universidad Central del Ecuador/Escritorio/kevin/Estadistica/mundial/Rstudio")
datos <- read.csv("water_pollution_disease.csv",header = TRUE,sep = ",",dec = ".")

# Extraccion variable Cualitativa nominal
Tratamiento <- datos$Water.Treatment.Method

# Tabla de distribución de frecuencia
TDF_tratamiento <- data.frame(table(Tratamiento))
ni <- TDF_tratamiento$Freq
sum(ni)
## [1] 3000
hi <- round((ni/sum(ni))*100,2)
sum(hi)
## [1] 100
Tratamiento <- TDF_tratamiento$Tratamiento
TDF_tratamiento <- data.frame(Tratamiento,ni,hi)

Sumatoria <- data.frame(Tratamiento = "TOTAL",
                        ni = sum(ni),
                        hi = sum(hi))

TDF_tratamiento_suma <- rbind(TDF_tratamiento,Sumatoria)
colnames(TDF_tratamiento) <- c("Tratamiento","ni","hi (%)")
colnames(TDF_tratamiento_suma) <- c("Tratamiento","ni","hi (%)")

library(knitr)
## Warning: package 'knitr' was built under R version 4.4.2
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.4.2
kable(TDF_tratamiento_suma, align = 'c',
      caption = "Tabla de Distribucion de Frecuencias de tratamiento del agua
      de los paises del estudio de contaminación del agua") %>%
  kable_styling(full_width = FALSE, position = "center",
                bootstrap_options = c("striped", "hover", "condensed"))
Tabla de Distribucion de Frecuencias de tratamiento del agua de los paises del estudio de contaminación del agua
Tratamiento ni hi (%)
Boiling 777 25.90
Chlorination 748 24.93
Filtration 728 24.27
None 747 24.90
TOTAL 3000 100.00

Gráficas

# Diagrama de barrras local
barplot(ni,main="Gráfica N°1: Distribución de tipo de tratamiento de agua utilizado",
        xlab = "Tipo de tratamiento",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,800),
        names.arg=TDF_tratamiento$Tratamiento)

barplot(hi,main="Gráfica N°2: Distribución del porcentaje del \n tipo de tratamiento de agua utilizado",
        xlab = "Tipo de tratamiento",
        ylab = "Porcentaje (%)",
        col = "green",
        ylim = c(0,30),
        names.arg=TDF_tratamiento$Tratamiento)

# Diagrama de barrras global
barplot(ni,main="Gráfica N°3: Distribución del tipo de tratamiento de agua utilizado",
        xlab = "Tipo de tratamiento",
        ylab = "Cantidad",
        col = "pink",
        ylim = c(0,3000),
        names.arg = TDF_tratamiento$Tratamiento)

barplot(hi,main="Gráfica N°4: Distribución del porcentaje del \n tipo de tratamiento de agua utilizado",
        xlab = "Tipo de tratamiento",
        ylab = "Porcentaje (%)",
        col = "skyblue",
        ylim = c(0,100),
        names.arg=TDF_tratamiento$Tratamiento)

# Diagrma circular

pie(hi,main = "Gráfica N°5: Distribución porcentual del \n tipo de tratamiento de agua utilizado",
    radius = 1,
    labels = paste(TDF_tratamiento$`hi (%)`,"%"),
    col = colores <- c(rev(heat.colors(4))),
    cex=1,
    cex.main=1.4)

legend("topright",
       legend = TDF_tratamiento$Tratamiento,
       fill = colores <- c(rev(heat.colors(4))),
       cex = 0.9,
       title = "Leyenda")

# Indicadores estadísticos
# MODA
# No tiene moda ya que todas las barras se encuentran semejantes y en
# comparacion con eldiagrama de barras local es inperceptible la diferencia