UNIVERSIDAD CENTRAL DEL ECUADOR
Facultad de Ingeniería en Geología, Minas, Petroleos y
Ambiental
Ingeniería Ambiental
#Cargar datos
setwd("C:/Users/KEVIN/OneDrive - Universidad Central del Ecuador/Escritorio/kevin/Estadistica/mundial/Rstudio")
datos <- read.csv("water_pollution_disease.csv",header = TRUE,sep = ",",dec = ".")
# Extraccion variable Cualitativa nominal
Tratamiento <- datos$Water.Treatment.Method
# Tabla de distribución de frecuencia
TDF_tratamiento <- data.frame(table(Tratamiento))
ni <- TDF_tratamiento$Freq
sum(ni)
## [1] 3000
hi <- round((ni/sum(ni))*100,2)
sum(hi)
## [1] 100
Tratamiento <- TDF_tratamiento$Tratamiento
TDF_tratamiento <- data.frame(Tratamiento,ni,hi)
Sumatoria <- data.frame(Tratamiento = "TOTAL",
ni = sum(ni),
hi = sum(hi))
TDF_tratamiento_suma <- rbind(TDF_tratamiento,Sumatoria)
colnames(TDF_tratamiento) <- c("Tratamiento","ni","hi (%)")
colnames(TDF_tratamiento_suma) <- c("Tratamiento","ni","hi (%)")
library(knitr)
## Warning: package 'knitr' was built under R version 4.4.2
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.4.2
kable(TDF_tratamiento_suma, align = 'c',
caption = "Tabla de Distribucion de Frecuencias de tratamiento del agua
de los paises del estudio de contaminación del agua") %>%
kable_styling(full_width = FALSE, position = "center",
bootstrap_options = c("striped", "hover", "condensed"))
Tabla de Distribucion de Frecuencias de tratamiento del agua de los
paises del estudio de contaminación del agua
|
Tratamiento
|
ni
|
hi (%)
|
|
Boiling
|
777
|
25.90
|
|
Chlorination
|
748
|
24.93
|
|
Filtration
|
728
|
24.27
|
|
None
|
747
|
24.90
|
|
TOTAL
|
3000
|
100.00
|
Gráficas
# Diagrama de barrras local
barplot(ni,main="Gráfica N°1: Distribución de tipo de tratamiento de agua utilizado",
xlab = "Tipo de tratamiento",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,800),
names.arg=TDF_tratamiento$Tratamiento)

barplot(hi,main="Gráfica N°2: Distribución del porcentaje del \n tipo de tratamiento de agua utilizado",
xlab = "Tipo de tratamiento",
ylab = "Porcentaje (%)",
col = "green",
ylim = c(0,30),
names.arg=TDF_tratamiento$Tratamiento)

# Diagrama de barrras global
barplot(ni,main="Gráfica N°3: Distribución del tipo de tratamiento de agua utilizado",
xlab = "Tipo de tratamiento",
ylab = "Cantidad",
col = "pink",
ylim = c(0,3000),
names.arg = TDF_tratamiento$Tratamiento)

barplot(hi,main="Gráfica N°4: Distribución del porcentaje del \n tipo de tratamiento de agua utilizado",
xlab = "Tipo de tratamiento",
ylab = "Porcentaje (%)",
col = "skyblue",
ylim = c(0,100),
names.arg=TDF_tratamiento$Tratamiento)

# Diagrma circular
pie(hi,main = "Gráfica N°5: Distribución porcentual del \n tipo de tratamiento de agua utilizado",
radius = 1,
labels = paste(TDF_tratamiento$`hi (%)`,"%"),
col = colores <- c(rev(heat.colors(4))),
cex=1,
cex.main=1.4)
legend("topright",
legend = TDF_tratamiento$Tratamiento,
fill = colores <- c(rev(heat.colors(4))),
cex = 0.9,
title = "Leyenda")

# Indicadores estadísticos
# MODA
# No tiene moda ya que todas las barras se encuentran semejantes y en
# comparacion con eldiagrama de barras local es inperceptible la diferencia