#UNIVERSIDAD CENTRAL DEL ECUADOR #Facultad en Ingenieria en GeologĆa, Minas, Petroleos y Ambiental #Ingenieria Ambiental #Fecha: 15-05-2025
# Cargar librerĆas
library(knitr)
library(kableExtra)
# Cargar datos
getwd()
## [1] "/cloud/project"
setwd("/cloud/project") # Asegúrate de que el CSV esté en esta carpeta
datos <- read.csv("water_pollution_disease.csv", header = TRUE, sep = ",", dec = ".")
# Extracción Variable Cualitativa nominal
PaĆses <- datos$Country
# Tabla de distribución de frecuencia
TDF_paĆses <- data.frame(table(PaĆses))
ni <- TDF_paĆses$Freq
hi <- round((ni / sum(ni)) * 100, 2)
PaĆses <- TDF_paĆses$PaĆses
TDF_paĆses <- data.frame(PaĆses, ni, hi)
Sumatoria <- data.frame(PaĆses = "TOTAL", ni = sum(ni), hi = sum(hi))
TDF_paĆses_suma <- rbind(TDF_paĆses, Sumatoria)
colnames(TDF_paĆses_suma) <- c("PaĆses", "ni", "hi(%)")
colnames(TDF_paĆses) <- c("PaĆses", "ni", "hi (%)")
# Tabla
kable(TDF_paĆses_suma, align = 'c',
caption = "Tabla de Distribucion de Frecuencias de los PaĆses de estudio de contaminación del agua") %>%
kable_styling(full_width = FALSE, position = "center",
bootstrap_options = c("striped", "hover", "condensed"))
PaĆses | ni | hi(%) |
---|---|---|
Bangladesh | 291 | 9.70 |
Brazil | 291 | 9.70 |
China | 311 | 10.37 |
Ethiopia | 293 | 9.77 |
India | 290 | 9.67 |
Indonesia | 304 | 10.13 |
Mexico | 288 | 9.60 |
Nigeria | 315 | 10.50 |
Pakistan | 298 | 9.93 |
USA | 319 | 10.63 |
TOTAL | 3000 | 100.00 |
# Diagrama de barras local
barplot(ni, main = "GrĆ”fica N°1: Distribución de frecuencias de los paĆses
de estudio de contaminación y enfermedades",
xlab = "PaĆses",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,400),
las = 2,
cex.names = 0.6,
names.arg = TDF_paĆses$PaĆses)
barplot(hi, main = "GrÔfica N°2: Distribución porcentual de los
paĆses de estudio de contaminación y enfermedades",
xlab = "PaĆses",
ylab = "Porcentaje",
col = "green",
ylim = c(0,10),
las = 2,
cex.names = 0.6,
names.arg = TDF_paĆses$PaĆses)
# Diagrama de barras global
barplot(ni, main = "GrĆ”fica N°3: Distribución de frecuencias de los paĆses
de estudio de contaminación y enfermedades",
xlab = "PaĆses",
ylab = "Cantidad",
col = "pink",
ylim = c(0,3000),
las=2,
cex.names = 0.6,
names.arg = TDF_paĆses$PaĆses)
barplot(hi, main = "GrÔfica N°4: Distribución de frecuencias porcentual de
los paĆses de estudio de contaminación y enfermedades",
xlab = "PaĆses",
ylab = "Porcentaje (%)",
col = "skyblue",
ylim = c(0,100),
las = 2,
cex.names = 0.6,
names.arg = TDF_paĆses$PaĆses)
labels_info <- paste(TDF_paĆses$`hi (%)`, "%")
pie(hi,
main = "GrĆ”fica N°5 Distribución porcentual de los paĆses del estudio
de contaminación y enfermedades",
radius = 1.1,
labels = labels_info,
col = rev(heat.colors(10)),
cex = 0.8,
cex.main = 1)
legend("topright",
legend = TDF_paĆses$PaĆses,
fill = colores <- c(rev(heat.colors(10))),
cex = 0.6,
title = "Leyenda")