This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.
Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.
#Estadistica Descriptiva
#Alexander Sailema
#22/11/2025
library(dplyr)
library(gt)
#Cargar los Datos
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
sep = ",")
#Tablas Cualitativas Nominales
#Water_Source_Type
Tipo_Fuente_Agua<-datos$Water_Source_Type
# Tabla de distribución de frecuencia
TDF_Tipo_Fuente_Agua<-data.frame(table(Tipo_Fuente_Agua))
ni <- TDF_Tipo_Fuente_Agua$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Tipo_Fuente_Agua <- TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua
TDF_Tipo_Fuente_Agua <- data.frame(Tipo_Fuente_Agua, ni, hi)
Summary <- data.frame(Tipo_Fuente_Agua = "TOTAL", ni = sum(ni),hi = 100)
TDF_Tipo_Fuente_Agua_suma<-rbind(TDF_Tipo_Fuente_Agua, Summary)
colnames(TDF_Tipo_Fuente_Agua_suma) <- c("Tipo Fuente Agua", "ni", "hi(%)")
#Graficas
# Diagrama de barrras local ni
barplot(ni, main = "Gráfica N°31: Distribución de frecuencias de los Tipos de Fuente de Agua",
xlab = "Fuente de Agua",
ylab = "Cantidad",
col = "red",
ylim = c(0,619),
las = 1,
cex.names = 0.6,
names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)
#Diagrama de barras global ni
barplot(ni, main = "Gráfica N°32: Distribución de frecuencias de los Tipos de Fuente de Agua",
xlab = "Fuente de Agua",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las=1,
cex.names = 0.6,
names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)
#Diagrama de barras local hi(%)
barplot(hi, main = "Gráfica N°33: Distribución de frecuencias porcentual de los Tipos de Fuente de Agua",
xlab = "Fuente de Agua",
ylab = "Porcentaje",
col = "green",
ylim = c(0,21),
las = 1,
cex.names = 0.6,
names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)
#Diagrama de barras global hi(%)
barplot(hi, main = "Gráfica N°35: Distribución de frecuencias porcentual de
los Tipos de Fuente de Agua",
xlab = "Fuente de Agua",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 1,
cex.names = 0.6,
names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)
#Diagrama circular
etiqueta_pie <- paste(TDF_Tipo_Fuente_Agua$hi, "%")
pie(hi,
main = "Gráfica N°36 Distribución porcentual de los Tipos de Fuente de Agua",
radius = 1,
labels = etiqueta_pie,
col = rev(heat.colors(length(hi))),
cex = 0.8,
cex.main = 1)
legend("topright",
legend = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua,
fill = colores <- c(rev(heat.colors(10))),
cex = 0.5,
title = "Leyenda")