This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.
Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.
#Estadistica Descriptiva
#Alexander Sailema
#20/11/2025
library(gt)
library(dplyr)
#Cargar Datos
setwd("~/")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
sep = ",")
str(datos)
## 'data.frame': 3000 obs. of 24 variables:
## $ Case_ID : chr "CASE_100000" "CASE_100001" "CASE_100002" "CASE_100003" ...
## $ Date_Reported : chr "12/9/2024" "1/1/2024" "24/2/2025" "24/9/2024" ...
## $ Region : chr "Africa" "Africa" "Europe" "Asia" ...
## $ Country : chr "Pakistan" "Germany" "Germany" "USA" ...
## $ Pollutant_Type : chr "Lead" "Lead" "Lead" "Lead" ...
## $ Pollutant_Concentration_mg_kg: int 7804 1633 16733 8923 9393 12347 644 1171 11161 12159 ...
## $ Soil_pH : int 83 796 535 566 764 518 489 814 524 819 ...
## $ Temperature_C : int 356 310 164 314 170 123 339 191 439 131 ...
## $ Humidity_. : int 649 731 338 305 586 912 530 697 781 347 ...
## $ Rainfall_mm : int 624 82 1217 1169 2370 3863 488 1247 3758 181 ...
## $ Crop_Type : chr "Wheat" "Potato" "Soybean" "Wheat" ...
## $ Farming_Practice : chr "Integrated" "Permaculture" "Organic" "Permaculture" ...
## $ Nearby_Industry : chr "Mining" "Mining" "Chemical" "None" ...
## $ Water_Source_Type : chr "Well" "Irrigation Canal" "River" "Irrigation Canal" ...
## $ Soil_Texture : chr "Sandy" "Silty" "Clay" "Silty" ...
## $ Soil_Organic_Matter_. : int 198 971 549 398 94 818 52 544 90 359 ...
## $ Disease_Type : chr "Gastrointestinal Disease" "Cancer" "Gastrointestinal Disease" "Neurological Disorder" ...
## $ Disease_Severity : chr "Moderate" "Mild" "Severe" "Severe" ...
## $ Health_Symptoms : chr "Breathing Difficulty" "Breathing Difficulty" "Nausea" "Fatigue" ...
## $ Age_Group_Affected : chr "Adults" "Elderly" "Children" "Adults" ...
## $ Gender_Most_Affected : chr "Male" "Both" "Both" "Male" ...
## $ Mitigation_Measure : chr "Government Regulation" "Community Awareness" "Soil Remediation" "Community Awareness" ...
## $ Case_Resolved : chr "No" "Yes" "Yes" "Yes" ...
## $ Follow_Up_Required : chr "Yes" "No" "No" "No" ...
#Tablas Cualitativas
#Textura Suelo
Textura_Suelo <- datos$Soil_Texture
#Tabla de Distribucion de Frecuencia
TDF_Textura_Suelo <-data.frame(table(Textura_Suelo))
ni <- TDF_Textura_Suelo$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Textura_Suelo <- TDF_Textura_Suelo$Textura_Suelo
TDF_Textura_Suelo <- data.frame(Textura_Suelo, ni, hi)
Summary <- data.frame(Textura_Suelo = "TOTAL", ni = sum(ni),hi = 100)
TDF_Textura_Suelo_suma <- rbind(TDF_Textura_Suelo,Summary)
colnames(TDF_Textura_Suelo_suma) <- c("Textura Suelo", "ni", "hi(%)")
#Graficas
# Diagrama de barrras local ni
barplot(ni, main = "Gráfica N°37: Distribución de frecuencias de
La Textura de Suelo",
xlab = "Textura de Suelo",
ylab = "Cantidad",
col = "red",
ylim = c(0,770),
las = 1,
cex.names = 0.6,
names.arg = TDF_Textura_Suelo$Textura_Suelo)
#Diagrama de barras global ni
barplot(ni, main = "Gráfica N°38: Distribución de frecuencias de
La Textura de Suelo",
xlab = "Textura de Suelo",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las=1,
cex.names = 0.6,
names.arg = TDF_Textura_Suelo$Textura_Suelo)
#Diagrama de barras local hi(%)
barplot(hi, main = "Gráfica N°39: Distribución de frecuencias porcentual de
La Textura de Suelo",
xlab = "Textura de Suelo",
ylab = "Porcentaje",
col = "green",
ylim = c(0,26),
las = 1,
cex.names = 0.6,
names.arg = TDF_Textura_Suelo$Textura_Suelo)
#Diagrama de barras global hi(%)
barplot(hi, main = "Gráfica N°40: Distribución de frecuencias porcentual de
La Textura de Suelo",
xlab = "Textura de Suelo",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 1,
cex.names = 0.6,
names.arg = TDF_Textura_Suelo$Textura_Suelo)
#Diagrama circular
etiqueta_pie <- paste(TDF_Textura_Suelo$hi, "%")
pie(hi,
main = "Gráfica N°41 Distribución porcentual de La Textura de Suelo",
radius = 1,
labels = etiqueta_pie,
col = rev(heat.colors(length(hi))),
cex = 0.8,
cex.main = 1)
legend("topright",
legend = TDF_Textura_Suelo$Textura_Suelo,
fill = colores <- c(rev(heat.colors(10))),
cex = 0.8,
title = "Leyenda")