UNIVERSIDAD CENTRAL DEL ECUADOR
ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD
FECHA: 20/11/2025
#Estadistica Descriptiva
#20/11/2025
#Cargar Datos
library(gt)
library(dplyr)
setwd("/cloud/project")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
sep = ",")
#Tablas Cualitativas Nominales
#Síntomas de Salud
Sintomas_Salud<-datos$Health_Symptoms
# Tabla de distribución de frecuencia
TDF_Sintomas_salud<-data.frame(table(Sintomas_Salud))
ni <- TDF_Sintomas_salud$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Sintomas_Salud <- TDF_Sintomas_salud$Sintomas_Salud
TDF_Sintomas_salud <- data.frame(Sintomas_Salud, ni, hi)
Summary <- data.frame(Sintomas_Salud = "TOTAL", ni = sum(ni),hi = 100)
TDF_Sintomas_salud_suma<-rbind(TDF_Sintomas_salud, Summary)
colnames(TDF_Sintomas_salud) <- c("Síntomas de salud", "ni", "hi(%)")
# TABLA
TDF_Sintomas_salud_suma %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 9*"),
subtitle = md("**Tabla de distribución de los Síntomas de Salud**")
) %>%
tab_source_note(
source_note = md("Autor: 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 9 | ||
| Tabla de distribución de los Síntomas de Salud | ||
| Sintomas_Salud | ni | hi |
|---|---|---|
| Abdominal Pain | 473 | 15.77 |
| Breathing Difficulty | 514 | 17.13 |
| Fatigue | 502 | 16.73 |
| Headache | 488 | 16.27 |
| Nausea | 500 | 16.67 |
| Rash | 523 | 17.43 |
| TOTAL | 3000 | 100.00 |
| Autor: 3 | ||
#Graficas
# Diagrama de barrras local ni
barplot(ni, main = "Gráfica N°41: Distribución
de los Síntomas de Salud ",
xlab = "Síntomas de Salud",
ylab = "Cantidad",
col = "red",
ylim = c(0,600),
las = 1,
cex.names = 0.5,
names.arg = TDF_Sintomas_salud$`Síntomas de salud`)
#Diagrama de barras global ni
barplot(ni, main = "Gráfica N°42: Distribución
de los Síntomas de Salud",
xlab = "Síntomas de Salud",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las=1,
cex.names = 0.5,
names.arg = TDF_Sintomas_salud$`Síntomas de salud`)
#Diagrama de barras local hi(%)
barplot(hi, main = "Gráfica N°43: Distribución porcentual
de los Síntomas de Salud",
xlab = "Síntomas de Salud",
ylab = "Porcentaje",
col = "green",
ylim = c(0,20),
las = 1,
cex.names = 0.6,
names.arg = TDF_Sintomas_salud$`Síntomas de salud`)
#Diagrama de barras global hi(%)
barplot(hi, main = "Gráfica N°44: Distribución porcentual
de los Síntomas de Salud",
xlab = "Síntomas de Salud",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 1,
cex.names = 0.6,
names.arg = TDF_Sintomas_salud$`Síntomas de salud`)
#Diagrama circular
etiqueta_pie <- paste(TDF_Sintomas_salud$hi, "%")
pie(hi,
main = "Gráfica N°45: Distribución porcentual
de los Síntomas de Salud",
radius = 1,
labels = etiqueta_pie,
col = rev(heat.colors(length(hi))),
cex = 0.9,
cex.main = 1)
legend("topright",
legend = TDF_Sintomas_salud$`Síntomas de salud`,
fill = colores <- c(rev(heat.colors(7))),
cex = 0.6,
title = "Leyenda")
# INDICADORES
# Función de moda
moda <- function(x) {
frec <- table(x)
names(frec)[which.max(frec)]
}
# Moda de la variable Sintomas de Salud
moda(datos$Health_Symptoms)
## [1] "Rash"