UNIVERSIDAD CENTRAL DEL ECUADOR

ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 19/11/2025

# =========================
# ESTADÍSTICA Descriptiva
# Fecha: 19/11/2025
# =========================

library(gt)
library(dplyr)

# -------------------------
# Cargar datos
# -------------------------
setwd("C:/Users/Alexander/Downloads")

datos <- read.csv(
  "soil_pollution_diseases.csv",
  sep = ",",
  stringsAsFactors = FALSE
)

# =========================
# TABLAS CUALITATIVAS NOMINALES
# =========================

Tipo_Cultivo <- datos$Crop_Type

TDF_Tipo_Cultivo <- data.frame(table(Tipo_Cultivo))

ni <- TDF_Tipo_Cultivo$Freq
hi <- round((ni / sum(ni)) * 100, 2)

TDF_Tipo_Cultivo <- data.frame(Tipo_Cultivo = TDF_Tipo_Cultivo$Tipo_Cultivo, ni, hi)
Summary <- data.frame(Tipo_Cultivo = "TOTAL", ni = sum(ni), hi = 100)

TDF_Tipo_Cultivo_suma <- rbind(TDF_Tipo_Cultivo, Summary)
colnames(TDF_Tipo_Cultivo_suma) <- c("Tipo de Cultivo", "ni", "hi(%)")

# =========================
# TABLA
# =========================

TDF_Tipo_Cultivo_suma %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 3*"),
    subtitle = md("**Tabla de distribución del tipo de cultivo**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 3
Tabla de distribución del tipo de cultivo
Tipo de Cultivo ni hi(%)
Corn 526 17.53
Cotton 485 16.17
Potato 493 16.43
Rice 483 16.10
Soybean 497 16.57
Wheat 516 17.20
TOTAL 3000 100.00
Autor: Grupo 3
# =========================
# GRÁFICAS
# =========================

# Diagrama de barras local ni
barplot(ni,
        main = "Gráfica N°11: Distribución del tipo de cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0,600),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

# Diagrama de barras global ni
barplot(ni,
        main = "Gráfica N°12: Distribución del tipo de cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,3000),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

# Diagrama de barras local hi(%)
barplot(hi,
        main = "Gráfica N°13: Distribución porcentual del tipo de cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,20),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

# Diagrama de barras global hi(%)
barplot(hi,
        main = "Gráfica N°14: Distribución porcentual del tipo de cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Porcentaje",
        col = "blue",
        ylim = c(0,100),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

# =========================
# DIAGRAMA CIRCULAR
# =========================

etiquetas <- paste0(hi, " %")

colores <- c("yellow", "khaki1", "gold", "orange", "darkorange", "red")

par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = "Gráfica N°15 Distribución porcentual del tipo de cultivo",
  cex = 1
)

legend(
  "topright",
  legend = TDF_Tipo_Cultivo$Tipo_Cultivo,
  fill = colores,
  title = "Leyenda",
  cex = 0.5,
  xpd = TRUE
)

# =========================
# INDICADORES
# =========================
moda <- function(x) {
  frec <- table(x)         
  names(frec)[which.max(frec)]  
}

moda_tipo_cultivo <- moda(datos$Crop_Type)
moda_tipo_cultivo
## [1] "Corn"
cat("El valor más frecuente del Tipo de Cultivo es:", moda_tipo_cultivo)
## El valor más frecuente del Tipo de Cultivo es: Corn