This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#Estadistica Descriptiva

#04/01/2026

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")


#Tablas Cualitativas 

# Variable original
industria_cercana <- datos$Nearby_Industry

# Tabla de frecuencia
TDF_Industria_Cercana <- as.data.frame(table(industria_cercana))

# Renombrar columnas
colnames(TDF_Industria_Cercana) <- c("Industria_Cercana", "ni")

# Frecuencias relativas
ni <- TDF_Industria_Cercana$ni
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi

# Tabla final
TDF_Industria_Cercana <- data.frame(
  Industria_Cercana = TDF_Industria_Cercana$Industria_Cercana,
  ni,
  hi,
  Pi
)


# TABLA 

TDF_Industria_Cercana %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("Tabla de distribución y probabilidades de las Industrias Cercanas")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Tabla de distribución y probabilidades de las Industrias Cercanas
Industria_Cercana ni hi Pi
Agriculture 621 20.70 20.70
Chemical 619 20.63 20.63
Mining 594 19.80 19.80
None 582 19.40 19.40
Textile 584 19.47 19.47
Autor: Grupo 3
barplot(hi, main = "Gráfica N°1: Distribución porcentual de 
        las Industrias Cercanas",
        xlab = "Industria Cercana ",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Industria_Cercana$Industria_Cercana)

barplot(hi, main = "Gráfica N°2: Distribución para la probabilidad de 
         las Industrias Cercanas",
        xlab = "Industrias Cercanas",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Industria_Cercana$Industria_Cercana)

# ¿Cuál es la probabilidad de que una industria cercana sea Textil?

prob_textil <- TDF_Industria_Cercana$Pi[
  TDF_Industria_Cercana$Industria_Cercana == "Textile"
]

cat(
  "¿Cuál es la probabilidad de que una industria cercana sea Textil?\n",
  "La probabilidad de que una industria cercana sea Textil es de",
  prob_textil, "%.\n"
)
## ¿Cuál es la probabilidad de que una industria cercana sea Textil?
##  La probabilidad de que una industria cercana sea Textil es de 19.47 %.
## ¿Cuál es la probabilidad de que una industria cercana sea Textil?
##  La probabilidad de que una industria cercana sea Textil es de 19.47 %.