This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.
Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.
#Estadistica Descriptiva
#04/01/2026
#Cargar Datos
library(gt)
library(dplyr)
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
sep = ",")
#Tablas Cualitativas
# Variable original
industria_cercana <- datos$Nearby_Industry
# Tabla de frecuencia
TDF_Industria_Cercana <- as.data.frame(table(industria_cercana))
# Renombrar columnas
colnames(TDF_Industria_Cercana) <- c("Industria_Cercana", "ni")
# Frecuencias relativas
ni <- TDF_Industria_Cercana$ni
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi
# Tabla final
TDF_Industria_Cercana <- data.frame(
Industria_Cercana = TDF_Industria_Cercana$Industria_Cercana,
ni,
hi,
Pi
)
# TABLA
TDF_Industria_Cercana %>%
gt() %>%
tab_header(
title = md("Tabla Nro. 1"),
subtitle = md("Tabla de distribución y probabilidades de las Industrias Cercanas")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 1 | |||
| Tabla de distribución y probabilidades de las Industrias Cercanas | |||
| Industria_Cercana | ni | hi | Pi |
|---|---|---|---|
| Agriculture | 621 | 20.70 | 20.70 |
| Chemical | 619 | 20.63 | 20.63 |
| Mining | 594 | 19.80 | 19.80 |
| None | 582 | 19.40 | 19.40 |
| Textile | 584 | 19.47 | 19.47 |
| Autor: Grupo 3 | |||
barplot(hi, main = "Gráfica N°1: Distribución porcentual de
las Industrias Cercanas",
xlab = "Industria Cercana ",
ylab = "Porcentaje",
col = "green",
ylim = c(0,26),
las = 1,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
barplot(hi, main = "Gráfica N°2: Distribución para la probabilidad de
las Industrias Cercanas",
xlab = "Industrias Cercanas",
ylab = "Probabilidad",
col = "green",
ylim = c(0,26),
las = 1,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
# ¿Cuál es la probabilidad de que una industria cercana sea Textil?
prob_textil <- TDF_Industria_Cercana$Pi[
TDF_Industria_Cercana$Industria_Cercana == "Textile"
]
cat(
"¿Cuál es la probabilidad de que una industria cercana sea Textil?\n",
"La probabilidad de que una industria cercana sea Textil es de",
prob_textil, "%.\n"
)
## ¿Cuál es la probabilidad de que una industria cercana sea Textil?
## La probabilidad de que una industria cercana sea Textil es de 19.47 %.
## ¿Cuál es la probabilidad de que una industria cercana sea Textil?
## La probabilidad de que una industria cercana sea Textil es de 19.47 %.