FECHA: 24/12/2025
#Estadistica Descriptiva
#24/12/2025
#Cargar Datos
library(gt)
library(dplyr)
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
sep = ",")
#Tipo de fuente de agua
Tipo_fuente_agua <- datos$Water_Source_Type
TDF_Tipo_fuente_agua <-data.frame(table(Tipo_fuente_agua))
ni <- TDF_Tipo_fuente_agua$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi
Tipo_fuente_agua <- TDF_Tipo_fuente_agua$Tipo_fuente_agua
TDF_Tipo_fuente_agua <- data.frame(Tipo_fuente_agua, ni, hi, Pi)
Summary <- data.frame(
Tipo_fuente_agua = "TOTAL",
ni = sum(ni),
hi = 100,
Pi = 100
)
TDF_Tipo_fuente_agua_suma <- rbind(TDF_Tipo_fuente_agua, Summary)
colnames(TDF_Tipo_fuente_agua_suma) <- c("Textura Suelo", "ni", "hi(%)", "Pi(%)")
# TABLA
TDF_Tipo_fuente_agua_suma %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 2*"),
subtitle = md("Tabla de distribución y probabilidades de los tipos de fuente de agua")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 2 |
| Tabla de distribución y probabilidades de los tipos de fuente de agua |
| Textura Suelo |
ni |
hi(%) |
Pi(%) |
| Irrigation Canal |
591 |
19.70 |
19.70 |
| Lake |
596 |
19.87 |
19.87 |
| Rainwater |
602 |
20.07 |
20.07 |
| River |
592 |
19.73 |
19.73 |
| Well |
619 |
20.63 |
20.63 |
| TOTAL |
3000 |
100.00 |
100.00 |
| Autor: Grupo 3 |
barplot(hi, main = "Gráfica N°3: Distribución porcentual de
los tipos de fuente de agua",
xlab = "Textura de Suelo",
ylab = "Porcentaje",
col = "green",
ylim = c(0,26),
las = 1,
cex.names = 0.6,
names.arg = TDF_Tipo_fuente_agua$Tipo_fuente_agua)

barplot(hi, main = "Gráfica N°4: Distribución para la probabilidad de
los tipos de fuente de agua",
xlab = "Textura de Suelo",
ylab = "Probabilidad",
col = "green",
ylim = c(0,26),
las = 1,
cex.names = 0.6,
names.arg = TDF_Tipo_fuente_agua$Tipo_fuente_agua)

# ¿ Cuál es la probabilidad de que un río sea una fuente de agua?
prob_rio <- TDF_Tipo_fuente_agua$Pi[
TDF_Tipo_fuente_agua$Tipo_fuente_agua == "River"
]
cat(
"¿Cuál es la probabilidad de que un río sea una fuente de agua?\n",
"La probabilidad de encontrar un río como fuente de agua es de",
prob_rio, "%.\n"
)
## ¿Cuál es la probabilidad de que un río sea una fuente de agua?
## La probabilidad de encontrar un río como fuente de agua es de 19.73 %.