This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#Estadistica Descriptiva

#04/01/2026

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")


#Tablas Cualitativas 

#Textura Suelo

País <- datos$Country

#Tabla de Distribucion de Frecuencia

TDF_País <-data.frame(table(País))

ni <- TDF_País$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi 

País <- TDF_País$País

TDF_País <- data.frame(País, ni, hi, Pi)

Summary <- data.frame(
  País = "TOTAL",
  ni = sum(ni),
  hi = 100,
  Pi = 100
)

TDF_País_suma <- rbind(TDF_País, Summary)

colnames(TDF_País) <- c("País", "ni", "hi(%)", "Pi(%)")


# TABLA 

TDF_País %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("Tabla de distribución y probabilidades de los Paices")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Tabla de distribución y probabilidades de los Paices
País ni hi(%) Pi(%)
Australia 278 9.27 9.27
Brazil 293 9.77 9.77
China 319 10.63 10.63
Germany 283 9.43 9.43
India 311 10.37 10.37
Kenya 271 9.03 9.03
Mexico 314 10.47 10.47
Nigeria 309 10.30 10.30
Pakistan 305 10.17 10.17
USA 317 10.57 10.57
Autor: Grupo 3
barplot(hi, main = "Gráfica N°1: Distribución porcentual de 
        los paices",
        xlab = "País",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_País$País)

barplot(hi, main = "Gráfica N°2: Distribución para la probabilidad de 
         los paices",
        xlab = "País",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_País$País)

# ¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a Brazil?

prob_brazil <- TDF_País$Pi[
  TDF_País$País == "Brazil"
]

cat(
  "¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a Brazil?\n",
  "La probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia es de",
  prob_brazil, "%.\n"
)
## ¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a Brazil?
##  La probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia es de 9.77 %.
## ¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a Brazil?
##  La probabilidad de encontrar una textura arcillosa en el suelo es de 9.77 %.