This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#Estadistica Descriptiva

#04/01/2026

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")


#Tablas Cualitativas 

#Textura Suelo

Region <- datos$Region

#Tabla de Distribucion de Frecuencia

TDF_Region <-data.frame(table(Region))

ni <- TDF_Region$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi 

Region <- TDF_Region$Region

TDF_Region <- data.frame(Region, ni, hi, Pi)

Summary <- data.frame(
  Region = "TOTAL",
  ni = sum(ni),
  hi = 100,
  Pi = 100
)

TDF_Region_suma <- rbind(TDF_Region, Summary)

colnames(TDF_Region) <- c("Region", "ni", "hi(%)", "Pi(%)")


# TABLA 

TDF_Region %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("Tabla de distribución y probabilidades de las Region")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Tabla de distribución y probabilidades de las Region
Region ni hi(%) Pi(%)
Africa 518 17.27 17.27
Asia 528 17.60 17.60
Australia 489 16.30 16.30
Europe 483 16.10 16.10
North America 490 16.33 16.33
South America 492 16.40 16.40
Autor: Grupo 3
barplot(hi, main = "Gráfica N°1: Distribución porcentual de 
        las Regiones",
        xlab = "Region",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Region$Region)

barplot(hi, main = "Gráfica N°2: Distribución para la probabilidad de 
         las Regiones",
        xlab = "Region",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Region$Region)

# ¿ Cuál es la probabilidad de la porcion de suelo estudiada sea parte la region Asiatica?

prob_asia <- TDF_Region$Pi[
  TDF_Region$Region == "Asia"
]

cat(
  "¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia?\n",
  "La probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia es de",
  prob_asia, "%.\n"
)
## ¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia?
##  La probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia es de 17.6 %.
## ¿Cuál es la probabilidad de encontrar una porcion estudiada que pertenezca a la Regio de Asia?
##  La probabilidad de encontrar una textura arcillosa en el suelo es de 17.6 %.