This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#Estadistica Descriptiva

#04/01/2026

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")

#Tablas Cualitativas 

# Variable original
tipo_cultivo <- datos$Crop_Type

# Tabla de frecuencia
TDF_Tipo_Cultivo <- as.data.frame(table(tipo_cultivo))

# Renombrar columnas
colnames(TDF_Tipo_Cultivo) <- c("Tipo_Cultivo", "ni")

# Frecuencias relativas
ni <- TDF_Tipo_Cultivo$ni
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi

# Tabla final
TDF_Tipo_Cultivo <- data.frame(
  Tipo_Cultivo = TDF_Tipo_Cultivo$Tipo_Cultivo,
  ni,
  hi,
  Pi
)


# TABLA 

TDF_Tipo_Cultivo %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("Tabla de distribución y probabilidades de los Tipos de Cultivo")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Tabla de distribución y probabilidades de los Tipos de Cultivo
Tipo_Cultivo ni hi Pi
Corn 526 17.53 17.53
Cotton 485 16.17 16.17
Potato 493 16.43 16.43
Rice 483 16.10 16.10
Soybean 497 16.57 16.57
Wheat 516 17.20 17.20
Autor: Grupo 3
barplot(hi, main = "Gráfica N°1: Distribución porcentual de 
        los Tipos de Cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

barplot(hi, main = "Gráfica N°2: Distribución para la probabilidad de 
         los Tipos de Cultivo",
        xlab = "Tipo de Cultivo",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Cultivo$Tipo_Cultivo)

# ¿Cuál es la probabilidad de encontrar arroz como tipo de cultivo?

prob_arroz <- TDF_Tipo_Cultivo$Pi[
  TDF_Tipo_Cultivo$Tipo_Cultivo == "Rice"
]

cat(
  "¿Cuál es la probabilidad de encontrar arroz como tipo de cultivo?\n",
  "La probabilidad de encontrar arroz como tipo de cultivo es de",
  prob_arroz, "%.\n"
)
## ¿Cuál es la probabilidad de encontrar arroz como tipo de cultivo?
##  La probabilidad de encontrar arroz como tipo de cultivo es de 16.1 %.
## ¿Cuál es la probabilidad de encontrar arroz como tipo de cultivo
##  La probabilidad de encontrar una textura arcillosa en el suelo es de 16.1 %.