UNIVERSIDAD CENTRAL DEL ECUADOR

Facultad de Ingeniería en Geología, Minas, Petroleos y Ambiental

Ingeniería Ambiental

# Extraer variable cualitativa ordinal

setwd("C:/Users/KEVIN/OneDrive - Universidad Central del Ecuador/Escritorio/kevin/Estadistica/mundial/Rstudio")
Datos <- read.csv("Tabla Enfermedades.csv",header = TRUE,sep = ";",dec = ".")

Tabla distribución de frecuencia

# Tabla distribución de frecuencia
ni <- Datos$ni
hi <- round((Datos$ni/sum(Datos$ni))*100,2)
TDF_Enfermedades <- data.frame(Datos,hi)
sum(Datos$ni)
## [1] 969893
sum(hi)
## [1] 100
# Ordenar por nivel de gravedad
orden <- c("Colera", "Tifoidea", "Diarrea")
TDF_Enfermedades <- TDF_Enfermedades[order(factor(TDF_Enfermedades$ENFERMEDADES, levels = orden)), ]
rownames(TDF_Enfermedades) <- NULL

Sumatoria <- data.frame(ENFERMEDADES = "TOTAL",
                        ni = sum(ni),
                        hi= sum(hi))
TDF_enfermedades_suma <- rbind(TDF_Enfermedades,Sumatoria)
colnames(TDF_Enfermedades) <- c("Enfermedades","ni","hi (%)")
colnames(TDF_enfermedades_suma) <- c("Enfermedades","ni","hi (%)")

library(knitr)
## Warning: package 'knitr' was built under R version 4.4.2
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.4.2
kable(TDF_enfermedades_suma, align = 'c',
      caption = "Tabla de Distribucion de Frecuencias de enfermedades de los países de estudio") %>%
  kable_styling(full_width = FALSE, position = "center",
                bootstrap_options = c("striped", "hover", "condensed"))
Tabla de Distribucion de Frecuencias de enfermedades de los países de estudio
Enfermedades ni hi (%)
Colera 72753 7.50
Tifoidea 147810 15.24
Diarrea 749330 77.26
TOTAL 969893 100.00

Graficas

# Diagrama de barrras local
options(scipen = 999)

barplot(TDF_Enfermedades$ni,
        main="Gráfica N°1: Distribución de cantidad de casos de enfermedades
        de los países del estudio",
        xlab = "Enfermedades",
        ylab = "Cantidad",
        col = "skyblue",
        cex.axis = 0.5,
        ylim = c(0,750000),
        las=1,
        names.arg=TDF_Enfermedades$Enfermedades)

barplot(TDF_Enfermedades$hi,
        main="Gráfica N°2: Distribución porcentual de los casos de enfermedades
        de los países del estudio",
        xlab = "Enfermedades",
        ylab = "Porcentaje (%)",
        col = "green",
        ylim = c(0,80),
        las=1,
        names.arg=TDF_Enfermedades$Enfermedades)

# Diagrama de barrras global
barplot(TDF_Enfermedades$ni,
        main="Gráfica N°3: Distribución de cantidad de casos de enfermedades
        de los países del estudio",
        ylab = "Cantidad",
        col = "pink",
        ylim = c(0,sum(ni)),
        las=1,
        cex.axis = 0.7,
        las=1,
        names.arg = TDF_Enfermedades$Enfermedades)

barplot(TDF_Enfermedades$hi,
main="Gráfica N°4: Distribución porcentual de los casos de enfermedades
        de los países del estudio",
        ylab = "Porcentaje (%)",
        col = "skyblue",
        ylim = c(0,100),
        names.arg=TDF_Enfermedades$Enfermedades)

# Diagrma circular

pie(TDF_Enfermedades$hi,
    main = "Gráfica N° 5: Distribución porcentual de los casos de enfermedades
        de los países del estudio",
    radius = 1,
    labels = paste0(TDF_Enfermedades$hi,"%"),
    col = colores <- c(heat.colors(3)),
    cex=1,
    cex.main=1.2)

legend("topright",
       legend = TDF_Enfermedades$Enfermedades,
       fill = colores <- c(heat.colors(3)),
       cex = 0.95,
       title = "Leyenda")

# Indicadores estadísticos
# MODA
max_frecuencia <- max(TDF_Enfermedades$ni)
moda <- TDF_Enfermedades$Enfermedades[TDF_Enfermedades$ni==max_frecuencia]
print(moda)
## [1] "Diarrea"