UNIVERSIDAD CENTRAL DEL ECUADOR
Facultad de Ingeniería en Geología, Minas, Petroleos y
Ambiental
Ingeniería Ambiental
# Extraer variable cualitativa ordinal
setwd("C:/Users/KEVIN/OneDrive - Universidad Central del Ecuador/Escritorio/kevin/Estadistica/mundial/Rstudio")
Datos <- read.csv("Tabla Enfermedades.csv",header = TRUE,sep = ";",dec = ".")
Tabla distribución de frecuencia
# Tabla distribución de frecuencia
ni <- Datos$ni
hi <- round((Datos$ni/sum(Datos$ni))*100,2)
TDF_Enfermedades <- data.frame(Datos,hi)
sum(Datos$ni)
## [1] 969893
sum(hi)
## [1] 100
# Ordenar por nivel de gravedad
orden <- c("Colera", "Tifoidea", "Diarrea")
TDF_Enfermedades <- TDF_Enfermedades[order(factor(TDF_Enfermedades$ENFERMEDADES, levels = orden)), ]
rownames(TDF_Enfermedades) <- NULL
Sumatoria <- data.frame(ENFERMEDADES = "TOTAL",
ni = sum(ni),
hi= sum(hi))
TDF_enfermedades_suma <- rbind(TDF_Enfermedades,Sumatoria)
colnames(TDF_Enfermedades) <- c("Enfermedades","ni","hi (%)")
colnames(TDF_enfermedades_suma) <- c("Enfermedades","ni","hi (%)")
library(knitr)
## Warning: package 'knitr' was built under R version 4.4.2
library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.4.2
kable(TDF_enfermedades_suma, align = 'c',
caption = "Tabla de Distribucion de Frecuencias de enfermedades de los países de estudio") %>%
kable_styling(full_width = FALSE, position = "center",
bootstrap_options = c("striped", "hover", "condensed"))
Tabla de Distribucion de Frecuencias de enfermedades de los países de
estudio
|
Enfermedades
|
ni
|
hi (%)
|
|
Colera
|
72753
|
7.50
|
|
Tifoidea
|
147810
|
15.24
|
|
Diarrea
|
749330
|
77.26
|
|
TOTAL
|
969893
|
100.00
|
Graficas
# Diagrama de barrras local
options(scipen = 999)
barplot(TDF_Enfermedades$ni,
main="Gráfica N°1: Distribución de cantidad de casos de enfermedades
de los países del estudio",
xlab = "Enfermedades",
ylab = "Cantidad",
col = "skyblue",
cex.axis = 0.5,
ylim = c(0,750000),
las=1,
names.arg=TDF_Enfermedades$Enfermedades)

barplot(TDF_Enfermedades$hi,
main="Gráfica N°2: Distribución porcentual de los casos de enfermedades
de los países del estudio",
xlab = "Enfermedades",
ylab = "Porcentaje (%)",
col = "green",
ylim = c(0,80),
las=1,
names.arg=TDF_Enfermedades$Enfermedades)

# Diagrama de barrras global
barplot(TDF_Enfermedades$ni,
main="Gráfica N°3: Distribución de cantidad de casos de enfermedades
de los países del estudio",
ylab = "Cantidad",
col = "pink",
ylim = c(0,sum(ni)),
las=1,
cex.axis = 0.7,
las=1,
names.arg = TDF_Enfermedades$Enfermedades)

barplot(TDF_Enfermedades$hi,
main="Gráfica N°4: Distribución porcentual de los casos de enfermedades
de los países del estudio",
ylab = "Porcentaje (%)",
col = "skyblue",
ylim = c(0,100),
names.arg=TDF_Enfermedades$Enfermedades)

# Diagrma circular
pie(TDF_Enfermedades$hi,
main = "Gráfica N° 5: Distribución porcentual de los casos de enfermedades
de los países del estudio",
radius = 1,
labels = paste0(TDF_Enfermedades$hi,"%"),
col = colores <- c(heat.colors(3)),
cex=1,
cex.main=1.2)
legend("topright",
legend = TDF_Enfermedades$Enfermedades,
fill = colores <- c(heat.colors(3)),
cex = 0.95,
title = "Leyenda")

# Indicadores estadísticos
# MODA
max_frecuencia <- max(TDF_Enfermedades$ni)
moda <- TDF_Enfermedades$Enfermedades[TDF_Enfermedades$ni==max_frecuencia]
print(moda)
## [1] "Diarrea"