Lorien Arcentales
20/11/2025
#UNIVERSIDAD CENTRAL DEL ECUADOR #FIGEMPA#Ingeniería Ambiental
#ESTADISTICA DESCRIPTIVA
#Lorien Arcentales
#20/11/2025
#Carga de paquetes
library(gt)
library(dplyr)
#Carga de datos
datos<- read.csv("city_day.csv",header = TRUE,dec = ".",sep = ",")
datos <- datos[!is.na(datos$City) & datos$City != "", ]
str(datos)
## 'data.frame': 29531 obs. of 22 variables:
## $ City : chr "Ahmedabad" "Ahmedabad" "Ahmedabad" "Ahmedabad" ...
## $ State : chr "Gujarat" "Gujarat" "Gujarat" "Gujarat" ...
## $ StationName : chr "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" ...
## $ Zona : chr "Oeste" "Oeste" "Oeste" "Oeste" ...
## $ Longitud : num 73 73 73 73 73 ...
## $ Latitud : num 21.6 21.6 21.6 21.6 21.6 ...
## $ Date : chr "1/1/2015" "2/1/2015" "3/1/2015" "4/1/2015" ...
## $ PM2.5 : chr "-" "-" "-" "-" ...
## $ PM10 : chr "-" "-" "-" "-" ...
## $ NO : chr "0.92" "0.97" "17.4" "1.7" ...
## $ NO2 : chr "18.22" "15.69" "19.3" "18.48" ...
## $ NOx : chr "17.15" "16.46" "29.7" "17.97" ...
## $ NH3 : chr "-" "-" "-" "-" ...
## $ CO : chr "0.92" "0.97" "17.4" "1.7" ...
## $ SO2 : chr "27.64" "24.55" "29.07" "18.59" ...
## $ O3 : chr "133.36" "34.06" "30.7" "36.08" ...
## $ Benzene : chr "0" "3.68" "6.8" "4.43" ...
## $ Toluene : chr "0.02" "5.5" "16.4" "10.14" ...
## $ Xylene : chr "0" "3.77" "2.25" "1" ...
## $ AQI : chr "-" "-" "-" "-" ...
## $ AQI_Bucket : chr "-" "-" "-" "-" ...
## $ Número.de.habitantes: int 9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 ...
#Tablas Cualitativas
#Extraer Variable
Ciudad<-datos$City
#TDF
habitantes<- datos %>%
select(City, Número.de.habitantes) %>%
distinct()
TDF_ciudad_habitantes<-data.frame(table(Ciudad))
TDF_ciudad_habitantes <- merge(
TDF_ciudad_habitantes,
habitantes,
by.x = "Ciudad",
by.y = "City",
all.x = TRUE
)
TDF_ciudad_habitantes <- TDF_ciudad_habitantes[, c("Número.de.habitantes",
"Ciudad", "Freq")]
ni<-TDF_ciudad_habitantes$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Ciudad<-TDF_ciudad_habitantes$Ciudad
TDF_ciudad_habitantes$ni <- ni
TDF_ciudad_habitantes$hi <- hi
TDF_ciudad_habitantes$Freq <- NULL
Summary <- data.frame(
Número.de.habitantes = NA,
Ciudad = "TOTAL",
ni = sum(TDF_ciudad_habitantes$ni),
hi = 100
)
TDF_ciudad_habitantes <- rbind(TDF_ciudad_habitantes, Summary)
colnames(TDF_ciudad_habitantes) <- c(
"Número de habitantes",
"Ciudades",
"ni",
"hi(%)"
)
TDF_ciudad_habitantes %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 1*"),
subtitle = md("**Distribucion de frecuencia de ciudades con su número de habitantes,estudio calidad del aire en India entre 2015-2020 **")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 2\n Fuente:https://www.kaggle.com/datasets/rohanrao/air-quality-data-in-india")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 1 | |||
| **Distribucion de frecuencia de ciudades con su número de habitantes,estudio calidad del aire en India entre 2015-2020 ** | |||
| Número de habitantes | Ciudades | ni | hi(%) |
|---|---|---|---|
| 9060000 | Ahmedabad | 2009 | 6.80 |
| 405000 | Aizawl | 113 | 0.38 |
| 608000 | Amaravati | 951 | 3.22 |
| 1100000 | Amritsar | 1221 | 4.13 |
| 14400000 | Bengaluru | 2009 | 6.80 |
| 2690000 | Bhopal | 289 | 0.98 |
| 81000 | Brajrajnagar | 938 | 3.18 |
| 1050000 | Chandigarh | 304 | 1.03 |
| 12300000 | Chennai | 2009 | 6.80 |
| 3160000 | Coimbatore | 386 | 1.31 |
| 33800000 | Delhi | 2009 | 6.80 |
| 3100000 | Ernakulam | 162 | 0.55 |
| 870000 | Gurugram | 1679 | 5.69 |
| 1200000 | Guwahati | 502 | 1.70 |
| 11300000 | Hyderabad | 2006 | 6.79 |
| 4300000 | Jaipur | 1114 | 3.77 |
| 8000 | Jorapokhar | 1169 | 3.96 |
| 878000 | Kochi | 162 | 0.55 |
| 15800000 | Kolkata | 814 | 2.76 |
| 3900000 | Lucknow | 2009 | 6.80 |
| 22000000 | Mumbai | 2009 | 6.80 |
| 2690000 | Patna | 1858 | 6.29 |
| 520000 | Shillong | 310 | 1.05 |
| 66000 | Talcher | 925 | 3.13 |
| 3070000 | Thiruvananthapuram | 1112 | 3.77 |
| 2440000 | Visakhapatnam | 1462 | 4.95 |
| NA | TOTAL | 29531 | 100.00 |
| Autor: Grupo 2 Fuente:https://www.kaggle.com/datasets/rohanrao/air-quality-data-in-india | |||