Lorien Arcentales

20/11/2025

#UNIVERSIDAD CENTRAL DEL ECUADOR #FIGEMPA#Ingeniería Ambiental

#ESTADISTICA DESCRIPTIVA
#Lorien Arcentales
#20/11/2025
#Carga de paquetes
library(gt)
library(dplyr)
#Carga de datos
datos<- read.csv("city_day.csv",header = TRUE,dec = ".",sep = ",")
datos <- datos[!is.na(datos$City) & datos$City != "", ]
str(datos)
## 'data.frame':    29531 obs. of  22 variables:
##  $ City                : chr  "Ahmedabad" "Ahmedabad" "Ahmedabad" "Ahmedabad" ...
##  $ State               : chr  "Gujarat" "Gujarat" "Gujarat" "Gujarat" ...
##  $ StationName         : chr  "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" "Maninagar, Ahmedabad - GPCB" ...
##  $ Zona                : chr  "Oeste" "Oeste" "Oeste" "Oeste" ...
##  $ Longitud            : num  73 73 73 73 73 ...
##  $ Latitud             : num  21.6 21.6 21.6 21.6 21.6 ...
##  $ Date                : chr  "1/1/2015" "2/1/2015" "3/1/2015" "4/1/2015" ...
##  $ PM2.5               : chr  "-" "-" "-" "-" ...
##  $ PM10                : chr  "-" "-" "-" "-" ...
##  $ NO                  : chr  "0.92" "0.97" "17.4" "1.7" ...
##  $ NO2                 : chr  "18.22" "15.69" "19.3" "18.48" ...
##  $ NOx                 : chr  "17.15" "16.46" "29.7" "17.97" ...
##  $ NH3                 : chr  "-" "-" "-" "-" ...
##  $ CO                  : chr  "0.92" "0.97" "17.4" "1.7" ...
##  $ SO2                 : chr  "27.64" "24.55" "29.07" "18.59" ...
##  $ O3                  : chr  "133.36" "34.06" "30.7" "36.08" ...
##  $ Benzene             : chr  "0" "3.68" "6.8" "4.43" ...
##  $ Toluene             : chr  "0.02" "5.5" "16.4" "10.14" ...
##  $ Xylene              : chr  "0" "3.77" "2.25" "1" ...
##  $ AQI                 : chr  "-" "-" "-" "-" ...
##  $ AQI_Bucket          : chr  "-" "-" "-" "-" ...
##  $ Número.de.habitantes: int  9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 9060000 ...
#Tablas Cualitativas
#Extraer Variable
Ciudad<-datos$City
#TDF
habitantes<- datos %>% 
  select(City, Número.de.habitantes) %>% 
  distinct()
TDF_ciudad_habitantes<-data.frame(table(Ciudad))
TDF_ciudad_habitantes <- merge(
  TDF_ciudad_habitantes,
  habitantes,
  by.x = "Ciudad",
  by.y = "City",
  all.x = TRUE
)

TDF_ciudad_habitantes <- TDF_ciudad_habitantes[, c("Número.de.habitantes",
                                                   "Ciudad", "Freq")]
ni<-TDF_ciudad_habitantes$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Ciudad<-TDF_ciudad_habitantes$Ciudad
TDF_ciudad_habitantes$ni <- ni
TDF_ciudad_habitantes$hi <- hi
TDF_ciudad_habitantes$Freq <- NULL
Summary <- data.frame(
  Número.de.habitantes = NA,
  Ciudad = "TOTAL",      
  ni = sum(TDF_ciudad_habitantes$ni),
  hi = 100
)
TDF_ciudad_habitantes <- rbind(TDF_ciudad_habitantes, Summary)
colnames(TDF_ciudad_habitantes) <- c(
  "Número de habitantes",
  "Ciudades",
  "ni",
  "hi(%)"
)
TDF_ciudad_habitantes %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1*"),
    subtitle = md("**Distribucion de frecuencia de ciudades con su número de habitantes,estudio calidad del aire en India entre 2015-2020 **")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2\n Fuente:https://www.kaggle.com/datasets/rohanrao/air-quality-data-in-india")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
**Distribucion de frecuencia de ciudades con su número de habitantes,estudio calidad del aire en India entre 2015-2020 **
Número de habitantes Ciudades ni hi(%)
9060000 Ahmedabad 2009 6.80
405000 Aizawl 113 0.38
608000 Amaravati 951 3.22
1100000 Amritsar 1221 4.13
14400000 Bengaluru 2009 6.80
2690000 Bhopal 289 0.98
81000 Brajrajnagar 938 3.18
1050000 Chandigarh 304 1.03
12300000 Chennai 2009 6.80
3160000 Coimbatore 386 1.31
33800000 Delhi 2009 6.80
3100000 Ernakulam 162 0.55
870000 Gurugram 1679 5.69
1200000 Guwahati 502 1.70
11300000 Hyderabad 2006 6.79
4300000 Jaipur 1114 3.77
8000 Jorapokhar 1169 3.96
878000 Kochi 162 0.55
15800000 Kolkata 814 2.76
3900000 Lucknow 2009 6.80
22000000 Mumbai 2009 6.80
2690000 Patna 1858 6.29
520000 Shillong 310 1.05
66000 Talcher 925 3.13
3070000 Thiruvananthapuram 1112 3.77
2440000 Visakhapatnam 1462 4.95
NA TOTAL 29531 100.00
Autor: Grupo 2 Fuente:https://www.kaggle.com/datasets/rohanrao/air-quality-data-in-india