UNIVERSIDAD CENTRAL DEL ECUADOR

PROYECTO:ANALISIS ESTADÍSTICO DE LA CALIDAD DE AIRE EN LA INDIA

FECHA: 02/12/2025

#Estadistica descriptiva 
#Variable cuantitativa



#Cargar datos 

datos <- datasets::airquality
ozono <- na.omit(datos$Ozone)
ozono <- subset(ozono,ozono>=0)
min <- min(ozono)
max <- max(ozono)
R=max-min
k=1+(3.3)*log(length(ozono))
K=floor(k)
A<-R/k

#Secuencia intervalos
Li<-round(seq(from=min,to=max-A,by=A),2) 
Ls<-round(seq(from=min+A,to=max,by=A),2)
MC<-(Li+Ls)/2

#Crear ni

ni <- numeric(length(Li))
for (i in 1:length(Li)) {
  if (i < length(Li)) {
    ni[i] <- sum(ozono >= Li[i] & ozono < Ls[i])
  } else {
    ni[i] <- sum(ozono >= Li[i] & ozono <= Ls[i])  
  }
}
N <- sum(ni)
hi <- (ni / N) * 100
Ni_asc <- cumsum(ni)
Ni_desc <- rev(cumsum(rev(ni)))
Hi_asc <- cumsum(hi)
Hi_desc <- rev(cumsum(rev(hi)))
TDF_ozono<- data.frame(
  Intervalo = paste0("[", round(Li,2), " - ", round(Ls,2), ")"),
  MC = round(MC, 2),
  ni = ni,
  hi = round(hi, 2),
  Ni_asc = Ni_asc,
  Ni_descen = Ni_desc,
  Hi_asc = round(Hi_asc, 2),
  Hi_descen = round(Hi_desc, 2)
)
length(Li)
## [1] 16
# TABLA
library(gt)
library(dplyr)
TDF_ozono %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1*"),
    subtitle = md("**Distribucion de frecuencia de concentración de ozono**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 2\n Fuente:
                     datasets:airquality")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Distribucion de frecuencia de concentración de ozono
Intervalo MC ni hi Ni_asc Ni_descen Hi_asc Hi_descen
[1 - 11.01) 6.00 14 12.17 14 115 12.17 100.00
[11.01 - 21.02) 16.02 27 23.48 41 101 35.65 87.83
[21.02 - 31.02) 26.02 17 14.78 58 74 50.43 64.35
[31.02 - 41.03) 36.02 14 12.17 72 57 62.61 49.57
[41.03 - 51.04) 46.03 10 8.70 82 43 71.30 37.39
[51.04 - 61.05) 56.05 4 3.48 86 33 74.78 28.70
[61.05 - 71.06) 66.06 6 5.22 92 29 80.00 25.22
[71.06 - 81.06) 76.06 8 6.96 100 23 86.96 20.00
[81.06 - 91.07) 86.06 6 5.22 106 15 92.17 13.04
[91.07 - 101.08) 96.07 3 2.61 109 9 94.78 7.83
[101.08 - 111.09) 106.09 2 1.74 111 6 96.52 5.22
[111.09 - 121.09) 116.09 2 1.74 113 4 98.26 3.48
[121.09 - 131.1) 126.10 1 0.87 114 2 99.13 1.74
[131.1 - 141.11) 136.11 1 0.87 115 1 100.00 0.87
[141.11 - 151.12) 146.12 0 0.00 115 0 100.00 0.00
[151.12 - 161.13) 156.12 0 0.00 115 0 100.00 0.00
Autor: Grupo 2 Fuente: datasets:airquality