berikut adalah link data yang digunakan bersumber dari kaggle: https://share.google/KNJcMoHifZueDnYGD # membaca data

library(readxl)
library(car)
## Loading required package: carData
library(trend)
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
## 
##     recode
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
udara_dki <- read_xlsx("/Users/M.Fabian.R.D/Desktop/SEMESTER 5/STATISTIKA LINGKUNGAN/PERTEMUAN 4/indeks_cuaca_DKI.xlsx")

print(udara_dki)
## # A tibble: 92 × 11
##    tanggal              pm10  pm25   so2    co    o3   no2   max critical
##    <dttm>              <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr>   
##  1 2021-10-01 00:00:00    58    91    59    11    65    38    91 PM25    
##  2 2021-10-02 00:00:00    70   127    61    12    58    35   127 PM25    
##  3 2021-10-03 00:00:00    70    96    62    11    53    28    96 PM25    
##  4 2021-10-04 00:00:00    62   110    60    11    64    29   110 PM25    
##  5 2021-10-05 00:00:00    65    90    67    11    54    33    90 PM25    
##  6 2021-10-06 00:00:00    66   103    66    10    58    35   103 PM25    
##  7 2021-10-07 00:00:00    52    77    60     9    50    28    77 PM25    
##  8 2021-10-08 00:00:00    60    98    64    11    54    35    98 PM25    
##  9 2021-10-09 00:00:00    55    83    62     9    60    29    83 PM25    
## 10 2021-10-10 00:00:00    61    97    61     9    72    26    97 PM25    
## # ℹ 82 more rows
## # ℹ 2 more variables: categori <chr>, location <chr>
udara_dki1 <- udara_dki %>% select(1,3)

uji statistik (uji homogen)

bartlett test

# uji bartlett
bartlett.test(pm25 ~ categori, data = udara_dki)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  pm25 by categori
## Bartlett's K-squared = 5.0272, df = 2, p-value = 0.08098

yang dimana berdasarkan theory dari jurnal “Jurnal Mahasiswa Entrepreneur (JME)” berjudul “PENGARUH CAPITAL INTENSITY TERHADAP PENGHINDARAN PAJAK DENGAN FINANCIAL DISTRESS SEBAGAI VARIABEL INTERVENING PADA PERUSAHAAN MANUFAKTUR YANG TERDAFTAR DI BURSA EFEK INDONESIA PEREODE 2017 – 2020”, dimana:

Ketentuan uji hipotesis dalam penelitian ini adalah sebagai berikut: - Original sample secara positif maka dapat dikatakan pengaruh yang signifikan. - Jika nilai P Value lebih besar dari 0,05 maka tidak dapat dikatakan pengaruh yang signifikan. - Jika nilai P Value lebih kecil dari 0,05 maka dapat dikatakan pengaruh yang signifikan.(Jurnal Mahasiswa Entrepreneur (JME))

sehingga, berdasarkan hasil yang didapat dari uji bartlett tersebut didapat hasil p-value sebesar 0.081 yang dimana itu melebih nilai p-value yang telah ditentukan. Sehingga berdasarkan hasil tersebut dapat disimpulkan bahwa data tersebut homogen

levene test

leveneTest(pm25 ~ categori, data = udara_dki)
## Warning in leveneTest.default(y = y, group = group, ...): group coerced to
## factor.
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  1.5341 0.2213
##       89

berdasarkan hasil yang didapat dari uji levene test tersebut didapat hasil p-value sebesar 0.2213 yang dimana itu melebih nilai p-value yang telah ditentukan. Sehingga berdasarkan hasil tersebut dapat disimpulkan bahwa data tersebut homogen

uji snht

str(udara_dki)
## tibble [92 × 11] (S3: tbl_df/tbl/data.frame)
##  $ tanggal : POSIXct[1:92], format: "2021-10-01" "2021-10-02" ...
##  $ pm10    : num [1:92] 58 70 70 62 65 66 52 60 55 61 ...
##  $ pm25    : num [1:92] 91 127 96 110 90 103 77 98 83 97 ...
##  $ so2     : num [1:92] 59 61 62 60 67 66 60 64 62 61 ...
##  $ co      : num [1:92] 11 12 11 11 11 10 9 11 9 9 ...
##  $ o3      : num [1:92] 65 58 53 64 54 58 50 54 60 72 ...
##  $ no2     : num [1:92] 38 35 28 29 33 35 28 35 29 26 ...
##  $ max     : num [1:92] 91 127 96 110 90 103 77 98 83 97 ...
##  $ critical: chr [1:92] "PM25" "PM25" "PM25" "PM25" ...
##  $ categori: chr [1:92] "SEDANG" "TIDAK SEHAT" "SEDANG" "TIDAK SEHAT" ...
##  $ location: chr [1:92] "DKI4" "DKI4" "DKI4" "DKI4" ...
head(udara_dki)
## # A tibble: 6 × 11
##   tanggal              pm10  pm25   so2    co    o3   no2   max critical
##   <dttm>              <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr>   
## 1 2021-10-01 00:00:00    58    91    59    11    65    38    91 PM25    
## 2 2021-10-02 00:00:00    70   127    61    12    58    35   127 PM25    
## 3 2021-10-03 00:00:00    70    96    62    11    53    28    96 PM25    
## 4 2021-10-04 00:00:00    62   110    60    11    64    29   110 PM25    
## 5 2021-10-05 00:00:00    65    90    67    11    54    33    90 PM25    
## 6 2021-10-06 00:00:00    66   103    66    10    58    35   103 PM25    
## # ℹ 2 more variables: categori <chr>, location <chr>
pm25 <- udara_dki$pm25
hasil_snht <- snh.test(pm25)
print(hasil_snht)
## 
##  Standard Normal Homogeneity Test (SNHT)
## 
## data:  pm25
## T = 23.636, n = 92, p-value < 2.2e-16
## alternative hypothesis: true delta is not equal to 0
## sample estimates:
## probable change point at time K 
##                              26
hasil_snht$estimate
## probable change point at time K 
##                              26

berdasarkan hasil dari uji SNHTest, didapatkan hasil sebesar 2.2e-16 untuk p-value-nya. yang berarti tidak homogen karenag kurang dari nilai p-value, jadi harus dilakukan uji selanjutnya yakni anova tersebut karena kurang dari nilai p-valuenya

Uji ANOVA

anova_model <- aov(pm25 ~ categori, data = udara_dki)
summary(anova_model)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## categori     2  26874   13437   62.01 <2e-16 ***
## Residuals   89  19286     217                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
oneway.test(pm25 ~ categori, data = udara_dki, var.equal = FALSE)
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  pm25 and categori
## F = 76.768, num df = 2.0000, denom df = 6.3481, p-value = 3.57e-05

Forecasting

Forecastingmerupakanproses memprediksi suatu keadaan pada masa sekarang dan masa mendatang denganmelalui pengujian keadaan pada masa sebelumnya. Forecastingbanyak digunakan dalammemprediksi suatu keadaan pada masa sekarang maupun masa mendatangdengan menggunakan beberapa algoritma, namun penelitian ini menggunakan tiga algoritmayaitu Single, Double, danTriple Exponential Smoothing. Ketiga algoritma ini, Triple Exponential Smoothing adalahalgoritmayang sering diimplementasikankarena algoritma yang digunakan dapat menghasilkan nilai erroryang kecil, sehingga dapat menghasilkan nilai prediksi yang akurat dalam peramalan beberapa periode kedepan.

data.ts <- ts(udara_dki1$pm25)
ts.plot(data.ts, xlab="Waktu", ylab="Harga Penutupan", main="Time Series Plot")
points(data.ts)

Dari grafik time series PM2.5 di Jakarta terlihat bahwa konsentrasi polutan ini sangat fluktuatif dengan naik-turun tajam sepanjang waktu. Di awal periode nilainya cenderung tinggi, kemudian sempat menurun cukup signifikan di pertengahan, sebelum kembali meningkat lagi di akhir periode. Beberapa titik bahkan melonjak sangat tinggi yang bisa mencerminkan kondisi polusi udara parah pada waktu tertentu. Secara umum, pola ini menunjukkan kualitas udara Jakarta tidak stabil dan dipengaruhi oleh berbagai faktor lingkungan serta aktivitas manusia.