Kata Pengantar

Puji syukur ke hadirat Tuhan Yang Maha Esa atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan tugas yang berjudul “Analisis Pengaruh Berat Kendaraan terhadap Konsumsi Bahan Bakar pada Dataset mtcars” dengan baik dan tepat waktu. Tugas ini disusun sebagai disusun sebagai salah satu bentuk pemenuhan tugas mata kuliah Pengantar Data Sains, sekaligus untuk mengetahui pengaruh berat kendaraan terhadap konsumsi bahan bakar, serta memahami dan menerapkan konsep regresi linear sederhana dalam menganalisis hubungan antara variabel berat kendaraan (wt) dan konsumsi bahan bakar (mpg) menggunakan dataset mtcars bawaan R.

Penulis menyadari bahwa dalam penyusunan tugas ini, banyak pihak yang telah memberikan bimbingan, arahan, serta dukungan moral yang sangat berarti. Oleh karena itu, penulis ingin menyampaikan ucapan terima kasih yang sebesar-besarnya kepada:

  1. Dr. Faula Arina, S.Si., M.Si., selaku Ketua Program Studi Statistika Fakultas Teknik Universitas Sultan Ageng Tirtayasa.
  2. Agung Satrio Wicaksono, S.Si., M.Si., selaku dosen mata kuliah Pengantar Data Sains, yang telah membimbing dan memberikan penjelasan selama perkuliahan.
  3. Rekan-rekan dan teman-teman yang telah memberikan dukungan, masukan, serta semangat selama proses penyusunan tugas ini.
  4. Orang tua dan keluarga yang selalu memberikan doa, dan motivasi

Penulis berharap tugas ini dapat memberikan manfaat bagi pembaca, khususnya dalam memahami penerapan analisis regresi linear sederhana dalam konteks data sains. Penulis juga menyadari bahwa tugas ini masih jauh dari sempurna, sehingga kritik dan saran yang membangun sangat diharapkan demi perbaikan di masa mendatang.

Abstrak

Tugas ini dilakukan sebagai bagian dari tugas mata kuliah Pengantar Data Sains dengan tujuan untuk memahami proses analisis data menggunakan metode regresi linear sederhana. Dataset yang digunakan adalah mtcars, yaitu dataset bawaan R yang berisi berbagai variabel performa kendaraan. Analisis difokuskan pada hubungan antara berat kendaraan (wt) dan konsumsi bahan bakar (mpg).

Hasil eksplorasi data menunjukkan adanya hubungan negatif antara kedua variabel, di mana kendaraan dengan bobot yang lebih tinggi cenderung memiliki nilai mpg yang lebih rendah. Model regresi linear sederhana yang dibangun menghasilkan koefisien regresi yang signifikan secara statistik, sehingga dapat disimpulkan bahwa berat kendaraan merupakan prediktor penting dalam menentukan efisiensi bahan bakar.

Analisis ini memberikan gambaran dasar mengenai penerapan konsep regresi dalam data sains serta menunjukkan bagaimana teknik ini dapat digunakan untuk memahami pola dan hubungan dalam suatu dataset.

Bab 1 Pendahuluan

Dataset mtcars adalah salah satu dataset klasik dalam lingkungan R yang berisi berisi 32 observasi kendaraan keluaran tahun 1973–1974 dengan 11 variabel yang menggambarkan karakteristik performa, seperti konsumsi bahan bakar (miles per gallon (mpg), jumlah silinder, tenaga mesin, hingga berat kendaraan (weight (wt).

Dataset ini awalnya dihimpun dari majalah Motor Trend edisi tahun 1974 sebagai bagian dari upaya memberikan informasi komparatif kepada konsumen otomotif mengenai efisiensi kendaraan dan spesifikasi teknis yang memengaruhi performa mobil pada masa tersebut.

Meskipun dataset ini berasal dari kendaraan generasi lama, isu mengenai efisiensi bahan bakar tetap menjadi perhatian penting hingga saat ini. Peningkatan jumlah kendaraan di berbagai negara, termasuk Indonesia, berkontribusi langsung pada konsumsi energi yang tinggi dan peningkatan emisi gas buang, yang berdampak pada kualitas udara dan perubahan iklim. Oleh karena itu, pemahaman mengenai faktor-faktor teknis yang memengaruhi konsumsi bahan bakar yang salah satunya berat kendaraan menjadi sangat relevan dalam konteks keberlanjutan dan upaya pengurangan dampak lingkungan.

Dengan menganalisis hubungan antara berat kendaraan dan konsumsi bahan bakar melalui dataset mtcars, tugas ini dapat memberikan gambaran dasar mengenai bagaimana karakteristik fisik kendaraan memengaruhi efisiensinya. Pemahaman ini penting sebagai langkah awal sebelum melakukan evaluasi pada kendaraan modern, sekaligus mendukung pemanfaatan energi yang lebih hemat dan ramah lingkungan.

2. METODE PENELITIAN

2.1 Sumber Data

Metode penugasan ini termasuk metode simulasi karena menggunakan dataset sekunder (mtcars) yang dapat diakses dengan bebas pada perangkat lunak R. Tugas ini memanfaatkan data yang telah ada untuk menguji hubungan antara berat kendaraan () dan konsumsi bahan bakar () melalui analisis regresi linear sederhana.

# Memanggil dan memuat dataset mtcars ke dalam environment R sehingga siap digunakan untuk analisis.
data(mtcars)
mtcars
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
head(mtcars) # Menampilkan 6 observasi teratas dari dataset
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

2.2 Variabel Penelitian

Variabel yang dianalisis adalah:

  • Variabel bebas: Berat kendaraan (wt)
  • Variabel terikat: Konsumsi bahan bakar (mpg)

2.3 Prosedur Analisis

Prosedur analisis dilakukan dalam beberapa tahap - Statistik desriptif - Analisis korelasi antara wt dan mpg - Regresi linear sederhana - Scatterplot beserta garis regresi - Uji signifikansi parameter model

Pra-pengolahan data

Memeriksa struktur dataset, memastikan tidak ada missing value

str(mtcars)

Digunakan untuk menampilkan struktur dataset mtcars. Fungsi ini memberikan - Jumlah observasi dan variabel - Nama variabel - Tipe data setiap variabel (numeric) - Contoh nilai awal dari masing-masing variabel

Membantu memastikan bahwa format data sudah sesuai untuk analisis

Periksa missing value:

sum(is.na(mtcars)) 
# digunakan untuk memeriksa apakah terdapat nilai hilang (missing value / NA) pada dataset mtcars.
  • is.na(mtcars) mengecek setiap elemen apakah bernilai NA dan menghasilkan nilai TRUE/FALSE.

  • sum(…) menjumlahkan semua nilai TRUE (yang dianggap 1), sehingga menghasilkan total jumlah NA dalam dataset.

Jika hasilnya 0, berarti dataset mtcars tidak memiliki missing value dan dapat langsung digunakan pada tahap analisis tanpa perlu melakukan imputasi atau pembersihan data.

1. Statistik deskriptif

Menghitung ringkasan statistik untuk variabel mpg dan wt

summary(mtcars[, c("mpg","wt")])
# untuk menampilkan statistik deskriptif dari dua variabel

Fungsi summary() memberikan rangkuman statistik utama, meliputi

  • Min (nilai minimum)
  • 1st Quartile (kuartil pertama)
  • Median
  • Mean (nilai rata-rata)
  • 3rd Quartile (kuartil ketiga)
  • Max (nilai maksimum)

Untuk mengetahui gambaran awal distribusi data, melihat apakah data cenderung rendah/tinggi, menilai apakah terdapat outlier secara kasar serta mendukung analisis regresi dengan memahami karakteristik variabel.

2. Korelasi (pearson)

Menghitung koefisien korelasi untuk melihat arah dan kekuatan hubungan antara wt dan mpg

cor(mtcars$mpg, mtcars$wt) 

Perhitungan ini bertujuan untuk melihat sejauh mana hubungan linear antara kedua variabel tersebut. Koefisien korelasi yang dihasilkan menunjukkan kekuatan dan arah hubungan, di mana nilai yang mendekati +1 menandakan hubungan positif yang kuat, nilai mendekati (negatif) 1 menunjukkan hubungan negatif yang kuat, dan nilai mendekati 0 menunjukkan tidak adanya hubungan linear yang berarti. Dalam konteks analisis ini, korelasi antara mpg dan wt membantu memahami apakah peningkatan berat kendaraan berkaitan dengan penurunan efisiensi bahan bakar sebelum dilakukan analisis regresi lebih lanjut.

3. Regresi linear sederhana

Membuat model regresi linear sederhana untuk memprediksi konsumsi bahan bakar (mpg) berdasarkan berat kendaraan (wt)

model <- lm(mpg ~ wt, data = mtcars)
summary(model)

Perintah lm(mpg ~ wt, data = mtcars) membentuk model regresi dengan mpg sebagai variabel terikat dan wt sebagai variabel bebas. Fungsi summary(model) kemudian menampilkan ringkasan hasil regresi, termasuk nilai koefisien, signifikansi statistik (p-value), nilai R-squared, serta ukuran kesalahan model (residuals). Melalui output ini, dapat menilai apakah berat kendaraan memiliki pengaruh signifikan terhadap konsumsi bahan bakar serta seberapa besar variasi pada mpg yang dapat dijelaskan oleh variabel wt.

4. Visualisasi scatterplot

Membuat scatterplot antara wt dan mpg serta menambahkan garis regresi linear untuk memperjelas hubungan:

plot(mtcars$wt, mtcars$mpg,
     xlab="Berat Kendaraan (wt)",
     ylab="Konsumsi Bahan Bakar (mpg)",
     main="Scatterplot: mpg vs wt",
     pch=19)
abline(model, col="blue", lwd=2)

Perintah plot() membuat grafik pencar yang menunjukkan hubungan antara variabel wt dan mpg. Setiap titik mewakili satu kendaraan dalam dataset mtcars. Label sumbu dan judul grafik disesuaikan agar mudah dibaca. Argumen pch=19 memberikan bentuk titik solid (bulat berisi). Setelah itu, abline(model, col=“blue”, lwd=2) menambahkan garis regresi berwarna biru ke grafik, yang merepresentasikan hubungan linear yang diperkirakan oleh model. Visualisasi ini membantu melihat pola hubungan negatif antara berat kendaraan dan konsumsi bahan bakar, serta seberapa baik garis regresi sesuai dengan data.

3. Hasil dan Pembahasan

Prapengolahan

## 'data.frame':    32 obs. of  11 variables:
##  $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
##  $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
##  $ disp: num  160 160 108 258 360 ...
##  $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
##  $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
##  $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
##  $ qsec: num  16.5 17 18.6 19.4 17 ...
##  $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
##  $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
##  $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
##  $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

Struktur dataset mtcars menunjukkan bahwa dataset ini terdiri dari 32 observasi dan 11 variabel numerik. Setiap variabel merepresentasikan karakteristik kendaraan, seperti konsumsi bahan bakar (mpg), jumlah silinder (cyl), kapasitas mesin (disp), tenaga kuda (hp), rasio axle (drat), berat kendaraan (wt), percepatan (qsec), konfigurasi mesin (vs), tipe transmisi (am), jumlah gigi (gear), dan jumlah karburator (carb). Semua variabel bertipe numeric atau integer, siap digunakan untuk analisis statistik dan pemodelan tanpa konversi tipe data.

## [1] 0

Dataset tidak memiliki missing value, berarti seluruh elemen dalam 32 observasi dan 11 variabel terisi lengkap tanpa ada data yang kosong atau hilang. Maka tidak perlu lakukan pembersihan data. Dengan demikian,siap langsung digunakan untuk analisis statistik, korelasi, maupun pemodelan regresi secara lebih efisien dan akurat.

Analisis dilakukan pada variabel berat kendaraan wt dan konsumsi bahan bakar mpg menggunakan statistik deskriptif, korelasi, dan regresi linear sederhana.

3.1 Statistik Deskriptif

##       mpg              wt       
##  Min.   :10.40   Min.   :1.513  
##  1st Qu.:15.43   1st Qu.:2.581  
##  Median :19.20   Median :3.325  
##  Mean   :20.09   Mean   :3.217  
##  3rd Qu.:22.80   3rd Qu.:3.610  
##  Max.   :33.90   Max.   :5.424

Berdasarkan output statistik deskriptif untuk variabel konsumsi bahan bakar (mpg) dan berat kendaraan (wt), terlihat bahwa kedua variabel memiliki rentang nilai yang cukup lebar.Variabel mpg menunjukkan adanya variasi konsumsi bahan bakar dari kendaraan yang sangat boros hingga yang cukup efisien, tercermin dari selisih yang besar antara nilai minimum dan maksimumnya. Sementara itu, variabel wt, memiliki rentang nilai yang cukup luas ini menunjukkan bahwa dataset mtcars memuat jenis kendaraan dengan bobot yang sangat beragam, mulai dari kendaraan ringan hingga kendaraan dengan bobot cukup besar.

Secara keseluruhan, variasi yang cukup besar pada kedua variabel ini memberikan dasar kuat untuk melakukan analisis lanjutan. Rentang nilai yang lebar memungkinkan tampaknya hubungan yang konsisten antara berat kendaraan dan konsumsi bahan bakar, yaitu bahwa kendaraan yang lebih berat cenderung memiliki nilai mpg yang lebih rendah. Suatu dugaan yang kemudian diuji lebih lanjut melalui analisis korelasi dan regresi.

3.2 Korelasi

## [1] -0.8676594

Berdasarkan hasil perhitungan korelasi antara konsumsi bahan bakar (mpg) dan berat kendaraan (wt), diperoleh nilai korelasi sebesar (negatif) 0.8676594. Nilai ini menunjukkan hubungan negatif yang sangat kuat antara kedua variabel tersebut. Artinya, ketika berat kendaraan meningkat, nilai mpg cenderung menurun secara konsisten. Dengan kata lain, kendaraan yang lebih berat membutuhkan lebih banyak energi untuk bergerak, sehingga konsumsi bahan bakarnya menjadi lebih boros.Korelasi yang tinggi dan negatif ini menguatkan dugaan bahwa berat kendaraan memainkan peran penting dalam menentukan tingkat konsumsi bahan bakar.

3.4 Regresi Linear

## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

Hasil analisis regresi linear sederhana antara berat kendaraan (wt) sebagai variabel bebas dan konsumsi bahan bakar (mpg) sebagai variabel terikat menunjukkan hubungan yang signifikan dan kuat. Berdasarkan output model, koefisien regresi untuk variabel wt adalah –5.344, yang berarti bahwa setiap kenaikan 1 ribu pon berat kendaraan diperkirakan akan menurunkan konsumsi bahan bakar sebesar 5.344 mpg. Nilai koefisien yang negatif ini membuktikan bahwa hubungan antara kedua variabel bersifat berlawanan arah yaaitu semakin berat kendaraan, semakin boros konsumsi bahan bakarnya.

Selain itu, nilai p-value < 0.001 menunjukkan bahwa variabel wt berpengaruh secara signifikan terhadap mpg pada tingkat signifikansi 5%. Dengan demikian, model regresi ini valid secara statistik untuk menjelaskan hubungan antara bobot kendaraan dan efisiensi bahan bakar. Nilai R² sebesar 0.7528 mengindikasikan bahwa sekitar 75.28% variasi dalam konsumsi bahan bakar dapat dijelaskan oleh perbedaan berat kendaraan saja, menunjukkan kekuatan model yang cukup tinggi.

Secara keseluruhan, model regresi linear sederhana ini memberikan gambaran yang jelas dan logis tentang pengaruh berat kendaraan terhadap konsumsi bahan bakar. Dengan demikian, analisis ini dapat dijadikan dasar untuk analisis lanjutan atau rekomendasi terkait performa dan desain kendaraan.

3.3 Visualisasi

Gambar ini menampilkan scatterplot antara berat kendaraan (wt) dan konsumsi bahan bakar (mpg) pada dataset mtcars. Titik-titik pada grafik menunjukkan distribusi data aktual, dan terlihat pola yang jelas bahwa kendaraan dengan bobot lebih besar cenderung memiliki nilai mpg yang lebih rendah. Pola menurun ini mengindikasikan adanya hubungan negatif antara kedua variabel. Garis biru yang ditambahkan melalui fungsi abline(model) merepresentasikan garis regresi linear, yang menggambarkan tren umum hubungan tersebut. Kemiringan garis yang menurun memperkuat temuan sebelumnya dari analisis korelasi, yakni bahwa semakin berat kendaraan, semakin tinggi konsumsi bahan bakarnya. Visualisasi ini menunjukkan model regresi memang tepat digunakan untuk menggambarkan hubungan antara wt dan mpg dalam dataset ini.

4. Kesimpulan

Berdasarkan analisis regresi linear sederhana antara variabel berat kendaraan (wt) dan konsumsi bahan bakar (mpg) pada dataset mtcars, diperoleh;

  1. Hubungan antara berat kendaraan dan konsumsi bahan bakar bersifat negatif. Semakin besar nilai wt, maka nilai mpg cenderung menurun. Hal ini menunjukkan bahwa kendaraan yang lebih berat membutuhkan lebih banyak bahan bakar sehingga efisiensi konsumsi menurun.

  2. Model regresi linear sederhana menunjukkan hasil yang signifikan. Koefisien regresi wt bernilai negatif dan signifikan, sehingga dapat disimpulkan bahwa wt merupakan prediktor penting terhadap mpg. Artinya, variasi dalam berat kendaraan menjelaskan sebagian besar variasi dalam konsumsi bahan bakar.

  3. Kekuatan hubungan antar variabel cukup tinggi. Nilai korelasi antara wt dan mpg menunjukkan adanya hubungan yang cukup kuat dan konsisten, sesuai dengan pola scatterplot dan garis regresi yang terbentuk.

  4. Model dapat digunakan sebagai dasar estimasi konsumsi bahan bakar. Dengan menggunakan persamaan regresi yang diperoleh, nilai mpg dapat diestimasi berdasarkan berat kendaraan, sehingga model ini dapat menjadi dasar awal untuk analisis efisiensi kendaraan.

Secara keseluruhan, analisis ini menegaskan bahwa berat kendaraan memiliki pengaruh signifikan terhadap konsumsi bahan bakar sehingga pengurangan bobot kendaraan sebagai salah satu cara untuk meningkatkan efisiensi konsumsi bahan bakar, sekaligus dapat digunakan untuk pemanfaatan energi yang lebih hemat dan ramah lingkungan dan model regresi linear sederhana memberikan gambaran yang jelas mengenai hubungan tersebut.