File ini berisi template untuk mejawab pertanyaan 5W+1H saat briefing Capstone Data Visualization sebagai langkah awal sebelum membuat Dashboard. Silakan Bapak/Ibu mengisi jawaban di bawah.

1. Introduction

File ini tidak akan dinilai namun Bapak/Ibu WAJIB disubmit ke dalam classroom pada hari H briefing Capstone Data Visualization.

1.1 What

Tentukan tujuan atau informasi yang ingin ditampilkan dalam dashboard

Jawab Tujuan yang ingin dicapai atau informasi yang ingin disampaikan: - Memberikan informasi brand terhadap first-jobber (orang yang baru pertama kali pekerja) terkait mobil bekas namun tetap value for economic (masih berada pada tahun yang cukup baru, dengan performance yang cukup tinggi (horse power))

1.2 Who

Untuk siapa dashboard ini dibuat? Siapa target pembaca dari dashboard ini?

Jawab First Jobber (Orang yang baru pertama kali bekerja bekerja)

1.3 Why

Apakah data yang dibuat relevan atau sesuai dengan tujuan? Mengapa?

Jawab Relevan, karna orang yang pertama kali bekerja cenderung memiliki budget pas-pasan, namun kebutuhan terhadap mobil tetap ada sehingga mobil bekas bisa dijadikan sebagai salah satu opsi. Preferensi mobil bekas : a. Harga Rendah b. Horse Power (Performance) Tinggi c. Kilometer Rendah Opsional d. Matic Transmission e. Belum pernah rusak

1.4 When

Apakah data yang digunakan masih up to date atau masih relevan dengan kondisi sekarang? Apakah ada informasi tentang tanggal update terakhir dari data tersebut?

Jawab Benar, data yang digunakan masih berada di range 2018 terakhir

1.5 How

Bagaimana Bapak/Ibu menggunakan visualisasi untuk menjawab tujuan yang telah disebutkan?

Jawab -> Boxplot, untuk visualisasi persebaran rata-rata harga/ HorsePower : Menggali brand dengan Price/HorsePower paling murah - Direkomendasikan ke first jobber yang murah namun tetap handal -> Selanjutnya Harga/Power di consider dengan umur mobil (preferensi mobil dengan umur termuda sejak pembuatan)

2. Answer

2.2 Column Selection

## 'data.frame':    189349 obs. of  9 variables:
##  $ brand            : Factor w/ 40 levels "alfa_romeo","audi",..: 39 2 15 39 32 3 26 39 11 39 ...
##  $ kilometer        : int  150000 125000 125000 150000 90000 150000 150000 40000 30000 150000 ...
##  $ price            : int  480 18300 9800 1500 3600 650 2200 0 14500 999 ...
##  $ fuelType         : Factor w/ 8 levels "","andere","benzin",..: 3 5 5 3 5 3 3 3 3 1 ...
##  $ powerPS          : int  0 190 163 75 69 102 109 50 125 101 ...
##  $ gearbox          : Factor w/ 3 levels "","automatik",..: 3 3 2 3 3 3 3 3 3 3 ...
##  $ notRepairedDamage: Factor w/ 3 levels "","ja","nein": 1 2 1 3 3 2 3 3 1 1 ...
##  $ Registered       : int  1993 2011 2004 2001 2008 1995 2004 1980 2014 1998 ...
##  $ Created_at       : Date, format: "2016-03-24" "2016-03-24" ...

2.3 EDA (Exploratory Data Analysis)

2.3.1 Cek Persebaran Harga pada Kolom Harga

Kesimpulan

Diperoleh kesimpulan bahwa data tersebar secara dominan di range under 200,000 sehingga data diatas 200,000 perlu dihilangkan

2.3.2 Cek Persebaran Tahun Pembuatan

Kesimpulan

Diperoleh salah satu kesimpulan bahwa ada data outlier, perlu dihilangkan nilai ‘Registered’ setelah 2020 dan sebelum 1800

2.3.3 Cek Persebaran Kilometer Kendaraan

Kesimpulan

Terdapat mobil yang masih terhitung baru, namun sudah dijual oleh pembilnya, potensi untuk direkomendasikan kepada pembeli

2.3.4 Pengaruh Transmisi terhadap Harga Mobil

Kesimpulan

Mobil dengan transmisi automatis cenderung lebih mahal dibandingkan dengan mobil dengan transmisi manual

2.3.5 Pengaruh Kerusakan Berat terhadap Harga Mobil

Kesimpulan

Mobil yang memiliki kerusakan berat memiliki harga rendah dibandingkan mobil yang belum mengalami kerusakan berat

2.4 Data Cleansing

Sehingga dari EDA pada bagian sebelumnya serta beberapa kesimpulan diatas diperoleh informasi bahwa:

1. Ditemukan sebuah anomali bahwa terdapat mobil yang diregistrasikan di tahun 1000, Dibutuhkan untuk dilakukan filter menjadi cukup setelah 1800 pada kolom “Registered”

2. Menghilangkan value kosong pada gearbox, fuelType, dan notRepairedDamage

3. Anomali pada power PS = 0, mobil sudah tidak bisa jalan sehingga perlu dihilangkan

4. Menghilangkan data outlier pada kolom “price” harga mobil bekas diatas 200000 dan dibawah 0

5. Menambahkan kolom baru valformon (Value for Money) = Price / Horsepower

2.5 Data Wrangling

2.5.1 TOP 10 brand dengan rata-rata harga mobil termurah

Cocok bagi mereka yang hanya mempertimbangkan ketersediaan budget

## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 10 x 3
##    brand      price   age
##    <fct>      <dbl> <dbl>
##  1 daewoo     1121.  18  
##  2 daihatsu   2087.  17.6
##  3 rover      2155.  19.4
##  4 trabant    2517.  36.6
##  5 renault    2906.  16.5
##  6 fiat       3360.  16.2
##  7 opel       3488.  17.1
##  8 lancia     3535.  19.2
##  9 peugeot    3701.  15.7
## 10 mitsubishi 3825.  17.4

2.5.2 TOP 10 Brand dengan Rata-Rata Power Rate (Price/Power) Terendah

Cocok bagi mereka yang tidak hanya mempertimbangkan ketersediaan budget namun juga performa mesin

## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 10 x 4
##    brand      price   age power_rate
##    <fct>      <dbl> <dbl>      <dbl>
##  1 daewoo     1121.  18         13.4
##  2 rover      2155.  19.4       16.4
##  3 chrysler   4787.  18.1       26.2
##  4 saab       4350.  20.0       26.9
##  5 daihatsu   2087.  17.6       28.8
##  6 mitsubishi 3825.  17.4       30.0
##  7 renault    2906.  16.5       31.0
##  8 opel       3488.  17.1       32.4
##  9 lancia     3535.  19.2       32.5
## 10 subaru     5118.  18.2       33.2

2.6 Data Visualization

2.6.1 Visualisasi 10 brand dengan rata-rata harga mobil termurah

## Warning: `group_by_()` is deprecated as of dplyr 0.7.0.
## Please use `group_by()` instead.
## See vignette('programming') for more help
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.

2.6.2 Visualisasi TOP 10 Brand dengan Rata-Rata Power Rate (Price/Power) Terendah

2.7 Conclusion

Daewoo merupakan brand dengan rata-rata harga mobil bekas termurah, kemudian disusul Daihatsu dan Rover

Daewoo juga merupakan brand dengan Average Power Rate paling rendah, cocok bagi mereka yang ingin mencari harga mobil bekas termurah namun dengan mempertimbangkan Horse Power yang dimiliki, disusul dengan Rover dan Chrysler