Nama : Raihan Sabillah Adisecha

NIM : G1401221082

Visualisasi Antar Peubah Numerik

data1 <- read.csv("D:\\Kuliah\\Semester 4\\Visualisasi Data VISDAT\\Tugas UAS\\cardekho.csv") 
head(data1)
##                            name year selling_price km_driven   fuel seller_type
## 1        Maruti Swift Dzire VDI 2014        450000    145500 Diesel  Individual
## 2  Skoda Rapid 1.5 TDI Ambition 2014        370000    120000 Diesel  Individual
## 3      Honda City 2017-2020 EXi 2006        158000    140000 Petrol  Individual
## 4     Hyundai i20 Sportz Diesel 2010        225000    127000 Diesel  Individual
## 5        Maruti Swift VXI BSIII 2007        130000    120000 Petrol  Individual
## 6 Hyundai Xcent 1.2 VTVT E Plus 2017        440000     45000 Petrol  Individual
##   transmission        owner mileage.km.ltr.kg. engine max_power seats
## 1       Manual  First Owner              23.40   1248     74.00     5
## 2       Manual Second Owner              21.14   1498    103.52     5
## 3       Manual  Third Owner              17.70   1497     78.00     5
## 4       Manual  First Owner              23.00   1396     90.00     5
## 5       Manual  First Owner              16.10   1298     88.20     5
## 6       Manual  First Owner              20.14   1197     81.86     5

Pada kesempatan ini, saya akan menganalisis data yang berisi penjualan mobil bekas.

numeric <- data1[,c("selling_price","km_driven","mileage.km.ltr.kg.","engine","max_power")]
head(numeric)
##   selling_price km_driven mileage.km.ltr.kg. engine max_power
## 1        450000    145500              23.40   1248     74.00
## 2        370000    120000              21.14   1498    103.52
## 3        158000    140000              17.70   1497     78.00
## 4        225000    127000              23.00   1396     90.00
## 5        130000    120000              16.10   1298     88.20
## 6        440000     45000              20.14   1197     81.86
library(GGally)
## Warning: package 'GGally' was built under R version 4.3.2
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.2
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
library(psych)
## Warning: package 'psych' was built under R version 4.3.2
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
pairs.panels(numeric)

Dapat terlihat pada pairs panel bahwa ada beberapa hubungan korelasi yang sangat kuat antar beberapa peubah numerik, contohnya seperti “engine” dan “max_power”.

power <- data1$max_power
engine <- data1$engine
plot(engine,power,col = "blue",main = "Hubungan Antara Mesin dan Tenaga Pada Mobil ",xlab = "Spesifikasi Mesin",ylab = "Tenaga")

Ketika dilihat lebih lanjut melalui scatter plot, terlihat adanya hubungan linear antara kapasitas mesin mobil dan tenaga maksimal yang dapat dihasilkan. Semakin besar kapasitas mesin, maka semakin besar juga tenaga yang dapat dihasilkan.

Visualisasi Deret Waktu

Saya akan menjumlahkan harga jual dari setiap mobil bekas berdasarkan tahun pembuatan mobil

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
data2 <- data1 %>%
  group_by(year) %>%
  summarise(total_sellingprice = sum(selling_price))
head(data2)
## # A tibble: 6 × 2
##    year total_sellingprice
##   <int>              <int>
## 1  1983             300000
## 2  1991              55000
## 3  1994             264000
## 4  1995             215000
## 5  1996             245000
## 6  1997             991999
ggplot(data2, aes(x = year, y = total_sellingprice)) +
  geom_line() +
  labs(title = "Plot Deret Waktu Harga Penjualan Mobil Bekas",
       x = "Tahun",
       y = "Total Harga Penjualan")

Pada grafik di atas terlihat bahwa semakin terbaru tahun pembuatan mobil maka harga jualnya semakin tinggi. Hal ini dapat dinilai masuk akal karena mobil keluaran terbaru cenderung lebih menarik sehingga dapat dijual dengan harga yang tinggi.

Visualisasi Spasial

Saya menggunakan data persentase penduduk miskin (PPM) di setiap provinsi pada tahun 2023 dan akan memvisualisasikannya ke dalam peta Indonesia

library(indonesia)
prov <- id_map("indonesia", "provinsi")
colnames(prov) <- c("provinsi", "geometry")
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2
library(stringr)
vs <- read_xlsx("D:\\Kuliah\\Semester 4\\Visualisasi Data VISDAT\\Tugas UAS\\Persentase Penduduk Miskin (P0) Menurut Provinsi dan Daerah, 2023.xlsx")
vs$provinsi <- str_to_title(vs$provinsi)
vs$ppm <- as.numeric(vs$ppm)
prov_merge <- merge(prov, vs, by = "provinsi") 
library(sf)
## Warning: package 'sf' was built under R version 4.3.3
## Linking to GEOS 3.11.2, GDAL 3.8.2, PROJ 9.3.1; sf_use_s2() is TRUE
prov_merge <- st_as_sf(prov_merge)
ggplot(prov_merge) +
  geom_sf(aes(fill = ppm)) +
  scale_fill_gradient(high = "#DC443F", low = "darkblue") +
  labs(title = "Peta Persebaran Persentase Penduduk Miskin")

Pada visualisasi spasial di atas, dapat terlihat bagian wilayah Indonesia yang memiliki PPM tinggi seperti di Papua. Sedangkan untuk wilayah lain cenderung mempunyai PPM yang menengah ke bawah.