data1 <- read.csv("D:\\Kuliah\\Semester 4\\Visualisasi Data VISDAT\\Tugas UAS\\cardekho.csv")
head(data1)
## name year selling_price km_driven fuel seller_type
## 1 Maruti Swift Dzire VDI 2014 450000 145500 Diesel Individual
## 2 Skoda Rapid 1.5 TDI Ambition 2014 370000 120000 Diesel Individual
## 3 Honda City 2017-2020 EXi 2006 158000 140000 Petrol Individual
## 4 Hyundai i20 Sportz Diesel 2010 225000 127000 Diesel Individual
## 5 Maruti Swift VXI BSIII 2007 130000 120000 Petrol Individual
## 6 Hyundai Xcent 1.2 VTVT E Plus 2017 440000 45000 Petrol Individual
## transmission owner mileage.km.ltr.kg. engine max_power seats
## 1 Manual First Owner 23.40 1248 74.00 5
## 2 Manual Second Owner 21.14 1498 103.52 5
## 3 Manual Third Owner 17.70 1497 78.00 5
## 4 Manual First Owner 23.00 1396 90.00 5
## 5 Manual First Owner 16.10 1298 88.20 5
## 6 Manual First Owner 20.14 1197 81.86 5
Pada kesempatan ini, saya akan menganalisis data yang berisi penjualan mobil bekas.
numeric <- data1[,c("selling_price","km_driven","mileage.km.ltr.kg.","engine","max_power")]
head(numeric)
## selling_price km_driven mileage.km.ltr.kg. engine max_power
## 1 450000 145500 23.40 1248 74.00
## 2 370000 120000 21.14 1498 103.52
## 3 158000 140000 17.70 1497 78.00
## 4 225000 127000 23.00 1396 90.00
## 5 130000 120000 16.10 1298 88.20
## 6 440000 45000 20.14 1197 81.86
library(GGally)
## Warning: package 'GGally' was built under R version 4.3.2
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.2
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
library(psych)
## Warning: package 'psych' was built under R version 4.3.2
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
pairs.panels(numeric)
Dapat terlihat pada pairs panel bahwa ada beberapa hubungan korelasi yang sangat kuat antar beberapa peubah numerik, contohnya seperti “engine” dan “max_power”.
power <- data1$max_power
engine <- data1$engine
plot(engine,power,col = "blue",main = "Hubungan Antara Mesin dan Tenaga Pada Mobil ",xlab = "Spesifikasi Mesin",ylab = "Tenaga")
Ketika dilihat lebih lanjut melalui scatter plot, terlihat adanya hubungan linear antara kapasitas mesin mobil dan tenaga maksimal yang dapat dihasilkan. Semakin besar kapasitas mesin, maka semakin besar juga tenaga yang dapat dihasilkan.
Saya akan menjumlahkan harga jual dari setiap mobil bekas berdasarkan tahun pembuatan mobil
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data2 <- data1 %>%
group_by(year) %>%
summarise(total_sellingprice = sum(selling_price))
head(data2)
## # A tibble: 6 × 2
## year total_sellingprice
## <int> <int>
## 1 1983 300000
## 2 1991 55000
## 3 1994 264000
## 4 1995 215000
## 5 1996 245000
## 6 1997 991999
ggplot(data2, aes(x = year, y = total_sellingprice)) +
geom_line() +
labs(title = "Plot Deret Waktu Harga Penjualan Mobil Bekas",
x = "Tahun",
y = "Total Harga Penjualan")
Pada grafik di atas terlihat bahwa semakin terbaru tahun pembuatan mobil maka harga jualnya semakin tinggi. Hal ini dapat dinilai masuk akal karena mobil keluaran terbaru cenderung lebih menarik sehingga dapat dijual dengan harga yang tinggi.
Saya menggunakan data persentase penduduk miskin (PPM) di setiap provinsi pada tahun 2023 dan akan memvisualisasikannya ke dalam peta Indonesia
library(indonesia)
prov <- id_map("indonesia", "provinsi")
colnames(prov) <- c("provinsi", "geometry")
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2
library(stringr)
vs <- read_xlsx("D:\\Kuliah\\Semester 4\\Visualisasi Data VISDAT\\Tugas UAS\\Persentase Penduduk Miskin (P0) Menurut Provinsi dan Daerah, 2023.xlsx")
vs$provinsi <- str_to_title(vs$provinsi)
vs$ppm <- as.numeric(vs$ppm)
prov_merge <- merge(prov, vs, by = "provinsi")
library(sf)
## Warning: package 'sf' was built under R version 4.3.3
## Linking to GEOS 3.11.2, GDAL 3.8.2, PROJ 9.3.1; sf_use_s2() is TRUE
prov_merge <- st_as_sf(prov_merge)
ggplot(prov_merge) +
geom_sf(aes(fill = ppm)) +
scale_fill_gradient(high = "#DC443F", low = "darkblue") +
labs(title = "Peta Persebaran Persentase Penduduk Miskin")
Pada visualisasi spasial di atas, dapat terlihat bagian wilayah Indonesia yang memiliki PPM tinggi seperti di Papua. Sedangkan untuk wilayah lain cenderung mempunyai PPM yang menengah ke bawah.