Untuk mengetahui keadaan properti di Cilegon, kami menggunakan data dari marketplace yang sudah kami kumpulkan sebelumnya. Marketplace yang kami gunakan adalah Lamudi karena marketplace ini yang memiliki variabel lengkap sampai kepada variabel longitude dan latitude yang sangat berguna untuk melakukan interpolasi.
Berikut adalah data yang sudah berhasil kami kumpulkan
X adalah nomor index
judul adalah judul iklan yang dipasang di marketplace
tanah adalah luas tanah dari bangunan yang dijual
bangunan adalah luas bangunan dari bangunan yang dijual
bedroom adalah banyaknya kamar dari rumah yang dijual
sekitar_lokasi adalah tempat-tempat yang dekat dengan lokasi rumah yang dijual
harga adalah harga dari rumah yang dijual
deskripsi adalah informasi lain yang ditawarkan rumah yang dijual
fasilitas adalah fasilitas-fasilitas yang ditawarkan rumah yang dijual
long adalah longitude
lat adalah latitude
link adalah link dari iklan tersebut
Berdasarkan data di atas ada beberapa informasi yang dapat kita gali, antara lain:
1. Mengetahui tipe rumah beserta luas tanah yang sekarang menjadi trend
2. Mengetahui fasilitas-fasilitas apa saja yang melengkapi rumah-rumah tersebut
3. Analisis Harga
4. Clustering ciri dari perumahan
Untuk mengetahui trend perumahan, kita akan melakukan basic Exploratory Data Analysis (EDA)
Berdasarkan tabel di atas, kita dapat mengetahui range tipe rumah terkecil sampai terbesar, dan range tanah terkecil sampai terbesar
## [1] 30 900
## [1] 30 1000
Untuk tanah bangunan terkecil seluas 30 m² dan yang terluas adalah 900 m², sementara untuk tanah terkecil adalah 30m² dan yang terluas adalah 1000 m². selanjutnya kita akan mengelempokkan masing-masing luas tanah dan bangunan ke 4 kategori
Berdasarkan tabel di atas, maka kita dapat mengetahui tipe bangunan seperti apa yang sedang dijual
Terlihat bahwa tipe bangunan yang paling banyak dijual adalah bangunan yang memiliki luas lebih dari 54 m², diikuti tipe 30 - 36 m²
Berdasarkan luas tanah, luasan > 90 m² paling banyak dijual diikuti dengan luas tanah 31 - 72 m²
Berdasarkan jumlah tempat tidur didominasi oleh jumlah 2 kamar tidur per rumah diikuti oleh rumah yang memiliki lebih dari 4 kamar tidur
Kita sudah mengetahui tipe rumah, luas tanah dan jumlah kamar yang pada saat ini menjadi trend di marketplace untuk Kota Cilegon. Lalu selanjutnya kita akan melakukan analisis singkat untuk mengetahui hubungan antara tipe rumah, luas tanah dan jumlah kamar sehingga kita secara kasar dapat mengetahui trend dari perumahan di Cilegon
Tipe bangunan > 54 m² dan luas tanah > 90 m² memiliki frekuensi sebesar 65 unit diikuti oleh tipe 30 - 36 m² luas tanah 31 - 72 m² dengan frekuensi sebesar 15 unit. Temuan ini mengindikasikan bahwa berdasarkan data marketplace yang sudah kita kumpulkan, trend perumahan di Kota Cilegon menyukai tipe-tipe bangunan yang besar dan luas tanah yang besar juga yaitu sebesar 57,52%.
Berdasarkan peta di atas persebaran lokasi perumahan yang dijual, ada 23 unit yang berada di luar boundary Kota Cilegon. Hal ini terjadi karena pada saat pengguna marketplace memasukkan iklannya tidak begitu memperhatikan data lokasi dan tentunya akan mempengaruhi analisis spasial nantinya.
Pada sesi ini kita akan menghitung ada berapa banyak fasilitas dalam 1 iklan dengan cara menghitung kolom fasilitas. Setelah melakukan penghitungan, kita akan melakukan pengelompokan berdasarkan parameter di bawah ini :
| Parameter | Kelompok |
|---|---|
| 0 | Tidak Ada |
| 1 - 4 | Sedikit |
| 5 - 6 | Lumayan Banyak |
| 7 - 9 | Banyak |
| > 9 | Sangat Banyak |
Berdasarkan pengelompokkan parameter di atas, maka per iklan fasilitas-fasilitasnya dapat dikelompokkan sebagai berikut
Berdasarkan tabel di atas, setiap kategori dari fasilitas dapat kita hitung sehingga dapat diketahui seberapa banyak fasilitas yang diberikan untuk masing-masing iklan.
Terlihat dari tabel dan plot di atas bahwa ada 58 iklan perumahan yang tidak menyertakan fasilitas di dalamnya. Asumsi awal mungkin karena iklan-iklan tersebut tidak di dalam suatu kompleks atau cluster perumahan sehingga tidak memiliki fasilitas khusus. Sementara di urutan kedua adalah kelompok fasilitas yang hanya memiliki paling banyak 4 jenis fasilitas. Hal tersebut dianggap cukup bagi perumahan-perumahan baru karena sudah memberikan keamanan dan kenyamanan.
Pada sesi ini kita ingin mengetahui jenis fasilitas seperti apa yang sering digunakan untuk perumahan-perumahan di Kota Cilegon
Metode yang kita gunakan adalah text mining dari kolom fasilitas. Jenis-jenis dari fasilitas yang ada di kolom tersebut akan kita hitung berdasarkan jenisnya sehingga nanti dapat diketahui fasilitas mana yang sering digunakan oleh para pengembang di Kota Cilegon.
Berdasarkan hasil text mining di atas, dapat disimpulkan bahwa fasilitas yang sering ditawarkan adalah taman, garasi, keamanan 24 jam, halaman terbuka dan pendingin ruangan.
Berdasarkan tabel di atas kita dapat mengetahui gambaran kasar harga properti di Kota Cilegon. Untuk tipe besar dengan bangunan > 54 m² dengan tanah 90 m², harga kisaran di Rp 1.637.281.250, sedangkan untuk tipe 30 - 36 m² dengan luas tanah 31 - 72 m² masih di harga Rp 454.846.667. Berdasarkan tabel tersebut itu juga kita dapat mengetahui berapa harga per m² bangunan dan harga per m² tanah.
Seperti halnya luas bangunan, luas tanah, banyak kamar dan fasilitas, untuk harga juga akan dilakukan kategorisasi untuk memudahkan clustering nantinya.
Hasil yang cukup mengejutkan karena persebaran kategori harga hampir merata tidak seperti luas bangunan, luas tanah, dan fasilitas yang cenderung mengarah pada kelompok kategori tertentu.
Setelah melakukan banyak analisis sebelumnya, sekarang kita akan melakukan clustering. Metode yang saya gunakan adalah K-medoids yang merupakan salah satu dari Unsupervised Learning. Unsupervised Learning sendiri merupakan salah satu cabang machine learning yang tidak menggunakan target/label tertentu untuk diprediksi, melainkan hanya untuk mengelompokkan data (clustering) menurut karakter dan jarak kedekatannya. Hampir sama dengan K-means, K-medoids menggunakan pendekatan terdekat untuk mengelompokkan data hanya saja K-means menggunakan centroids, sedangkan K-medoids menggunakan medoids.
Tabel di atas adalah hasil terjemahan data yang kita miliki menjadi karakter-karakter tertentu. Dalam metode K-medoids, hal yang pertama kali kita lakukan adalah menentukan tipe jarak yang kita gunakan. Dalam prakteknya ada beberapa jenis jarak yang digunakan mulai dari Eucledian, Manhattan, Gower. Untuk metode K-medoids tipe jarak yang kita gunakan adalah Gower karena variable-variable kita sebelumnya memiliki kelas factor dan akan lebih susah jika kita menggunakan tipe jarak yang lain.
Untuk menentukan nilai K (jumlah cluster) ada beberapa cara yang dapat dilakukan yaitu dengan cara menanyakan pendapat ahli dan secara statistik. Pendapat ahli yang dimaksud adalah para ahli yang mengerti di bidang yang sedang dianalisis, sebagai contoh untuk kasus kita saat ini maka ahli yang dimaksud adalah ahli properti. Sementara untuk secara statistik dapat dilakukan dengan melihat grafik dengan melihat Elbow dan Siluette.
Untuk asumsi awal kita menggunakan angka 4 untuk jumlah cluster karena dari awal analisis sebagian besar kelompok karakteristik kita bagi 4.
Berdasarkan grafik Siluette atas, dapat dilihat bahwa kenaikan pertama setelah penurunan terletak di angka 4 yang artinya asumsi kita sebelumnya sama dengan rekomendasi yang diberikan oleh grafik ini. Sehingga dapat kita tentukan bahwa jumlah cluster yang kita gunakan adalah 4.
Setelah melakukan clustering, kita dapat mengetahui ciri khas masing-masing cluster. Angka-angka di bawah adalah angka medoids yaitu titik tengah masing-masing cluster yang juga merupakan ciri khas cluster. Angka-angka tersebut adalah nomor urut dari data iklan yang kita analisis
## [1] "62" "115" "112" "93"
Kita sudah mendapatkan karakteristik masing-masing cluster, yang secara lengkap untuk keseluruhan data dapat dilihat pada tabel di bawah ini
Cluster yang paling banyak memiliki anggota adalah cluster 4 dengan 39 anggota dengan karakteristik
* Luas Bangunan > 54 m²
* Luas Tanah > 90 m²
* Memiliki 3 kamar
* Memiliki rentang harga Rp 647.604.000 - Rp 1.225.000.000
* Tidak ada fasilitas
Cluster kedua yang paling banyak memiliki anggota adalah cluster 4 dengan 39 anggota dengan karakteristik
* Luas Bangunan > 54 m²
* Luas Tanah > 30 - 60 m²
* Memiliki 2 kamar
* Memiliki rentang harga Rp 150.050.000 - Rp 437.000.000
* Tidak ada fasilitas
***
Berdasarkan bermacam analisis yang sudah kita lakukan di atas, terlihat bahwa pasar properti di Kota Cilegon terdiri dari 2 bagian besar. Kelompok rumah yang memiliki bangunan dan tanah yang luas, dan kelompok rumah “pengembang” yang menggunakan tipe-tipe generik seperti tipe 30, 36, 45. Hal tersebut dapat memberikan gambaran yang lebih luas lagi kepada para calon investor dan developer yang akan menanamkan modalnya di Kota Cilegon. Ingin bermain di rumah satuan dengan konsekuensi harga tinggi atau membangun perumahan dengan tipe-tipe generik dengan range harga yang sudah diketahui.
Hal menarik lainnya dapat terlihat dari macam fasilitas yang disediakan. Rumah-rumah bertipe besar hampir semua tidak memiliki fasilitas, ini mengindikasikan bahwa rumah-rumah tersebut tidak di dalam kompleks perumahan. Berbeda dengan rumah-rumah bertipe generik yang minimal memiliki 4 macam fasilitas. Tentu berdasarkan temuan tersebut kita bisa membedakan mana yang termasuk pengembang dan mana yang bukan.