Foreword

Hai, perkenalkan nama saya Salomo. Saat saya menulis ini saya adalah seorang karyawan di sebuah BUMN yang memiliki core business di bidang properti real estate. Pandemi COVID19 seperti yang kita ketahui sangat berpengaruh pada penurunan kegiatan ekonomi dunia terkhususnya Indonesia. Bisnis properti tanah air pun tidak terhindar dari kenyataan ini, sebagian besar masyarakat memilih untuk menyimpan uangnya daripada membeli properti sebagai “safety net” pada keadaan yang semakin tidak menentu ini. Lalu pertanyaan besarnya adalah “sampai kapan?”

Beberapa waktu yang lalu saya mendapatkan pelatihan mengenai data science, yaitu sebuah ilmu yang bertujuan untuk melihat insight dari timbunan data. Salah satu cabang dari data science tersebut adalah Natural Language Processing (NLP). NLP sendiri adalah sebuah metode yang membantu kita untuk mengekstrak informasi dari teks dan nantinya akan digunakan untuk komputasi sehingga dapat menyediakan insight.

Pada kesempatan ini saya akan mencoba mengekstrak informasi dari kumpulan data yang berhasil saya scrappe dari situs Detikcom. Kata kunci yang saya gunakan adalah “property Indonesia”. Cut off berita adalah tanggal 26 April 2021. Ada sekitar 4800++ berita yang berhasil saya kumpulkan mulai dari tahun 2005 sampai dengan tahun 2021.

detik.date adalah tanggal berita tersebut di Detikcom
text_clean adalah isi berita
year adalah tahun berita
month adalah bulan berita


Exploratory Data Analysis (EDA)

Sebelum kita masuk ke NLP, kita bisa terlebih dahulu melakukan EDA. EDA yang dapat kita lakukan untuk dataset seperti ini adalah subset tahun terbitnya berita tersebut. Kita akan melihat banyaknya berita mengenai property di Indonesia mulai dari tahun 2005 sampai dengan tahun 2021.

2005-2021

Tabel

Tahun 2021 masih hanya ada 153 berita mengenai property di Indonesia, masih setengah dari jumlah berita tahun 2020. Untuk berita property terbanyak ada di tahun 2013, mungkin masih ada yang ingat ada apa di tahun 2013? Let me know.

Grafik

Pertumbuhan berita mulai signifikan mulai tahun 2010-2011, sempat memuncak pada tahun 2013 lalu turun dan mulai stabil di tahun 2015.

2020-2021 the COVID19 Era

Periode pandemi COVID19 dimulai di awal tahun 2020 sekitar bulan Februari dan Maret, untuk itu kita akan memfilter tanggal publikasi berita dari Januari 2020 sampai dengan April 2021.

Tabel

Hanya ada 16 berita di Maret 2020, apakah ini ada hubungannya dengan masa-masa awal pandemi COVID19 di Indonesia? Ini mungkin dapat dijawab jika nanti sudah masuk ke dalam NLP.


Grafik

Pada Februari 2021 memiliki 52 berita dan merupakan tertinggi di periode COVID19. Apakah berita-berita ini bersentimen positif atau negatif akan diketahui pada saat NLP nanti.


Topic Modelling

Pada kesempatan ini NLP yang akan kita lakukan adalah Topic Modelling. Awalnya ingin menyertakan Sentiment Analysis di dalamnya, akan tetapi karena berita yang kita kumpulkan menggunakan Bahasa Indonesia, sementara tools untuk melakukan sentimen yang tersedia (atau mungkin yang saya tahu) hanya untuk Bahasa Inggris, saya sedang mencari metode lain agar dapat melakukan Sentiment Analysis dengan Bahasa Indonesia.

Algortima yang paling terkenal untuk melakukan Tpoc Modelling adalah Latent Dirichlet Allocation (LDA). Secara matematis LDA akan sangat panjang untuk dibahas tetapi secara garis besar LDA membantu kita untuk mengetahui topik apa yang berelasi dengan topik yang sedang kita bahas (property Indonesia).

Kelemahan LDA adalah menganggap bahwa 1 document (propety Indonesia dataset) sebagai kumpulan kata-kata tanpa memperhatikan padanan katanya, tanpa memperhatikan urutan penggunaan kata-katanya. Sehingga untuk mengetahui makna sebuah kata bernada positif atau negatif sangat susah, sehingga dibutuhkan kemampuan manusia untuk melakukan justifikasi berdasarkan pengetahuan.

Pada pembahasan berikut kita hanya berfokus pada berita-berita property Indonesia tahun 2020 dan 2021 untuk mengetahui topik-topik apa saja yang mempengaruhi property di Indonesia. Apakah memang topik COVID19 memang sangat berpengaruh? Apakah ada topik lain yang yang berkaitan dan memiliki pengaruh?

Words on COVID19 Era

Ada kata yang tidak penting ikut terhitung dalam word count ini, yaitu “video”. Hal tersebut dikarenakan dalam proses text cleansing yang telah dilakukan tidak terlalu mendetail sehingga adanya tautan video di dalam setiap artikel ikut terbaca, tetapi hal tersebut tidak berpengaruh besar dalam Topic Modelling.

Temuan lainnya adalah kata-kata yang berkaitan dengan pandemi tidak ditemukan pada 10 kata teratas. Kata “pandemi” baru ditemukan di urutan 14 dengan 511 kali penggunaan. Sedangkan “covid” ada di peringkat 27 dengan penggunaan kata sebanyak 342 kali. Lalu dengan temuan singkat seperti itu, apakah benar COVID19 benar-benar mempengaruhi property di Indonesia? Mari kita masuk ke Topic Modelling sesungguhnya.

Tabel

Word Count

Word Cloud

Document Term Matrix

Langkah selanjutnya adalah memisahkan kata-kata yang sering digunakan dan kata-kata yang jarang digunakan. Hal ini dimaksudkan untuk lebih menyempitkan topik yang akan dicari. Kita tidak membutuhkan kata “perumahan” ketika kita sudah tahu topik yang akan kita bahas adalah perumahan, yang ingin kita ketahui adalah apa saja kata-kata yang langsung berkaitan dengan perumahan (itulah mengapa kata Latent digunakan)

##  [1] "properti"    "rumah"       "indonesia"   "rp"          "baca"       
##  [6] "sektor"      "bank"        "video"       "harga"       "bisnis"     
## [11] "ekonomi"     "pemerintah"  "perusahaan"  "pandemi"     "pt"         
## [16] "masyarakat"  "investasi"   "memiliki"    "kredit"      "abdullah"   
## [21] "aditama"     "afiliasinya" "agensi"      "agri"        "aid"        
## [26] "ajb"         "akademik"    "akal"        "akibatnya"   "akomodatif"

Kata “video” termasuk dalam kata yang sering muncul tetapi tidak memberikan makna apapun. Begitu pula dengan “rp”. Kata-kata yang lain bukannya tidak memiliki makna, tetapi sekali lagi semua kata-kata di atas sangat erat afiliasinya dengan keyword “property Indonesia” sehingga kita tidak bisa menemukan topik tersembunyi lainnya, jadi daripada membuat bias langsung kita singkirkan.

Selanjutnya kita menuju Document Term Matrix. Apa lagi itu?
Sederhananya ini adalah cara untuk menghitung setiap kata yang muncul di masing-masing berita. Misalnya kata “bni” muncul 4 kali di berita nomor 1, dan muncul 1 kali di berita nomor 10. Sehingga nanti akan memungkinkan bagi komputer untuk menghubung-hubungkan berita berdasarkan kata-kata yang sudah ada.

## 20 x 9 sparse Matrix of class "dgCMatrix"
##     adi atm banking based berasal bersih bi bni bumn
## 1     1   1       1     1       1      1  2   4    1
## 10    .   .       .     .       .      .  .   1    .
## 100   .   .       .     .       1      .  .   .    .
## 101   .   .       .     .       .      .  .   .    .
## 102   .   .       .     .       .      .  .   .    .
## 103   .   .       .     .       1      .  1   .    .
## 104   .   .       .     .       .      .  .   .    .
## 105   .   .       .     .       .      .  2   .    .
## 106   .   .       .     .       1      .  .   .    .
## 107   .   .       .     .       1      .  .   .    .
## 108   .   .       .     .       .      .  .   .    .
## 109   .   .       .     .       1      .  .   .    .
## 11    .   .       .     .       .      .  .   .    .
## 110   .   .       .     .       .      .  .   .    .
## 111   .   .       .     .       .      .  .   .    .
## 112   .   .       .     .       1      .  .   .    .
## 113   .   .       .     .       1      .  .   .    .
## 114   .   .       .     .       .      .  .   .    .
## 115   .   .       .     .       .      .  .   .    .
## 116   .   .       .     .       .      .  .   .    .

Topic Modelling

Kita akan membuat LDA model dengan 8 topik dan 1000 kali iterasi. Penentuan jumlah topik dan iterasi oleh saya pribadi, ke depannya kita dapat menggunakan jumlah yang lain. Iterasi yang dimaksud adalah LDA melakukan sampling sebanyak 1000 kali untuk menghitung kemungkinan masing-masing berita, masing-masing kata ke dalam salah 1 topik dari 8 yang sudah kita tentukan.

## [1] "phi"       "theta"     "gamma"     "data"      "alpha"     "beta"     
## [7] "coherence"

Variabel yang akan kita gunakan adalah “phi” dan “theta”. “phi” adalah atribut yang menerangkan kemungkinan per-topik-per-kata, sedangkan “theta” adalah atribut yang menerangkan per-berita-per-topik.

Sehingga jika kita menggunakan atribut “phi”, maka jika semakin besar nilai kemungkinannya maka semakin besar juga keterkaitannya dengan topik tersebut. Sebagai contoh pada kata “bunga” keterkaitannya dengan topik 6 (t_6) lebih tinggi daripada topik-topik yang lain, maka dapat disimpulkan bahwa kata “bunga” masuk dalam topik 6.

Lalu apakah kita bisa mengetahui kata-kata apa saja yang termasuk ke dalam masing-masing topik? Bisa!

Tabel

Topic Cloud

Intepretasi Topik

Topik 1

Pada Topik 1 memiliki beberapa term seperti bumn, tbk, pailit, saham dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 1, ternyata banyak perusahaan yang terkena pailit di era pandemi ini. Sebagian besar yang menjadi korban adalah perusahaan-perusahaan yang memiliki bisnis utama di bidang real estate dan property.

Topik 2

Pada Topik 2 memiliki beberapa term seperti saham, dana, asuransi, lippo dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 2, grup Lippo yang menjual Lippo Mall Puri untuk menutupi biaya operasional perusahaan.

Topik 3

Pada Topik 3 memiliki beberapa term seperti proyek, kawasan, hunian, apartemen dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 3, dunia property terkhususnya di Indonesia mulai mengambil langkah untuk dapat menang dalam pandemi COVID19.

Topik 4

Pada Topik 4 memiliki beberapa term seperti dunia, orang, resesi, us dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 4, ditengah resesi yang disebabkan oleh pandemi COVID19, ada pengusaha asal Indonesia yang masuk dalam jajaran orang terkaya di dunia bahkan sampai membeli properti bekas istana Raja Ludwig di Jerman (ampun bang jago).

Topik 5

Pada Topik 5 memiliki beberapa term seperti perumahan, btn, subsidi dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 5, adanya subsidi selisih bunga untuk mendorong pembiayaan perumahan dalam masa pandemi, BTN sebagai bank yang menjadi opsi pertama dalam pembiayaan perumahan diberikan kepercayaan oleh pemerintah untuk memberikan stimulus kepada masyarakat.

Topik 6

Pada Topik 6 memiliki beberapa term seperti bunga, kpr, cicilan, program dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 6, program relaksasi kepada pembayaran uang muka maupun kredit kepemilikan rumah.

Topik 7

Pada Topik 7 memiliki beberapa term seperti hotel, corona, penurunan dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 7, penurunan di sektor properti baik beli maupun sewa sebagai dampak dari pandemi COVID19.

Topik 8

Pada Topik 8 memiliki beberapa term seperti asing, negara, hak, cipta dan lain-lain. Sebenarnya apa yang terjadi pada topik ini?

Berdasarkan 10 berita dari Topik 8, sebagian besar memberitakan mengenai Omnibus Law.

Summary Topik

  1. Topik 1, ternyata banyak perusahaan yang terkena pailit di era pandemi ini. Sebagian besar yang menjadi korban adalah perusahaan-perusahaan yang memiliki bisnis utama di bidang real estate dan property.
  2. Topik 2, grup Lippo yang menjual Lippo Mall Puri untuk menutupi biaya operasional perusahaan.
  3. Topik 3, dunia property terkhususnya di Indonesia mulai mengambil langkah untuk dapat menang dalam pandemi COVID19.
  4. Topik 4, ditengah resesi yang disebabkan oleh pandemi COVID19, ada pengusaha asal Indonesia yang masuk dalam jajaran orang terkaya di dunia bahkan sampai membeli properti bekas istana Raja Ludwig di Jerman.
  5. Topik 5, adanya subsidi selisih bunga untuk mendorong pembiayaan perumahan dalam masa pandemi, BTN sebagai bank yang menjadi opsi pertama dalam pembiayaan perumahan diberikan kepercayaan oleh pemerintah untuk memberikan stimulus kepada masyarakat.
  6. Topik 6, program relaksasi kepada pembayaran uang muka maupun kredit kepemilikan rumah.
  7. Topik 7, penurunan di sektor properti baik beli maupun sewa sebagai dampak dari pandemi COVID19.
  8. Topik 8, sebagian besar memberitakan mengenai Omnibus Law.

Karena kita memiliki pengetahuan mengenai dunia properti, maka menggunakan asumsi kita akan memilih topik-topik yang berkaitan. Topik yang langsung berkaitan adalah Topik 1, Topik 3, Topik 5, Topik 6 dan Topik 7

Tabel di atas adalah tabel “coherence” per topik, yaitu topik mana yang paling berkaitan dengan kata-kata yang sering digunakan. Topik 6 merupakan topik yang memiliki coherence tertinggi, diikuti Topik 8 tapi karena sudah kita eliminasi maka yang kedua adalah Topik 3 dan seterusnya.

Proporsi Topik Berdasarkan Waktu

Berdasarkan grafik di atas :

  1. Topik 6, program relaksasi kepada pembayaran uang muka maupun kredit kepemilikan rumah. Grafik menunjukkan peak di bulan Maret, sempat turun tetapi kembali naik di bulan April. Berdasarkan berita memang program relaksasi merupakan usaha terbaru pemerintah untuk kembali meningkatkan geliat pasar properti. Calon konsumen baru diberikan berbagai macam fasilitas mulai dari kemudahan uang muka hingga bebas PPNBM.

  2. Topik 3, dunia property terkhususnya di Indonesia mulai mengambil langkah untuk dapat menang dalam pandemi COVID19. Grafik menunjukkan peak di bulan Juni 2020 dan sekitar Agustus 2020, sementara di bulan Maret 2021 topik ini tidak banyak dibahas. Asumsinya adalah beberapa langkah yang diambil beberapa developer pada rentang waktu itu tidak menjadi topik bahasan untuk rentang waktu yang lama. Bisa saja langkah-langkah yang diambil ternyata tidak efektif karena pada periode itu para developer masih optimis bahwa sektor propeti adalah sektor paling menjanjikan untuk investasi di masa pandemi.

  3. Topik 7, penurunan di sektor properti baik beli maupun sewa sebagai dampak dari pandemi COVID19. Grafik menunjukkan peak di bulan Mei 2020 yang mengindikasikan bahwa memang tidak lama berselang setelah pandemi COVID19 melanda Indonesia, sektor properti langsung merasakan dampaknya. Jika dikaitkan dengan Topik 3, maka Topik 7 adalah permasalahan dan Topik 3 adalah alternatif penyelesaian. Untuk tahun 2021, Topik 7 sangat sedikit untuk dibicarakan. Kita dapat menarik asumsi bahwa penurunan sektor properti adalah sebuah kenormalan atau sektor properti akan segera rebound jika dikaitkan dengan Topik 6.


Notes for The C-Levels

Pandemi COVID19 benar-benar berefek pada pasar properti di Indonesia. Sejak Mei 2020 beberapa developer terkemuka sudah mengambil beberapa langkah yang mungkin mendongkrak penjualan. Mulai dari merubah desain sampai ke penyesuaian harga supaya lebih terjangkau. Akan tetapi hal tersebut sepertinya kurang memberikan efek yang signifikan. Masyarakat yang cenderung menyimpan dananya karena situasi yang semakin tidak menentu menjadi salah satu faktor mengapa langkah-langkah tersebut kurang efektif.

Intervensi pemerintah dengan melakukan beberapa relaksasi sebenarnya adalah sebuah kesempatan yang besar yang dapat dimanfaatkan sebaik-baiknya oleh para developer. Selain adanya intervensi pemerintah tersebut, pihak pengembang juga harus mencari cara supaya kebijakan pemerintah dapat dimanfaatkan dengan maksimal. Kegiatan vaksinasi yang sudah dilakukan pemerintah misalnya dapat dimanfaatkan untuk kegiatan pemasaran. Propaganda “properti harga COVID19” bisa digunakan dengan “menakut-nakuti” calon konsumen jika vaksinasi sudah 100% maka harga akan naik lebih tinggi dari sebelumnya.

Keberadaan mutasi virus COVID19 yang tidak dapat dicegah oleh vaksin yang sudah terlanjur beredar mungkin adalah salah satu faktor ketidakpastian yang nantinya akan menimbulkan lebih banyak ketidakpastian lagi. Sepertinya para pengembang harus “menyerah” pada new normal. Para pengembang harus menemukan cara pemasaran dan penjualan yang menggunakan informasi dan teknologi. Inovasi di bidang IT untuk melengkapi bisnis properti adalah sebuah tuntutan. Jika hanya bertahan pada cara-cara lama, dengan sendirinya akan tereliminasi dari bisnis ini. Penggunaan Big Data, AI dan IoT adalah masa depan tidak terlepas bidang properti dan real estate.

Pandemi COVID19 telah membuat perubahan jaman bergerak secara eksponensial (bukan lagi linier), kita dituntut untuk harus dengan cepat menyesuaikan jika tidak mau tergilas oleh jaman

Terima Kasih, sampai jumpa di analisis-analisis selanjutnya
Salomo Sitorus