Members

M. Alfayed Safaad (52240009)
Fika Irsandi Desvyanti (52240013)
Program Studi: Sains Data

Dataset

Table

EDA

## Column

Histogram

Boxplot

Scatter Plot

Heatmap

Bar Chart

Regresi

## Column

Multiple Linear Regression


Klasifikasi

## Column

Logistic Regression


Klastering

## Column

K-Means Clustering


Time Series

## Column

STL Time Series Decomposition


Insights

Column

Integrated Findings & Data-Driven Insights

1. EDA & Distribusi

Pola Distribusi Harga Saham berdasarkan Profil Risiko

Hasil eksplorasi menggunakan histogram dan boxplot menunjukkan bahwa profil risiko Low, Medium, dan High memiliki pola distribusi harga saham yang relatif serupa (rentang 5.000–10.000). Perbedaan profil risiko tidak secara signifikan membedakan median harga saham.

  • Medium & High Risk: Menunjukkan variasi besar dan banyak outlier pada harga tinggi (peluang untung besar, namun tidak stabil).
  • Low Risk: Distribusi cenderung lebih sempit, stabil, dan minim fluktuasi ekstrem.

Insight Utama: Tingkat risiko investasi lebih tercermin dari besarnya volatilitas dan penyebaran harga, bukan dari perbedaan nilai rata-rata harga saham.

2. Hubungan Variabel

Analisis Korelasi & Faktor Makro

Berdasarkan scatter plot dan heatmap korelasi:

  • Market Index & Stock Price: Memiliki korelasi positif kuat (≈ 0,62). Pergerakan indeks pasar adalah prediktor utama arah harga.
  • Daily Return: Berkorelasi sedang dengan Market Index (≈ 0,37) dan Stock Price (≈ 0,33).
  • Faktor Makro: Inflation Rate dan Interest Rate menunjukkan korelasi yang sangat lemah terhadap harga saham maupun profit dalam dataset ini.
  • Profit: Tidak memperlihatkan korelasi linear yang kuat, mengindikasikan adanya faktor non-linear yang memengaruhi profitabilitas.

Insight Utama: Kondisi pasar secara keseluruhan jauh lebih dominan memengaruhi harga saham dibandingkan faktor makro ekonomi jangka pendek.

3. Regresi & Klastering

Analisis Pemodelan & Segmentasi Investor

A. Analisis Regresi (Multiple Linear Regression)

Model regresi linier mengalami underfitting. Prediksi profit terkonsentrasi pada rentang sempit, sementara aktualnya sangat luas. Ini membuktikan bahwa profit dipengaruhi oleh hubungan kompleks yang tidak sepenuhnya linear.

B. K-Means Clustering

Investor tidak homogen. Ditemukan tiga segmen utama:

  1. Agresif: Eksposur pasar tinggi dengan volatilitas besar.

  2. Konservatif: Pola lebih stabil dan risiko lebih rendah.

  3. Campuran: Berada di antara kedua strategi ekstrem tersebut.

Insight Utama: Segmentasi klaster mampu menangkap heterogenitas perilaku investor yang tidak bisa dijelaskan hanya dengan satu variabel risiko saja.

4. Time Series

STL Decomposition pada Nilai Portofolio

Analisis deret waktu menunjukkan tiga komponen utama:

  • Trend: Terdapat kecenderungan meningkat secara bertahap dalam jangka panjang, meski ada periode perlambatan.
  • Seasonal: Efek musiman relatif kecil dan stabil (tidak dominan).
  • Noise (Remainder): Fluktuasi tajam dan lonjakan ekstrem mencerminkan adanya guncangan pasar (market shock) yang tidak terduga.

Insight Utama: Pergerakan nilai portofolio lebih didorong oleh tren jangka panjang dan shock acak dibandingkan pola musiman yang berulang.

5. Kesimpulan & Rekomendasi

Integrated Conclusion Risiko investasi tercermin dari volatilitas, bukan rata-rata harga. Market Index adalah faktor kunci. Namun, karena profit dan portofolio bersifat dinamis serta non-linear, pendekatan linier sederhana tidak cukup untuk menangkap gambaran utuh.

Actionable Recommendations:

  1. Investor Konservatif: Prioritaskan profil Low Risk untuk stabilitas.

  2. Investor Agresif: Manfaatkan Medium–High Risk dengan manajemen risiko ketat terhadap fluktuasi ekstrem.

  3. Manajer Portofolio: Jadikan Market Index sebagai indikator utama dalam pengambilan keputusan.

  4. Platform Investasi: Gunakan hasil klastering untuk personalisasi produk layanan bagi tiap segmen investor.

  5. Analisis Lanjutan: Disarankan beralih ke model non-linear atau Machine Learning lanjutan untuk memprediksi profit secara lebih akurat.