Bab 1 UJIAN AKHIR STATISTIKA

1.1 RANGKUMAN MATERI

1.1.1 Definisi dan Konsep Utama

Statistik → Statistik adalah cabang ilmu yang berkaitan dengan, analisis, intepretasi, presentasi data. Statistik menggunakan metode matematis dan algoritmik untuk mengelola data sehingga informasi yang diperoleh dapat digunakan untuk membuat keputusan yang lebih baik.

Statistik Deskriptif → metode untuk menggambarkan data tanpa membuat generalisasi atau kesimpulan tentang populasi. Tujuannya adalah untuk menyajikan data dalam bentuk yang lebih mudah dipahami.

Statistika Inferensial → bidang matematika yang menggunakan teknik statistik untuk membuat kesimpulan tentang populasi berdasarkan data sampel.


1.1.1.1 Jenis Data Statistika

Data statistik dibagi menjadi dua jenis utama: → Kualitatif dan Kuantitatif. Data kualitatif menggambarkan sifat atau karakteristik non-numerik, seperti warna mata atau tingkat kepuasan. Jenisnya mencakup nominal (tanpa urutan) dan ordinal (berurutan tetapi tanpa jarak yang jelas).

Sementara itu, data kuantitatif berupa angka yang dapat dihitung, seperti tinggi badan atau jumlah anak. Data ini terbagi menjadi diskret (nilai tertentu) dan kontinu (rentang nilai). Memahami perbedaan keduanya membantu dalam memilih metode analisis yang tepat.

Perbedaan Numerik dan Kategorik

Data Numerik :

  • Dinyatakan dalam angka
  • Dapat diurutkan.
  • Dapat dilakukan operasi matematika
  • Contoh : Umur, tinggi badan, berat badan, suhu, pendapatan.

Data Kategorik :

  • Dinyatakan dalam kategori atau label: Tidak ada urutan khusus.
  • Tidak dapat dilakukan operasi matematika: Tidak bisa dijumlahkan atau dikurangkan.
  • Contoh : Jenis kelamin, warna favorit, merek mobil, status perkawinan.

1.1.2 Ukuran Pemusatan dan Penyebaran

Rata-rata (mean): Jumlah nilai data dibagi dengan jumlah data. Ini memberikan nilai rata-rata dari data. Mean kurang cocok digunakan dalam beberapa situasi, seperti:

  • Ada outlier atau nilai ekstrem dalam data.
  • Data sangat tidak seimbang atau miring.
  • Data berupa kategori.
  • Data menggunakan urutan, seperti skala ordinal.

Median: Nilai tengah dari data ketika data diurutkan. Median lebih sering dipakai jika ada outlier karena:

  • Tidak terpengaruh oleh nilai-nilai ekstrem.
  • Memberikan gambaran yang lebih jelas tentang tengahnya data.

Modus: Nilai yang paling sering muncul dalam data. Modus biasanya lebih berguna daripada mean atau median dalam kondisi berikut:

  • Data berupa kategori.
  • Data diskret dengan nilai tertentu yang sering muncul.
  • Data memiliki lebih dari satu puncak, seperti pada distribusi bimodal atau multimodal.

standar Deviasi

1.1.3 Visualisai Data

1.1.3.1 Histogram

Histogram → grafik berbentuk batang yang digunakan untuk merepresentasikan distribusi data numerik. Sumbu horizontal (x-axis) menunjukkan rentang nilai atau interval (bin), sedangkan sumbu vertikal (y-axis) menunjukkan frekuensi data dalam setiap interval tersebut.

Histogram sangat berguna untuk:

  • Menilai distribusi data,
  • Mengidentifikasi outlier atau pencilan,
  • Membandingkan distribusi beberapa kelompok data.

Dibawah ini contoh pembuatan diagram histogram menggunakan dataset siswa.


1.1.3.2 Box Plot

Box plot (atau diagram kotak) adalah alat yang digunakan untuk menggambarkan penyebaran data berdasarkan lima nilai utama: minimum, kuartil pertama (Q1), median (Q2), kuartil ketiga (Q3), dan maksimum. Box plot memberikan gambaran visual tentang distribusi data, serta adanya outlier.

Box Plot sangat berguna untuk:

  • Mengidentifikasi simetri distribusi data,
  • Menilai penyebaran data,
  • Menemukan outlier atau pencilan

Dibawah ini contoh pembuatan visualisasi box plot menggunakan dataset siswa.

1.1.3.3 Diagram Batang

1.1.4 Analisis Korelasi

Korelasi adalah cara untuk melihat apakah ada hubungan antara dua hal, seperti apakah satu hal berubah ketika hal lain berubah. Korelasi juga menunjukkan seberapa kuat hubungan itu dan apakah arahnya positif (kedua hal bergerak ke arah yang sama) atau negatif (satu naik, yang lain turun). Hubungan ini diukur dengan angka yang disebut koefisien korelasi, yang nilainya berkisar antara -1 sampai 1.

1.1.4.1 Korelasi Positif

Ketika nilai satu variabel meningkat, nilai variabel lainnya juga meningkat. Begitu pula, ketika nilai satu variabel menurun, nilai variabel lain juga menurun.

Koefisien Korelasi: Nilainya antara 0 dan 1. Contoh: Hubungan antara tinggi badan dan ukuran sepatu. Orang yang lebih tinggi cenderung memiliki ukuran sepatu yang lebih besar.

1.1.4.2 Korelasi Negatif

Ketika nilai satu variabel meningkat, nilai variabel lainnya menurun, dan sebaliknya.

Koefisien Korelasi: Nilainya antara -1 dan 0. Contoh: Hubungan antara harga barang dan volume penjualan. Ketika harga barang meningkat, biasanya volume penjualan menurun.

1.1.4.3 Korelasi Nol (Tidak Ada Korelasi)

Tidak ada hubungan linear antara dua variabel. Perubahan pada satu variabel tidak memengaruhi variabel lain.

Koefisien Korelasi: Nilainya 0. Contoh: Hubungan antara nomor telepon seseorang dan tinggi badan. Variabel ini tidak memiliki hubungan.

1.1.5 Uji Hipotesis

langkah-langkah utama yang perlu dilakukan:

  1. Menyusun Hipotesis
  • Hipotesis Nol (H₀): Pernyataan awal yang menyatakan tidak ada perubahan, pengaruh, atau hubungan tertentu (contoh: rata-rata pendapatan = Rp5 juta).

  • Hipotesis Alternatif (H₁): Pernyataan yang bertentangan dengan H₀, yang menunjukkan adanya perubahan, pengaruh, atau hubungan (contoh: rata-rata pendapatan ≠ Rp5 juta).

  1. Menentukan Tingkat Signifikansi (α)
  • Nilai α adalah batas probabilitas untuk menolak H₀. Biasanya, digunakan 0,05 (5%), tetapi bisa juga 0,01 atau 0,10 tergantung pada konteks.
  1. Memilih Statistik Uji dan Menghitung Nilainya
  • Statistik uji dipilih berdasarkan jenis data dan hipotesis. Untuk data dengan distribusi normal, digunakan (\(t\))-statistik:

\[ t = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}} \]

di mana \(bar{x}\) adalah rata-rata sampel, \(mu\) adalah rata-rata populasi, \(s\) adalah simpangan baku, dan \(n\) adalah ukuran sampel.

  1. Menentukan Nilai Kritis atau Nilai-p
  • Nilai Kritis: Ditentukan dari tabel distribusi \(t\) sesuai derajat kebebasan \(df\).

  • Nilai-p: Probabilitas hasil data atau yang lebih ekstrem jika H₀ benar.

  1. Membandingkan dan Mengambil Keputusan
  • Jika \(t\)-statistik di luar rentang nilai kritis atau nilai-p < α, maka H₀ ditolak.

  • Jika tidak, maka H₀ gagal ditolak.

  1. Menarik Kesimpulan
  • Contoh: “Pada tingkat signifikansi 5%, data menunjukkan bukti yang cukup untuk menyatakan rata-rata pendapatan berbeda dari Rp5 juta.”

Pentingnya Uji Hipotesis

  1. Mendukung Pengambilan Keputusan Data-Driven: Membantu menentukan apakah suatu hasil cukup kuat untuk menjadi dasar keputusan.
  2. Mengurangi Ketidakpastian: Menggunakan pendekatan statistik untuk menghasilkan kesimpulan yang objektif.
  3. Memverifikasi Asumsi dan Model: Berguna dalam menguji keabsahan asumsi yang mendasari model statistik atau algoritma machine learning.
  4. Penerapan Luas: Uji hipotesis digunakan dalam banyak bidang, seperti penelitian, ekonomi, pemasaran, hingga pengendalian kualitas.

1.1.6 Penggunaan Software Statistika

1.1.6.1 Excel

Software dari Microsoft yang paling sering dipakai buat mengolah data. Kamu bisa pakai Excel untuk hitung-hitungan sederhana, bikin tabel, atau buat grafik. Cocok banget buat kamu yang eneg ngoding kalau mau analisis data, karena di Excel untuk mengolah data kita tinggal klik klik aja nih. Berikut adalah keunggulan Excel untuk analisis data :

  • Cocok buat pemula karena user-friendly banget.
  • Punya banyak fitur bawaan untuk analisis data sederhana, seperti pivot table dan fungsi statistik.
  • Bisa digunakan untuk membuat grafik dan visualisasi data dengan cepat.
  • Kelebihannya: nggak perlu coding! Tinggal klik sana-sini.

1.1.6.2 R

Bahasa pemrograman yang dirancang khusus buat analisis data dan statistik. R ini jago banget kalau kamu mau ngolah data besar atau bikin analisis yang lebih rumit. Biasanya dipakai oleh orang-orang yang serius di bidang statistik atau data science.

Salah satu alasan kenapa R banyak dipakai untuk profesi Data Scientist karena Powerful banget untuk analisis statistik dan visualisasi data. Punya banyak library yang khusus buat statistik.

1.1.6.3 RStudio

Software pendukung untuk bahasa pemrograman R yang bikin hasil analisis kamu jadi lebih rapi dan aesthetic. Dengan RStudio, kamu bisa nulis kode, lihat hasil, dan bikin grafik dalam satu tempat yang tertata.

RStudio sendiri software yang selalu digunakan kalau kita bahas masalah analisis data nih, kenapa? Karena interface-nya bikin coding di R lebih nyaman, dengan fitur seperti script editor, console, dan plot viewer yang terorganisir. Pas banget buat kamu yang mau mendalami statistik lebih dalam. Hasil grafiknya juga cakep banget.

1.1.6.4 Python

Bahasa pemrograman serbaguna yang bisa dipakai buat banyak hal, termasuk analisis data dan machine learning. Python punya banyak library yang memudahkan analisis data, jadi fleksibel banget kalau kamu mau eksplor lebih jauh. Berikut adalah keunggulan Python untuk analisis data :

  • Bahasa yang serbaguna selain buat analisis data, Python juga bisa buat machine learning, AI, bahkan web development. -Library seperti Pandas, NumPy, dan Matplotlib bikin analisis data jadi lebih efisien.

1.1.6.5 Google Colab

Platform berbasis cloud yang gratis dan simpel buat ngoding Python. Kamu nggak perlu instal software, tinggal buka browser dan langsung bisa kerja. Colab juga cocok buat kerja bareng karena file-nya bisa langsung dibagikan. Berikut adalah keunggulan Python untuk analisis data :

  • Mirip kayak Python tapi berbasis cloud, jadi nggak perlu instal apa-apa di laptop.
  • Gratis, bahkan bisa pakai GPU buat proses data yang berat.
  • Enak banget buat kerja kolaborasi bareng tim, tinggal share link.

1.1.7 Interpretasi Statistik

Data yang diberikan:

  • Mean (rata-rata) = 75
  • Median = 72
  • Standar deviasi (SD) = 10

Interpretasi:

  1. Rata-rata lebih besar dari median

    • Ketika mean lebih besar dari median, ini menunjukkan bahwa data kemungkinan memiliki distribusi yang condong ke kanan (skewed to the right).
    • Artinya, ada beberapa nilai yang sangat besar (outlier) yang mendorong rata-rata menjadi lebih tinggi dibandingkan nilai tengah (median).
  2. **Standar deviasi (SD)* *

    • Standar deviasi menunjukkan seberapa tersebar data dari rata-rata.
    • Dengan SD = 10, ini berarti bahwa sebagian besar data berada dalam rentang 10 poin dari rata-rata (yaitu antara 65 dan 85).
    • Jika SD relatif kecil dibandingkan dengan mean, ini menunjukkan data cenderung tidak terlalu tersebar.

Kesimpulan tentang distribusi data:

  • Data tidak simetris dan condong ke kanan.
  • Sebagian besar nilai dalam data berada dalam rentang yang relatif dekat dengan rata-rata (±10 dari 75), tetapi ada kemungkinan beberapa nilai yang lebih tinggi dari rata-rata.

1.1.8 Contoh Kasus

Seorang penjual buah ingin mengetahui apakah ada hubungan antara harga per kg buah apel (Rp) dan jumlah pembeli per hari (orang) di kiosnya. Berikut adalah data selama 5 hari:

Hari Harga Apel (Rp) Jumlah Pembeli (orang)
1 20.000 50
2 18.000 60
3 22.000 45
4 19.000 55
5 21.000 48

Penjual juga ingin mengetahui apakah rata-rata pembeli pada hari ketika harga 264 20.000 berbeda dengan hari ketika harga > 20.000.


1.1.8.1 Deskripsi Data

  • Hitung rata-rata harga apel \[ \text{Rata-rata harga apel} = \frac{20.000 + 18.000 + 22.000 + 19.000 + 21.000}{5} = 20.000 \text{ (Rp).} \]

  • Hitung rata-rata jumlah pembeli \[ \text{Rata-rata jumlah pembeli} = \frac{50 + 60 + 45 + 55 + 48}{5} = 51,6 \text{ (orang).} \]

  • Hitung simpangan baku jumlah pembeli

Gunakan rumus simpangan baku: \[ s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}} \]

  1. Hitung \(\sum (x_i - \bar{x})^2\):

    • \((50 - 51,6)^2 = 2,56\)
    • \((60 - 51,6)^2 = 70,56\)
    • \((45 - 51,6)^2 = 43,56\)
    • \((55 - 51,6)^2 = 11,56\)
    • \((48 - 51,6)^2 = 12,96\)

    \[ \sum (x_i - \bar{x})^2 = 2,56 + 70,56 + 43,56 + 11,56 + 12,96 = 141,2. \]

  2. Hitung simpangan baku: \[ s = \sqrt{\frac{141,2}{5-1}} = \sqrt{35,3} \approx 5,94. \]


1.1.8.2 Menghitung Korelasi

Gunakan rumus korelasi Pearson: \[ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \cdot \sum (y_i - \bar{y})^2}} \]

  1. Rata-rata harga apel (\(\bar{x}\)) = 20.000.
    Rata-rata jumlah pembeli (\(\bar{y}\)) = 51,6.

  2. Hitung \((x_i - \bar{x})\), \((y_i - \bar{y})\), dan \((x_i - \bar{x})(y_i - \bar{y})\):

    Hari \(x_i - \bar{x}\) \(y_i - \bar{y}\) \((x_i - \bar{x})(y_i - \bar{y})\)
    1 \(20.000 - 20.000 = 0\) \(50 - 51,6 = -1,6\) \((0)(-1,6) = 0\)
    2 \(18.000 - 20.000 = -2.000\) \(60 - 51,6 = 8,4\) \((-2.000)(8,4) = -16.800\)
    3 \(22.000 - 20.000 = 2.000\) \(45 - 51,6 = -6,6\) \((2.000)(-6,6) = -13.200\)
    4 \(19.000 - 20.000 = -1.000\) \(55 - 51,6 = 3,4\) \((-1.000)(3,4) = -3.400\)
    5 \(21.000 - 20.000 = 1.000\) \(48 - 51,6 = -3,6\) \((1.000)(-3,6) = -3.600\)

    \[ \sum (x_i - \bar{x})(y_i - \bar{y}) = 0 - 16.800 - 13.200 - 3.400 - 3.600 = -37.000. \]

  3. Hitung \(\sum (x_i - \bar{x})^2\) dan \(\sum (y_i - \bar{y})^2\): \[ \sum (x_i - \bar{x})^2 = 0^2 + (-2.000)^2 + (2.000)^2 + (-1.000)^2 + (1.000)^2 = 10.000.000. \] \[ \sum (y_i - \bar{y})^2 = (-1,6)^2 + (8,4)^2 + (-6,6)^2 + (3,4)^2 + (-3,6)^2 = 141,2. \]

  4. Hitung \(r\): \[ r = \frac{-37.000}{\sqrt{10.000.000 \cdot 141,2}} = \frac{-37.000}{\sqrt{1.412.000.000}} = \frac{-37.000}{37.580,8} \approx -0,98. \]

*Kesimpulan: Hubungan antara harga apel dan jumlah pembeli adalah **negatif sangat kuat* (\(r = -0,98\)), artinya semakin tinggi harga apel, semakin sedikit pembeli.


1.1.8.3 Uji Hipotesis (Uji-t)

a. Hipotesis:

  • *H0: Tidak ada perbedaan rata-rata jumlah pembeli antara hari dengan harga apel **264 20.000* dan > 20.000.
  • H1: Ada perbedaan rata-rata jumlah pembeli.

b. Data Kelompok:

  • Harga 264 20.000: Hari 1, 2, 4 (jumlah pembeli: 50, 60, 55; rata-rata = \(\bar{x}_1 = 55\)).
  • Harga > 20.000: Hari 3, 5 (jumlah pembeli: 45, 48; rata-rata = \(\bar{x}_2 = 46,5\)).

c. Hitung Uji-t:

Gunakan rumus: \[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \]

  1. Variansi kelompok 1 (\(s_1^2\)) dan kelompok 2 (\(s_2^2\)):
    • Kelompok 1: \(s_1^2 = \frac{(50-55)^2 + (60-55)^2 + (55-55)^2}{3-1} = 25\).
    • Kelompok 2: \(s_2^2 = \frac{(45-46,5)^2 + (48-46,5)^2}{2-1} = 6,25\).
  2. Substitusi: \[ t = \frac{55 - 46,5}{\sqrt{\frac{25}{3} + \frac{6,25}{2}}} = \frac{8,5}{\sqrt{8,33 + 3,13}} = \frac{8,5}{\sqrt{11,46}} \approx \frac{8,5}{3,39} \approx 2,51. \]

d. Keputusan: - Derajat kebebasan: \(df = 3+2-2 = 3\).
- Nilai kritis \(t\) (\(\alpha = 0,05\)) adalah \(\pm 3,182\).
- Karena \(t = 2,51\) lebih kecil dari 3,182, gagal tolak H0.

*Kesimpulan: Tidak ada perbedaan signifikan jumlah pembeli antara harga apel **264 20.000* dan > 20.000.

1.1.9 Kesimpulan Anda

Statistika sangat penting dalam analisis data karena membantu kita mengumpulkan, mengorganisasi, menganalisis, dan menyajikan data dengan sistematis. Dengan menggunakan statistik, kita bisa mengenali pola, membuat prediksi, dan mengambil keputusan yang didasarkan pada data yang akurat.

Misalnya, dalam pekerjaan, statistik bisa digunakan untuk menginterpretasikan hasil penelitian, mengevaluasi kinerja tim, atau membuat perencanaan bisnis yang lebih baik. Bahkan dalam kehidupan sehari-hari, kita bisa memanfaatkan statistik untuk memahami tren, membandingkan pilihan, atau mengolah data dari berbagai sumber dengan lebih tepat. Dengan memahami dasar-dasar statistika, kita bisa membuat keputusan yang lebih cerdas dan berbasis data.

1.1.10 Mind Mapping

JENIS STATISTIKA JENIS DATA VISUALISASI NOMINAL ORDINAL DISKRET KONTINU UJI HIPOTESIS STATISTIKA ANALISIS KORELASI UKURAN DATA UKURAN DATA #2 Deskriptif: meringkas data Inferensial: membuat generalisasi Data Kualititatif: informasi tentang Histogram: Menunjukkan grafik distribusi frekuensi data dalam interval tertentu. Data Diskret: Angka bulat dengan nilai terpisah. Angka desimal dalam Data Kontinu: rentang tak terhingga. untuk menentukan apakah yang diamati cukup signifikan/hanya karena kebetulan. Cabang ilmu yang berkaitan dengan pengumpulan, analisis, interpretasi, dan presentasi data Mengukur kekuatan dan arah hubungan antar dua variabel. Mean: nilai rata-rata dari data nilai tengah data diurutkan Median: nilai yang paling sering muncul Modus: Range: Selisih nilai tertinggi dan terendah. Variance: Rata-rata kuadrat selisih tiap nilai dari mean. Standard Deviation: Akar kuadrat dari varians. Hipotesis nol: tidak ada perbedaan Hipotesis alternatif: ada perbedaan Uji-t: Digunakan untuk membandingkan rata-rata Positif: Jika satu variabel naik, variabel lain ikut naik. Negatif: Jika satu variabel naik, yang lain turun. Nol: Dua variabel tidak saling memengaruhi. JENIS UJI HIPOTESIS Box Plot: Menggambarkan grafik distribusi data melalui kuartil dan deteksi outlier. Bar Chart dan Pie Chart: Grafik untuk menampilkan data kategorikal Data Kuantitatif: informasi tentang Data Nominal: Kategori tanpa urutan, misal gender. Data Ordinal: Kategori dengan urutan, tapi jarak antar kategori tidak pasti, misal tingkat kepuasan. ukuran/jumlah yang dapat diukur melalui Data Diskret Data Kontinu dan kategori/atribut non numerik yang terdiri dari dan Data Nominal Ordinal tentang populasi melalui sampel dari sampel tanpa inferensial

1.2 STUDI KASUS

Bulan Tahun Kota Penjualan..unit. Biaya.Promosi…. Diskon…. Rating.Pelanggan..1.5. Jenis.Outlet Kategori.Produk
1 Jan 2018 Jakarta 10392 1660 7.8 4.7 Modern Kesehatan
2 Jan 2018 Bogor 11394 930 5.3 5 Tradisional Minuman
3 Jan 2018 Depok 9400 2015 19.9 4.4 Tradisional Minuman
4 Jan 2018 Tangerang 4475 1882 11 3.6 Tradisional Kesehatan
5
298 Dec 2022 Depok 16224 1165 19.9 5 Modern Kesehatan
299 Dec 2022 Tangerang 16777 2084 13.2 4.7 Tradisional Minuman
300 Dec 2022 Bekasi 15628 2046 16.7 3.8 Modern Minuman

1.2.1 Statistik Deskriptif

1.2.1.1 Mean, Median, Standar Deviasi


Table 1.1: Data Awal dan Akhir
Bulan Tahun Kota Penjualan..unit. Biaya.Promosi…. Diskon…. Rating.Pelanggan..1.5. Jenis.Outlet Kategori.Produk
1 Jan 2018 Jakarta 10392 1660 7.8 4.7 Modern Kesehatan
2 Jan 2018 Bogor 11394 930 5.3 5 Tradisional Minuman
3 Jan 2018 Depok 9400 2015 19.9 4.4 Tradisional Minuman
4
299 Dec 2022 Tangerang 16777 2084 13.2 4.7 Tradisional Minuman
300 Dec 2022 Bekasi 15628 2046 16.7 3.8 Modern Minuman

1.2.1.2 #Mengidentifikasi

Table 1.2: Pertumbuhan Penjualan per Kota
Kota Penjualan_Awal Penjualan_Akhir Pertumbuhan_Persen
Bekasi 118554 134371 13.34160
Bogor 117170 103585 -11.59426
Depok 128575 145063 12.82364
Jakarta 125016 148921 19.12155
Tangerang 118328 136968 15.75282
Table 1.2: Kota dengan Pertumbuhan Penjualan Tertinggi
Kota Penjualan_Awal Penjualan_Akhir Pertumbuhan_Persen
Jakarta 125016 148921 19.12155
Table 1.2: Kota dengan Pertumbuhan Penjualan Terendah
Kota Penjualan_Awal Penjualan_Akhir Pertumbuhan_Persen
Bogor 117170 103585 -11.59426

1.2.1.3 Analisis Menggunakan Grafik


1.2.2 Pola Tren dan Musiman

1.2.2.1 Analisis Pola Tahunan

Tahun Total_Penjualan
2018 607643
2019 628413
2020 608226
2021 627459
2022 668908

1.2.2.2 Analisis Musiman

Table 1.3: Total Penjualan per Bulan per Kota
Bulan Kota Total_Penjualan
Jan Bekasi 41443
Jan Bogor 40828
Jan Depok 49508
Jan Jakarta 53635
NA
Dec Depok 66368
Dec Jakarta 58720
Dec Tangerang 64776

Table 1.4: Total Penjualan per Kuartal per Kota
Kuartal Kota Total_Penjualan
Q1 Bekasi 146853
Q1 Bogor 129016
Q1 Depok 151780
Q1 Jakarta 160166
NA
Q4 Depok 176632
Q4 Jakarta 176867
Q4 Tangerang 164852

1.2.3 Analisis Korelasi

1.2.3.1 Promosi dan Penjualan Unit

# Import data
data <- read.csv("data/penjualan_abc.csv")

# Hitung korelasi Pearson
correlation <- cor(data$Biaya.Promosi...., data$Penjualan..unit., method = "pearson")

# Tampilkan hasil
print(correlation)
## [1] -0.1083683

1.2.3.2 Diskon dan Rating


# Import data
data <- read.csv("data/penjualan_abc.csv")

# Hitung korelasi Pearson
correlation <- cor(data$Diskon...., data$Rating.Pelanggan..1.5., method = "pearson")

# Tampilkan hasil
print(paste("Korelasi Pearson antara Diskon (%) dan Rating Pelanggan (1-5):", correlation))
## [1] "Korelasi Pearson antara Diskon (%) dan Rating Pelanggan (1-5): -0.0602249413119623"

1.2.4 Uji Hipotesis

## Hasil Uji Korelasi Pearson:
## Koefisien Korelasi (r): -0.1083683
## Nilai p: 0.0608364
## Tingkat Signifikansi (α): 0.05
## Kesimpulan:
## Gagal menolak H0.
## Tidak ada hubungan signifikan antara Biaya Promosi ($) dan Penjualan (unit).

1.2.5 Analisis Data Kategorik

1.2.5.1 Modern vs Tradisional

##   Jenis Outlet Total Penjualan
## 1       Modern         1553833
## 2  Tradisional         1586816

1.2.5.2 Perbedaan Signifikan

##                  Df    Sum Sq  Mean Sq F value Pr(>F)
## Kategori.Produk   2 2.753e+07 13764881   1.494  0.226
## Residuals       297 2.737e+09  9216270

1.2.6 Model Prediksi Pendapatan

1.2.6.1 Total Pendapatan

1.2.6.2 Faktor Signifikan






1.2.7 Interpretasi Bisnis

1.2.7.1 Rekomendasi Strategi Pemasaran Per Kota

1.2.7.2 Jakarta

  • Bikin program loyalitas biar pelanggan lama tetap stay.
  • Perbanyak exposure di media sosial biar makin dikenal.
  • Coba tambahin varian produk baru buat bikin penasaran.

1.2.7.3 Bogor

  • Mainin diskon besar-besaran, cocok buat menarik perhatian.
  • Sebar produk lebih banyak di pasar tradisional dan tempat wisata.
  • Kolaborasi sama komunitas lokal biar lebih nyambung ke warga.

1.2.7.4 Depok

  • Tambah produk premium karena daya beli di sini tinggi.
  • Launch promo eksklusif yang ada batas waktunya, bikin orang buru-buru beli.
  • Maksimalkan iklan digital dan media sosial.

1.2.7.5 Tangerang

  • Naikin brand awareness lewat billboard dan acara lokal.
  • Tes produk baru buat lihat minat pasar di sini.
  • Kolaborasi sama pusat perbelanjaan atau toko modern.

1.2.7.6 Bekasi

  • Konsisten bikin promo, bisa mingguan atau bulanan.
  • Tawarkan bundling produk biar pembeli dapat lebih banyak.
  • Bikin program cashback atau reward buat transaksi besar.

1.2.7.7 Dampak Pengoptimalan Strategi

1.2.7.8 Diskon

  • Positif: Penjualan naik drastis, pelanggan happy.
  • Negatif: Untung tipis kalau kebanyakan diskon.

1.2.7.9 Promosi

  • Positif: Brand makin dikenal, target pasar jelas.
  • Negatif: Kalau salah target, duit promosi jadi sia-sia.

1.2.7.10 Distribusi ke Outlet

  • Positif: Fokus di outlet modern untung lebih gede, outlet tradisional bikin jangkauan luas.
  • Negatif: Kalau salah fokus, bisa kehilangan potensi di pasar lain.