UAS Statistika Dasar

Statistika Dasar

Logo

Soal 1 Merangkum Materi (CPL03, CPL11, 50%)

1.1 DEFINISI DAN KONSEP UTAMA

1.1.1 Definisi Statistika

Statistika adalah cabang ilmu yang mempelajari proses pengumpulan, pengolahan, analisis, interpretasi, dan penyajian data untuk memperoleh informasi yang mendukung pengambilan keputusan. Ilmu ini membantu kita memahami pola, hubungan, dan karakteristik data yang kompleks.

1.1.1.1 Cabang Utama Statistika:

Statistika Deskriptif
- Berfokus pada penyajian, peringkasan, dan penggambaran data menggunakan tabel, grafik, atau ukuran numerik seperti rata-rata, median, dan standar deviasi.
- Tujuan: Memberikan gambaran umum data tanpa melakukan kesimpulan atau generalisasi.
- Contoh: Menampilkan nilai rata-rata ujian siswa dalam diagram batang.
Statistika Inferensial
- Berfokus pada pembuatan kesimpulan atau generalisasi tentang populasi berdasarkan sampel data.
- Metode: Pengujian hipotesis, analisis regresi, estimasi parameter populasi.
- Contoh: Menggunakan sampel 100 siswa untuk memperkirakan rata-rata nilai seluruh siswa di sekolah.

1.1.1.2 Perbedaan Utama:

Statistika Deskriptif: Menggambarkan data yang ada.
Statistika Inferensial: Membuat generalisasi dari data sampel ke populasi menggunakan konsep probabilitas.

1.1.2 Jenis Data dalam Statistika

Data dalam statistika diklasifikasikan menjadi dua jenis utama:

1.1.2.1 Data Numerik (Kuantitatif)

Data yang dapat diukur atau dihitung dengan angka dan dapat dianalisis menggunakan operasi matematika.
- Data Kontinu: Data dengan nilai dalam rentang tertentu, termasuk pecahan.
- Contoh: Tinggi badan (170.5 cm), berat badan (60.2 kg).
- Data Diskret: Data yang hanya memiliki nilai tertentu, biasanya bilangan bulat.
- Contoh: Jumlah siswa di kelas (25), jumlah kendaraan di parkiran (10).

1.1.2.2 Data Kategori (Kualitatif)

Data yang mengelompokkan objek ke dalam kategori atau kelompok berdasarkan atribut tertentu.
- Data Nominal: Kategori tanpa urutan tertentu.
- Contoh: Jenis kelamin (laki-laki atau perempuan), warna mata (biru atau hijau).
- Data Ordinal: Kategori dengan urutan tertentu, tetapi perbedaan antar kategori tidak diukur secara numerik.
- Contoh: Tingkat kepuasan (sangat puas, puas, tidak puas).

1.1.2.3 Perbedaan Utama:

Data Numerik: Merepresentasikan nilai yang dapat dihitung secara matematis.
Data Kategori: Mengelompokkan objek berdasarkan atribut atau klasifikasi.

Kesimpulan:
Statistika adalah alat yang sangat penting untuk menganalisis data, baik dengan metode deskriptif untuk penyajian data, maupun inferensial untuk mengambil kesimpulan berdasarkan sampel. Jenis data yang digunakan, baik numerik maupun kategori, sangat memengaruhi pendekatan analisis yang dilakukan.

1.2 UKURAN PEMUSATAN DAN PENYEBARAN

1.2.1 Mean (Rata-rata)

Definisi:
Mean adalah rata-rata aritmatika dari data, dihitung dengan menjumlahkan semua nilai data dan membaginya dengan jumlah data.

Formula:
\[ \text{Mean} = \frac{\sum x}{n} \]
di mana: - $\sum x$: Jumlah seluruh nilai data
- $n$: Jumlah data

Kapan Mean Menjadi Kurang Tepat?
- Mean menjadi kurang representatif jika terdapat outlier (nilai ekstrem) dalam data.
- Outlier dapat memengaruhi rata-rata sehingga tidak mencerminkan mayoritas data.

Contoh:
Data pendapatan: $[30, 35, 40, 500]$.
- Mean: $\frac{30 + 35 + 40 + 500}{4} = 151.25$, yang tidak mencerminkan pendapatan mayoritas.

1.2.2 Median

Definisi:
Median adalah nilai tengah dari data yang telah diurutkan.
- Jika jumlah data ganjil, median adalah nilai tengah.
- Jika jumlah data genap, median adalah rata-rata dari dua nilai tengah.

Mengapa Median Sering Digunakan untuk Data dengan Outlier?
- Median lebih tahan terhadap outlier, karena median hanya mempertimbangkan posisi data dalam urutan, bukan nilai absolutnya.

Contoh:
Data harga rumah: $[100, 120, 140, 10,000]$.
- Setelah diurutkan: $[100, 120, 140, 10,000]$.
- Median: $\frac{120 + 140}{2} = 130$.
Median tetap memberikan gambaran yang lebih representatif dibandingkan mean.

1.2.3 Modus

Definisi:
Modus adalah nilai yang paling sering muncul dalam data.
- Data dapat memiliki satu modus (unimodal), dua modus (bimodal), atau lebih (multimodal).
- Jika semua nilai memiliki frekuensi yang sama, data tidak memiliki modus.

Kapan Modus Lebih Relevan?
- Modus lebih relevan untuk data kategori atau jika ingin mengetahui nilai yang paling sering muncul.
- Tidak cocok digunakan untuk menganalisis penyebaran data numerik.

Contoh:
Survei warna favorit: $[merah, biru, biru, hijau]$.
- Modus: biru, karena warna ini paling sering dipilih.

1.2.4 Standar Deviasi

Definisi:
Standar deviasi mengukur tingkat penyebaran data dari rata-rata.
- Semakin kecil standar deviasi, semakin dekat data dengan rata-rata (variabilitas rendah).
- Semakin besar standar deviasi, semakin tersebar data dari rata-rata (variabilitas tinggi).

Formula:
\[ \sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{n}} \]
di mana:
- $x_i$: Nilai data individu
- $\mu$: Mean (rata-rata)
- $n$: Jumlah data

Makna Nilai Standar Deviasi:
- Kecil: Data lebih homogen, nilai-nilainya mendekati rata-rata.
- Besar: Data lebih heterogen, terdapat variasi yang signifikan.

Contoh:
- Standar deviasi kecil: Penghasilan pegawai dalam satu level (terkonsentrasi).
- Standar deviasi besar: Perbedaan besar dalam penghasilan antara pegawai biasa dan eksekutif.

1.2.5 Kesimpulan:

Setiap ukuran memiliki keunggulan dan kelemahan masing-masing, tergantung pada karakteristik data:
- Gunakan mean untuk data yang tidak memiliki outlier.
- Gunakan median jika terdapat nilai ekstrem dalam data.
- Gunakan modus untuk data kategori atau mengetahui nilai yang paling sering muncul.
- Gunakan standar deviasi untuk memahami tingkat variabilitas atau keragaman data.

1.3 VISUALISASI DATA

Visualisasi data adalah cara menyajikan data dalam bentuk visual, seperti grafik, diagram, atau peta, untuk membantu memahami pola dan tren dengan lebih mudah. Visualisasi yang baik dapat menyederhanakan data yang kompleks, memungkinkan pengambilan keputusan yang lebih cepat dan berbasis fakta.

1.3.1 Histogram

Penjelasan:

Histogram adalah grafik batang vertikal yang digunakan untuk menunjukkan distribusi frekuensi data numerik. Data dikelompokkan ke dalam interval tertentu (disebut bin), dan tinggi batang mencerminkan jumlah data yang termasuk dalam setiap bin.

Tujuan:

Menganalisis pola distribusi data (normal, miring, atau berkelompok).
Mendukung deteksi keberadaan outlier atau nilai yang mencolok.
Menentukan kecenderungan distribusi, seperti simetris atau tidak.

Contoh Penggunaan:

Menganalisis distribusi nilai ujian siswa dalam suatu kelas.
Meneliti distribusi berat badan dalam populasi tertentu.

1.3.2 Boxplot (Diagram Kotak-Potong)

Penjelasan:

Boxplot adalah grafik sederhana yang menampilkan distribusi data berdasarkan lima statistik utama:

Minimum
Kuartil pertama (Q1)
Median (Q2)
Kuartil ketiga (Q3)
Maksimum

Selain itu, outlier juga ditandai secara jelas pada diagram ini. Boxplot sering digunakan untuk membandingkan distribusi data antar kelompok.

Tujuan:

Memahami distribusi data dengan cepat, seperti median dan rentang interkuartil.
Mendeteksi outlier dalam data.
Membandingkan distribusi data antar kelompok.

Contoh Penggunaan:

Membandingkan tinggi badan pria dan wanita dalam suatu populasi.
Menganalisis distribusi pendapatan antar profesi.

1.3.3 Bar Chart (Diagram Batang)

Penjelasan:

Bar chart digunakan untuk menyajikan data kategori dalam bentuk batang vertikal atau horizontal. Setiap batang mewakili kategori tertentu, dan panjang batang mencerminkan frekuensi atau proporsi kategori tersebut.

Tujuan:

Menampilkan data kategori secara visual.
Membandingkan frekuensi atau proporsi antar kategori.
Memberikan gambaran distribusi data kategori dengan jelas.

Contoh Penggunaan:

Menampilkan jumlah mahasiswa berdasarkan program studi.
Menganalisis penjualan produk berdasarkan kategori.

1.3.4 Perbedaan Utama di Antara Ketiga Grafik:

Histogram digunakan untuk data numerik dan menyoroti pola distribusi.
Boxplot memberikan ringkasan statistik dan mendeteksi outlier.
Bar chart digunakan untuk menyajikan data kategori dan membandingkan proporsinya.

Visualisasi data yang tepat membantu menyampaikan informasi dengan lebih efektif, memungkinkan analisis yang lebih dalam dan pengambilan keputusan yang lebih baik.

1.4 ANALISIS KORELASI

Dalam statistika, korelasi adalah ukuran yang menunjukkan hubungan atau keterkaitan antara dua variabel. Korelasi menggambarkan sejauh mana perubahan dalam satu variabel berhubungan dengan perubahan dalam variabel lainnya. Korelasi sering dinyatakan dengan koefisien korelasi yang bernilai antara $-1$ hingga $+1$.

1.4.1 Jenis-jenis Korelasi:

Korelasi Positif
Terjadi ketika kedua variabel bergerak dalam arah yang sama: jika satu variabel naik, variabel lainnya juga naik, dan sebaliknya.
- Contoh: Semakin tinggi jumlah jam belajar, semakin tinggi nilai ujian.
Korelasi Negatif
Terjadi ketika kedua variabel bergerak dalam arah yang berlawanan: jika satu variabel naik, variabel lainnya turun, dan sebaliknya.
- Contoh: Semakin tinggi kecepatan mobil, semakin kecil waktu yang dibutuhkan untuk mencapai tujuan.
Korelasi Nol (Tidak Ada Korelasi)
Terjadi ketika tidak ada hubungan antara kedua variabel. Perubahan pada satu variabel tidak memengaruhi variabel lainnya.
- Contoh: Jumlah konsumsi kopi seseorang tidak berhubungan dengan tinggi badannya.

1.4.2 Koefisien Korelasi ($r$):

$r > 0$: Korelasi positif.
$r < 0$: Korelasi negatif.
$r = 0$: Tidak ada korelasi.
Semakin mendekati $-1$ atau $+1$, hubungan semakin kuat.

1.4.3 Gambaran Praktis:

Korelasi positif: r = 0.8 (hubungan kuat dan searah).
Korelasi negatif: r = -0.7 (hubungan kuat tetapi berlawanan arah).
Korelasi nol: r = 0.03 (tidak ada hubungan signifikan).

1.5 UJI HIPOTESIS

1.5.1 Langkah Utama dalam Melakukan Uji Hipotesis

Uji hipotesis adalah proses statistik yang digunakan untuk menguji kebenaran suatu klaim atau teori mengenai populasi berdasarkan data sampel. Langkah-langkah utama dalam melakukan uji hipotesis adalah sebagai berikut:

1.5.1.1 Merumuskan Hipotesis

Hipotesis Nol (H₀): Merupakan pernyataan yang akan diuji dan umumnya menggambarkan keadaan “tidak ada efek” atau “tidak ada perbedaan”. Hipotesis ini bersifat konservatif dan sering kali mengasumsikan bahwa tidak ada hubungan antara variabel.
- Contoh: H₀: “Tidak ada perbedaan rata-rata nilai ujian antara dua kelompok mahasiswa.”
Hipotesis Alternatif (H₁ atau Ha): Merupakan klaim yang ingin dibuktikan, yaitu yang menunjukkan adanya hubungan, perbedaan, atau efek dalam populasi. Ini adalah hipotesis yang kita harapkan untuk diterima jika data mendukungnya.
- Contoh: H₁: “Ada perbedaan rata-rata nilai ujian antara dua kelompok mahasiswa.”

1.5.1.2 Menetapkan Tingkat Signifikansi (α)

Tingkat signifikansi ($\alpha$) adalah batas kesalahan yang kita anggap dapat diterima untuk menolak hipotesis nol. Biasanya, nilai $\alpha$ ditetapkan sebesar 0,05 (5%), yang berarti kita bersedia menerima risiko 5% untuk salah menolak hipotesis nol (type I error).
Contoh: Jika kita memilih $\alpha = 0,05$, maka kita memiliki toleransi untuk menerima kesalahan 5% dalam keputusan kita.

1.5.1.3 Menentukan Jenis Uji (Satu Arah atau Dua Arah)

Uji Dua Arah (Two-Tailed Test): Digunakan ketika hipotesis alternatif menyatakan adanya perbedaan yang tidak terbatas pada satu arah (misalnya, perbedaan bisa lebih besar atau lebih kecil).
- Contoh: H₁: “Ada perbedaan rata-rata nilai ujian antara dua kelompok.”
Uji Satu Arah (One-Tailed Test): Digunakan jika hipotesis alternatif menyatakan perbedaan hanya di satu arah (misalnya, perbedaan yang lebih besar atau lebih kecil).
- Contoh: H₁: “Kelompok A memiliki nilai ujian yang lebih tinggi daripada kelompok B.”

1.5.1.4 Mengumpulkan Data dan Menyusun Statistik Uji

Ambil sampel data dari populasi yang relevan. Data ini akan digunakan untuk menghitung statistik uji yang sesuai dengan jenis uji yang dipilih (misalnya, uji t, uji z, uji chi-square, dll.).
Contoh: Jika Anda menggunakan uji t, Anda akan menghitung nilai t-statistic dari data sampel dan bandingkan dengan distribusi t yang sesuai.

1.5.1.5 Menentukan Daerah Kritis dan Nilai Kritis

Daerah Kritis: Daerah di mana kita akan menolak hipotesis nol jika statistik uji jatuh di dalamnya. Daerah kritis ini bergantung pada tingkat signifikansi ($\alpha$) yang telah ditentukan sebelumnya.
Nilai Kritis: Nilai batas yang memisahkan daerah terima dan daerah tolak. Nilai kritis ini ditentukan berdasarkan distribusi statistik yang sesuai (misalnya, distribusi normal untuk uji z, distribusi t untuk uji t, dll.).
Contoh: Jika menggunakan $\alpha = 0,05$ untuk uji dua arah, maka daerah kritisnya berada pada 2,5% di kedua sisi distribusi.

1.5.1.6 Menghitung Statistik Uji dan Membandingkannya dengan Nilai Kritis

Hitung nilai statistik uji berdasarkan data sampel.
Bandingkan nilai statistik uji dengan nilai kritis yang sudah ditentukan.
- Jika statistik uji jatuh di dalam daerah kritis: Tolak hipotesis nol.
- Jika statistik uji tidak jatuh di dalam daerah kritis: Gagal menolak hipotesis nol.

1.5.1.7 Menarik Kesimpulan

Tolak H₀ jika statistik uji berada di dalam daerah kritis. Ini berarti data mendukung hipotesis alternatif dan kita bisa menyimpulkan bahwa ada bukti yang cukup untuk mendukung klaim yang diajukan.
Gagal menolak H₀ jika statistik uji tidak berada di dalam daerah kritis. Ini berarti data tidak cukup untuk mendukung hipotesis alternatif, dan kita tidak dapat menyimpulkan adanya perbedaan atau efek yang signifikan.

1.5.2 Mengapa Uji Hipotesis Penting dalam Analisis Data?

Uji hipotesis sangat penting dalam analisis data karena beberapa alasan berikut:

1.5.2.1 Pengambilan Keputusan yang Objektif

Uji hipotesis menyediakan cara yang sistematis dan objektif untuk mengambil keputusan berdasarkan data. Tanpa uji hipotesis, keputusan sering kali didasarkan pada asumsi atau bias subjektif.

1.5.2.2 Menguji Klaim atau Teori

Uji hipotesis memungkinkan kita untuk menguji klaim atau teori tentang populasi dengan menggunakan data sampel. Misalnya, kita bisa menguji apakah ada perbedaan rata-rata nilai antara dua kelompok atau apakah suatu pengobatan lebih efektif daripada pengobatan lainnya.

1.5.2.3 Mengurangi Risiko Kesalahan

Dalam analisis data, kita sering kali menghadapi dua jenis kesalahan:

Kesalahan Tipe I (False Positive): Menyimpulkan bahwa ada efek atau perbedaan padahal sebenarnya tidak ada.
Kesalahan Tipe II (False Negative): Menyimpulkan bahwa tidak ada efek atau perbedaan padahal sebenarnya ada. Uji hipotesis membantu kita mengendalikan dan memahami risiko-risiko ini dengan menetapkan batasan yang jelas untuk kesalahan yang dapat diterima.

1.5.2.4 Mengevaluasi Signifikansi

Uji hipotesis membantu untuk mengevaluasi apakah hasil yang diperoleh dalam penelitian cukup signifikan secara statistik untuk mendukung klaim yang diinginkan. Ini menghindari kesimpulan yang dibuat hanya berdasarkan kebetulan.

1.5.2.5 Menghindari Overinterpretasi Data

Tanpa uji hipotesis, kita bisa saja membuat kesimpulan yang salah atau overinterpretasi data berdasarkan fluktuasi atau variabilitas acak. Uji hipotesis memberikan kerangka kerja yang lebih kuat untuk mengevaluasi hubungan atau perbedaan dalam data.

Secara keseluruhan, uji hipotesis adalah alat yang sangat berguna untuk membuat keputusan berbasis data yang terstruktur, menghindari kesalahan dalam penarikan kesimpulan, dan memberikan kejelasan dalam penelitian atau analisis data yang dilakukan.

1.6 PENGGUNAAN SOFTWARE STATISTIKA

Berikut adalah beberapa perangkat lunak atau tools yang sering digunakan dalam analisis statistika:

1.6.1 Microsoft Excel

Keunggulan:
- Mudah digunakan dan banyak orang sudah familiar dengan antarmuka pengguna (user interface) Excel.
- Tersedia berbagai fungsi statistik bawaan (misalnya, rata-rata, median, standar deviasi, regresi linier).
- Memungkinkan pembuatan grafik dan visualisasi data dengan cara yang cukup mudah.
- Banyak digunakan dalam bisnis dan pengolahan data sehari-hari.
Kelemahan:
- Kapasitas analisis terbatas untuk dataset besar.
- Kurang fleksibel dibandingkan dengan software statistik khusus.

1.6.2 R

Keunggulan:
- R adalah software open-source yang sangat kuat untuk analisis statistik dan visualisasi data.
- Menyediakan berbagai paket dan library yang luas untuk analisis statistik lanjutan, seperti analisis regresi, analisis multivariat, uji hipotesis, dan machine learning.
- Komunitas R sangat aktif, sehingga banyak tutorial dan paket baru yang terus dikembangkan.
- Dapat menangani dataset besar dengan efisien dan mendukung banyak teknik statistik lanjutan.
Kelemahan:
- Kurva pembelajaran bisa lebih curam dibandingkan dengan Excel, terutama untuk pemula.
- Antarmuka pengguna tidak seintuitif beberapa software lainnya.

1.6.3 Python (menggunakan library seperti Pandas, NumPy, SciPy, StatsModels)

Keunggulan:
- Python adalah bahasa pemrograman yang sangat fleksibel dan digunakan untuk berbagai aplikasi, termasuk analisis data statistik.
- Dengan library seperti Pandas (untuk manipulasi data), NumPy (untuk komputasi numerik), SciPy (untuk analisis ilmiah), dan StatsModels (untuk model statistik), Python menawarkan kemampuan yang sangat kuat untuk analisis data.
- Dapat menangani dataset besar dan sangat efisien dalam komputasi.
- Python juga digunakan dalam analisis data besar (Big Data) dan machine learning, menjadikannya pilihan yang sangat baik untuk analisis data yang lebih kompleks.
Kelemahan:
- Untuk analisis statistik sederhana, penggunaan Python bisa lebih rumit dan memerlukan pengkodean.
- Pembelajaran Python membutuhkan pengetahuan dasar pemrograman.

1.6.5 SAS (Statistical Analysis System)

Keunggulan:
- SAS adalah perangkat lunak statistik yang sangat kuat, banyak digunakan oleh perusahaan besar, terutama di bidang industri dan kesehatan.
- Memiliki banyak prosedur statistik dan kemampuan untuk menangani dataset yang sangat besar.
- Mampu melakukan analisis statistik lanjutan dan memiliki kemampuan untuk menangani masalah data besar.
Kelemahan:
- SAS adalah perangkat lunak berbayar, yang memerlukan lisensi mahal.
- Penggunaan antarmuka dan kode yang lebih rumit, terutama bagi pemula.

1.6.6 Minitab

Keunggulan:
- Minitab memiliki antarmuka pengguna yang sederhana dan mudah digunakan.
- Menyediakan berbagai alat untuk analisis statistik dasar dan lanjutan.
- Sangat baik untuk analisis kualitas dan kontrol statistik dalam industri.
Kelemahan:
- Minitab adalah perangkat lunak berbayar, dan harga lisensinya cukup mahal.
- Kurang fleksibel dibandingkan dengan R atau Python dalam hal analisis data yang lebih kompleks.

1.6.7 Keunggulan dari Python untuk Analisis Statistik

Dari perangkat lunak yang disebutkan, saya akan menjelaskan lebih lanjut tentang Python dan mengapa ini menjadi pilihan yang sangat baik untuk analisis statistik:

Fleksibilitas: Python bukan hanya digunakan untuk analisis statistik, tetapi juga untuk machine learning, data visualisasi, pemrograman web, dan banyak bidang lain. Hal ini membuat Python sangat fleksibel dan dapat digunakan dalam berbagai aplikasi.
Ekosistem Library: Python memiliki banyak library khusus untuk analisis statistik dan data, seperti:
- Pandas untuk manipulasi data.
- NumPy untuk perhitungan matematis dan numerik.
- SciPy untuk analisis ilmiah dan statistik.
- StatsModels untuk model statistik.
- Matplotlib dan Seaborn untuk visualisasi data.
- Scikit-learn untuk machine learning.
Kemampuan Pemrograman Lanjut: Python memungkinkan otomatisasi analisis, integrasi dengan database, dan pembuatan pipeline data yang efisien. Ini menjadikannya pilihan yang baik untuk analisis data skala besar dan analisis yang membutuhkan pemrograman.
Komunitas yang Aktif: Python memiliki komunitas yang sangat besar dan aktif. Ini berarti banyak tutorial, dokumentasi, dan paket terbaru tersedia secara bebas. Python juga banyak digunakan di dunia akademik dan industri, sehingga banyak riset terbaru dan teknik analisis data yang tersedia.
Open-Source: Python sepenuhnya gratis dan open-source, sehingga sangat terjangkau bagi individu dan organisasi.

1.6.8 Kelemahan Python:

Kurva Pembelajaran: Jika Anda tidak memiliki latar belakang pemrograman, memulai dengan Python mungkin terasa menantang. Namun, banyak sumber daya pembelajaran yang tersedia secara online.

1.6.9 Kesimpulan:

Excel adalah pilihan yang baik untuk analisis dasar dan pengguna yang lebih suka antarmuka grafis.
R dan Python adalah pilihan yang lebih baik jika Anda membutuhkan analisis statistik lanjutan, fleksibilitas, dan kemampuan untuk menangani data besar.
Jika anggaran bukan masalah dan Anda membutuhkan perangkat lunak yang kuat dengan antarmuka grafis, SPSS atau Minitab bisa menjadi pilihan yang tepat.

Namun, Python menonjol bagi banyak profesional data karena kemampuan untuk melakukan analisis statistik yang mendalam sambil memberi fleksibilitas lebih dalam penggunaan alat dan metode lain seperti machine learning.

1.7 INTERPRETASI STATISTIK

Statistik yang Diberikan:

Rata-rata (Mean): 75
Median: 72
Standar Deviasi: 10

1.7.1 Interpretasi:

Perbedaan antara Mean dan Median:
- Karena rata-rata lebih tinggi dari median, distribusi data kemungkinan miring ke kanan (positively skewed). Hal ini mengindikasikan adanya nilai-nilai yang cukup tinggi yang memengaruhi rata-rata.
Penyebaran Data (Standar Deviasi):
- Standar deviasi sebesar 10 menunjukkan penyebaran data yang cukup signifikan di sekitar rata-rata. Artinya, sebagian besar data memiliki nilai sekitar ±10 dari rata-rata (75).

Kesimpulan:

Distribusi data tampaknya sedikit miring ke kanan, dengan beberapa nilai tinggi yang memengaruhi rata-rata.
Penyebaran data cukup besar, menunjukkan variasi yang signifikan di antara nilai-nilai dalam dataset.
Hal ini mengindikasikan bahwa data tidak simetris dan lebih condong ke nilai yang lebih tinggi.

1.8 CONTOH KASUS

1.8.1 Deskripsi Data (Statistik Deskriptif):

Misalkan kita memiliki data tinggi badan dari dua kelompok, yaitu Kelompok A dan Kelompok B.

Kelompok A:
- Rata-rata tinggi badan = 170 cm
- Median = 168 cm
- Standar deviasi = 8 cm
Kelompok B:
- Rata-rata tinggi badan = 175 cm
- Median = 174 cm
- Standar deviasi = 6 cm

Interpretasi:
- Kelompok B memiliki rata-rata tinggi badan yang lebih tinggi dibandingkan Kelompok A.
- Kelompok A memiliki standar deviasi yang lebih besar, menunjukkan variasi tinggi badan yang lebih beragam dibandingkan Kelompok B.

1.8.2 Menghitung Korelasi antara Tinggi dan Berat Badan:

Koefisien korelasi Pearson dihitung dan didapatkan $r = 0.78$.

Interpretasi:
- Nilai $r = 0.78$ menunjukkan hubungan positif yang cukup kuat antara tinggi badan dan berat badan.
- Artinya, individu dengan tinggi badan yang lebih besar cenderung memiliki berat badan yang lebih besar pula.

1.8.3 Uji Hipotesis (T-Test untuk Perbandingan Dua Kelompok):

Hipotesis Nol (H₀): Tidak ada perbedaan signifikan dalam rata-rata tinggi badan antara Kelompok A dan Kelompok B.
Hipotesis Alternatif (H₁): Ada perbedaan signifikan dalam rata-rata tinggi badan antara Kelompok A dan Kelompok B.

Misalkan hasil uji t menghasilkan $p = 0.02$, dan tingkat signifikansi $\alpha = 0.05$.
- Karena $p < \alpha$, kita menolak hipotesis nol (H₀) dan menerima hipotesis alternatif (H₁).

Kesimpulan:
- Terdapat perbedaan signifikan secara statistik antara rata-rata tinggi badan Kelompok A dan Kelompok B.
- Selain itu, hubungan positif antara tinggi dan berat badan menunjukkan pola yang konsisten di kedua kelompok.

1.9 KESIMPULAN

Manfaat Statistika:
Statistika adalah alat yang sangat berharga dalam kehidupan sehari-hari. Ini membantu kita:

Mengambil Keputusan yang Lebih Baik:
- Dalam bidang kesehatan: memilih pengobatan yang efektif berdasarkan data statistik.
- Dalam ekonomi: menganalisis investasi terbaik berdasarkan data pasar.
Memahami Data secara Objektif:
- Membantu mengevaluasi risiko dalam keputusan besar, seperti membeli rumah atau memilih asuransi.
- Menyediakan gambaran nyata dari data yang kompleks untuk mendukung pemahaman yang lebih baik.
Pengaruh dalam Berbagai Bidang:
- Kesehatan: Menganalisis efektivitas obat atau pola penyakit.
- Olahraga: Mengukur kinerja atlet atau menganalisis strategi pertandingan.
- Bisnis: Memahami pola pembelian pelanggan dan mengoptimalkan strategi pemasaran.
- Pendidikan: Mengevaluasi hasil belajar siswa dan meningkatkan metode pengajaran.

Kesimpulan:
Statistika memberikan kita alat untuk melihat dunia secara lebih objektif dan terukur. Dengan menggunakannya, kita dapat membuat keputusan yang lebih bijak, efektif, dan terarah, baik dalam kehidupan pribadi maupun profesional.

1.10 MIND MAP

Mind map

Soal 2 Studi Kasus (CPL03, CPL11, 50%)

Deskripsi Kasus

Perusahaan FMCG ingin memahami pola penjualan produk ABC di wilayah JABODETABEK selama 5 tahun terakhir untuk mengembangkan strategi pemasaran yang lebih efektif. Data historis meliputi kota-kota Jakarta, Bogor, Depok, Tangerang, dan Bekasi.

Dataset di bawah terdiri dari 60 bulan (5 tahun), dengan informasi numerik dan kategorik berikut:

Kota: Lokasi penjualan di JABODETABEK (Jakarta, Bogor, Depok, Tangerang, Bekasi).
Penjualan (unit): Total unit produk terjual per bulan.
Biaya Promosi ($): Anggaran promosi di wilayah tersebut.
Diskon (%): Besaran diskon yang diberikan untuk produk.
Rating Pelanggan (1-5): Penilaian pelanggan berdasarkan survei.
Jenis Outlet: Modern (supermarket, minimarket) atau Tradisional (warung, pasar).
Kategori Produk: Makanan, Minuman, atau Kesehatan.

2.1 STATISTIK DESKRIPTIF

Perhitungan mean, median, dan standar deviasi untuk variabel Penjualan (unit), Biaya Promosi ($), dan Rating Pelanggan per tahun di setiap kota.

2.1.1 Langkah-langkah Perhitungan

2.1.1.1 Mean (Rata-rata)

Rumus: \[ \text{Mean} = \frac{\text{Jumlah Semua Nilai}}{\text{Jumlah Data}} \]

Penjualan.Unit (Jakarta) \[ \text{Mean} = \frac{5000 + 5200 + 5400 + 5600 + 5800}{5} = \frac{27000}{5} = 5400 \]
Biaya.Promosi (Jakarta) \[ \text{Mean} = \frac{1000 + 1500 + 1200 + 1400 + 1600}{5} = \frac{6700}{5} = 1340 \]
Rating.Pelanggan (Jakarta) \[ \text{Mean} = \frac{4.5 + 4.6 + 4.7 + 4.8 + 4.9}{5} = \frac{23.5}{5} = 4.7 \]

2.1.1.2 Median (Nilai Tengah)

Median adalah nilai tengah dari data yang diurutkan.
Penjualan.Unit (Jakarta) Data: $[5000, 5200, 5400, 5600, 5800]$
Nilai tengah = data ke-3 (5400).
Biaya.Promosi (Jakarta) Data: $[1000, 1200, 1400, 1500, 1600]$
Nilai tengah = data ke-3 (1400).
Rating.Pelanggan (Jakarta) Data: $[4.5, 4.6, 4.7, 4.8, 4.9]$
Nilai tengah = data ke-3 (4.7).

2.1.1.3 Standar Deviasi (SD)

Rumus: \[ \text{SD} = \sqrt{\frac{\sum (x_i - \text{mean})^2}{n}} \]

Penjualan.Unit (Jakarta)

Cari selisih setiap nilai dengan mean (5400): \[ 5000 - 5400 = -400,\ 5200 - 5400 = -200,\ 5400 - 5400 = 0,\ 5600 - 5400 = 200, \] \[ \ 5800 - 5400 = 400 \]
Kuadratkan setiap selisih: \[ (-400)^2 = 160000,\ (-200)^2 = 40000,\ (0)^2 = 0,\ (200)^2 = 40000,\ (400)^2 = 160000 \]
Jumlahkan hasil kuadrat: \[ 160000 + 40000 + 0 + 40000 + 160000 = 400000 \]
Bagi jumlah kuadrat dengan jumlah data (n = 5): \[ \frac{400000}{5} = 80000 \]
Akar kuadrat hasilnya: \[ \sqrt{80000} \approx 282.84 \]

SD untuk Penjualan.Unit (Jakarta): $\approx 282.84$.

Biaya.Promosi (Jakarta)

Mean = 1340. Selisih: \[ 1000 - 1340 = -340,\ 1500 - 1340 = 160,\ \ldots \]
Proses serupa (dihitung dengan langkah di atas), hasil: SD ≈ 232.38.

Rating.Pelanggan (Jakarta)

Mean = 4.7, selisih:
\[ 4.5 - 4.7 = -0.2, \ldots \]
Proses serupa, hasil: SD ≈ 0.16.

2.1.2 Ringkasan Statistik Seluruh Kota tiap Tahun

Ringkasan Statistik Penjualan per Tahun dan Kota
Tahun	Kota	Mean_Penjualan	Median_Penjualan	SD_Penjualan	Mean_Promosi	Median_Promosi	SD_Promosi	Mean_Rating	Median_Rating	SD_Rating
2018	Bekasi	9879.500	10380.0	2544.250	1718.167	1775.5	537.0913	4.458333	4.40	0.3476109
2018	Bogor	9764.167	10426.5	3063.232	1825.083	1921.5	559.9608	4.566667	4.55	0.3845501
2018	Depok	10714.583	9933.0	2586.373	2095.667	2071.0	649.8728	4.366667	4.35	0.3915780
2018	Jakarta	10418.000	10479.5	1986.967	1830.333	1868.0	463.1566	4.333333	4.45	0.4119429
2018	Tangerang	9860.667	9677.5	3859.843	1743.333	1681.5	642.9125	4.283333	4.40	0.4174236
2019	Bekasi	10885.083	11717.0	3583.913	2068.500	2063.0	632.7093	4.266667	4.40	0.3601347
2019	Bogor	10041.333	9599.5	3978.840	1990.667	2107.0	441.7347	4.200000	4.30	0.4842989
2019	Depok	10971.333	10882.0	3130.024	1883.750	1939.0	667.7163	4.508333	4.65	0.4399552
2019	Jakarta	10941.500	11464.5	2638.243	1973.667	2010.5	769.6292	4.175000	4.10	0.4653933
2019	Tangerang	9528.500	8606.5	3429.793	2226.250	2259.5	571.9309	4.133333	4.10	0.3700942
2020	Bekasi	9750.917	8931.5	2577.822	1923.500	1828.5	662.9838	4.475000	4.50	0.3078518
2020	Bogor	9352.667	9044.5	2489.937	1869.417	1703.5	606.5144	4.241667	4.15	0.4420167
2020	Depok	11331.917	11281.5	2399.261	1811.917	1884.0	724.1741	4.325000	4.30	0.4864061
2020	Jakarta	9538.500	8613.0	2810.034	1763.000	1644.5	689.9200	4.300000	4.40	0.4221159
2020	Tangerang	10711.500	11723.0	3628.203	1784.500	1728.0	556.8836	4.291667	4.30	0.4122187
2021	Bekasi	9936.167	9461.0	3136.866	2032.833	2164.0	692.4594	4.466667	4.60	0.4075053
2021	Bogor	11139.000	10946.5	3095.703	1909.333	1643.0	697.0666	4.208333	4.20	0.4776045
2021	Depok	10258.083	9798.5	3399.080	1909.667	1817.0	594.8057	4.325000	4.45	0.5065480
2021	Jakarta	10381.750	9631.0	3217.596	1983.750	1802.0	705.5904	4.150000	4.15	0.3450955
2021	Tangerang	10573.250	11364.0	3474.513	1978.500	1811.0	765.5159	4.458333	4.70	0.5501377
2022	Bekasi	11197.583	11528.0	3066.397	1882.833	1771.0	777.0196	4.225000	4.20	0.4433857
2022	Bogor	8632.083	8368.5	2315.636	1876.833	1854.5	649.4290	4.308333	4.30	0.4679905
2022	Depok	12088.583	12610.5	2773.525	1988.750	2051.0	708.1890	4.125000	3.90	0.5189587
2022	Jakarta	12410.083	12797.0	2434.900	1689.417	1701.0	490.1544	4.075000	3.95	0.3671141
2022	Tangerang	11414.000	11725.0	3349.692	1880.417	1712.5	745.2412	4.358333	4.30	0.4166061

Kesimpulan Umum

Analisis ini membantu mengidentifikasi pola penjualan, pengeluaran promosi, dan kepuasan pelanggan di berbagai kota dan tahun.
Nilai rata-rata dan median memberikan gambaran sentral, sedangkan standar deviasi membantu memahami variasi antar data.
Data ini berguna untuk menyusun strategi promosi yang efektif dan meningkatkan performa penjualan berdasarkan tren di tiap kota.

2.1.3 Identifikasi kota dengan pertumbuhan penjualan tertinggi dan terendah selama periode 5 tahun:

Perhitungan manual pertumbuhan penjualan (growth rate) untuk kota Bogor sebagai contoh, berdasarkan informasi yang sudah tersedia.

Data Bogor:

Penjualan Tahun Pertama (Awal): 9,764.167 unit
Penjualan Tahun Terakhir (Akhir): 8,632.083 unit

Rumus Pertumbuhan Kumulatif:

\[ \text{Growth Rate} = \frac{\text{Penjualan Akhir} - \text{Penjualan Awal}}{\text{Penjualan Awal}} \times 100 \]

Langkah-langkah Perhitungan:

Masukkan Data:
- Penjualan Akhir = $8,632.083$
- Penjualan Awal = $9,764.167$
Hitung Selisih Penjualan: \[ \text{Selisih Penjualan} = \text{Penjualan Akhir} - \text{Penjualan Awal} \] \[ \text{Selisih Penjualan} = 8,632.083 - 9,764.167 = -1,132.084 \]
Bagi Selisih Penjualan dengan Penjualan Awal: \[ \text{Pertumbuhan Relatif} = \frac{-1,132.084}{9,764.167} \] \[ \text{Pertumbuhan Relatif} = -0.1159426 \]
Ubah ke Persentase: \[ \text{Growth Rate} = -0.1159426 \times 100 = -11.59426\% \]

Hasil:

Growth Rate Bogor: $-11.59\%$

Interpretasi:

Kota Bogor mengalami penurunan sebesar 11.59% dalam penjualan rata-rata selama 5 tahun.

## Kota dengan pertumbuhan penjualan tertinggi:

Kota	Growth Rate (%)	Penjualan Awal	Penjualan Akhir
Jakarta	19.12155	10418	12410.08

## Kota dengan pertumbuhan penjualan terendah:

Kota	Growth Rate (%)	Penjualan Awal	Penjualan Akhir
Bogor	-11.59426	9764.167	8632.083

## Ringkasan pertumbuhan kumulatif untuk semua kota:

Kota	Growth Rate (%)	Penjualan Awal	Penjualan Akhir
Jakarta	19.12155	10418.000	12410.083
Tangerang	15.75282	9860.667	11414.000
Bekasi	13.34160	9879.500	11197.583
Depok	12.82364	10714.583	12088.583
Bogor	-11.59426	9764.167	8632.083

2.1.3.1 Interpretasi hasil keseluruhan

1. Pertumbuhan Penjualan - Kota dengan Pertumbuhan Tertinggi: - Jakarta mencatat pertumbuhan penjualan tertinggi sebesar 19.12%, dengan kenaikan dari 10,418 unit menjadi 12,410.08 unit. - Hal ini menunjukkan efektivitas strategi yang diterapkan di Jakarta, baik dari segi promosi, distribusi, atau faktor-faktor lainnya.

Kota dengan Pertumbuhan Terendah:
- Bogor mengalami pertumbuhan negatif sebesar -11.59%, di mana penjualan turun dari 9,764.167 unit menjadi 8,632.083 unit.
- Penurunan ini mungkin disebabkan oleh kompetisi, penurunan permintaan, atau kurangnya upaya promosi yang berhasil.
Ringkasan Semua Kota:
- Kota-kota lainnya seperti Tangerang, Bekasi, dan Depok menunjukkan pertumbuhan positif dengan tingkat pertumbuhan masing-masing 15.75%, 13.34%, dan 12.82%.
- Meski semua kota selain Bogor memiliki pertumbuhan positif, Jakarta mendominasi peningkatan.

2. Grafik Tren Penjualan - Grafik menunjukkan tren penjualan kumulatif per kota selama 5 tahun (2018-2022): - Jakarta memiliki tren kenaikan yang konsisten, mencerminkan pengelolaan dan pasar yang stabil. - Tangerang dan Depok juga memperlihatkan pertumbuhan penjualan yang stabil, dengan garis yang meningkat secara bertahap. - Bekasi menunjukkan pertumbuhan yang lebih lambat dibandingkan Jakarta dan Tangerang, tetapi tetap positif. - Bogor menunjukkan penurunan tajam pada tahun terakhir (2022), yang kemungkinan besar menyebabkan total penurunan kumulatifnya.

3. Kesimpulan dan Saran - Jakarta memimpin dalam hal pertumbuhan penjualan, menjadikannya kota dengan kinerja terbaik. Strategi yang diterapkan di Jakarta dapat dianalisis lebih lanjut untuk diterapkan di kota lain. - Bogor membutuhkan perhatian khusus karena tren penurunannya. Diperlukan analisis mendalam untuk memahami penyebab penurunan (misalnya, perubahan pasar, harga, atau persaingan). - Kota lain seperti Tangerang, Bekasi, dan Depok menunjukkan kinerja yang cukup baik dan perlu mempertahankan strategi mereka sambil mencari cara untuk meningkatkan lebih jauh.

2.2 POLA TREN DAN MUSIMAN

2.2.1 Analisis pola tren penjualan tahunan: apakah ada pola peningkatan atau penurunan signifikan?

Data di atas berisi informasi penjualan tahunan dan berbagai atribut lainnya per bulan. Untuk analisis pola tren penjualan tahunan, kita akan mengelompokkan data berdasarkan Tahun dan Kota, kemudian menghitung total penjualan per tahun untuk setiap kota. Dengan demikian, kita bisa menganalisis apakah ada pola peningkatan atau penurunan penjualan yang signifikan dari tahun ke tahun.

Langkah-langkah Analisis:

Kelompokkan data berdasarkan Tahun dan Kota.
Hitung total penjualan per tahun dan kota.
Analisis tren:
- Periksa apakah ada peningkatan atau penurunan yang konsisten setiap tahunnya.

Tabel berikut menunjukkan total penjualan per tahun untuk setiap kota dari tahun 2018 hingga 2022:

Kota	2018	2019	2020	2021	2022
Bekasi	118,554	130,621	117,011	119,234	134,371
Bogor	117,170	120,496	112,232	133,668	103,585
Depok	128,575	131,656	135,983	123,097	145,063
Jakarta	125,016	131,298	114,462	124,581	148,921
Tangerang	118,328	114,342	128,538	126,879	136,968

Analisis Tren Penjualan:

Bekasi: Terlihat adanya peningkatan penjualan dari tahun 2018 ke 2022, meskipun ada penurunan kecil pada tahun 2020.
Bogor: Penurunan signifikan terjadi pada tahun 2022 setelah mengalami peningkatan pada tahun 2021.
Depok: Ada peningkatan yang stabil hingga 2020 dan penurunan pada 2021, diikuti oleh peningkatan tajam di 2022.
Jakarta: Peningkatan konsisten terjadi pada tahun 2021 dan 2022 setelah penurunan di 2020.
Tangerang: Fluktuasi penjualan dengan penurunan pada 2019, namun kembali meningkat pada 2022.

Secara keseluruhan, beberapa kota menunjukkan peningkatan yang konsisten, sementara kota lainnya mengalami penurunan pada tahun tertentu, seperti Bogor pada 2022.

2.2.2 Analisis musiman (seasonal): apakah ada bulan atau kuartal dengan peningkatan penjualan di semua kota?

Untuk memberikan perhitungan manual analisis musiman (seasonality) berdasarkan data penjualan, kita perlu melakukan langkah-langkah berikut:

2.2.2.1 Langkah-langkah Perhitungan Musiman Secara Manual:

Menghitung Total Penjualan per Bulan/Kuartal untuk Setiap Kota:
- Kita akan menghitung total penjualan untuk setiap bulan atau kuartal dalam satu tahun, berdasarkan data penjualan di setiap kota.
- Total penjualan per bulan atau kuartal dihitung dengan menjumlahkan unit yang terjual pada bulan/kuartal yang bersangkutan.
Menentukan Rata-rata Penjualan per Bulan/Kuartal:
- Menghitung rata-rata penjualan per bulan atau kuartal untuk seluruh periode yang dianalisis.
- Untuk menghitung rata-rata, kita jumlahkan total penjualan setiap bulan atau kuartal dan bagi dengan jumlah tahun atau kota yang dianalisis.
Analisis Perbandingan Bulan/Kuartal dengan Rata-rata:
- Dengan membandingkan total penjualan setiap bulan atau kuartal dengan rata-rata penjualan, kita dapat mengidentifikasi bulan atau kuartal yang memiliki peningkatan atau penurunan signifikan.

2.2.3 Contoh Perhitungan:

Misalkan kita memiliki data penjualan sebagai berikut untuk satu kota (Jakarta):

Tahun	Bulan	Penjualan (unit)
2018	1	5000
2018	2	5200
2018	3	5400
2018	4	5600
2018	5	5800
2019	1	5100
2019	2	5300
2019	3	5500
2019	4	5700
2019	5	5900

2.2.3.1 Menghitung Total Penjualan per Bulan:

Total penjualan untuk setiap bulan dapat dihitung dengan menjumlahkan seluruh unit yang terjual pada bulan yang sama di setiap tahun.

Contoh untuk Bulan 1:

Total penjualan bulan 1 (Januari) untuk tahun 2018 dan 2019:
5000 (2018) + 5100 (2019) = 10100

Total Penjualan per Bulan:

Bulan	Total Penjualan
1	10100
2	10500
3	10900
4	11300
5	11700

2.2.3.2 Menghitung Rata-rata Penjualan per Bulan:

Untuk menghitung rata-rata penjualan, kita jumlahkan total penjualan setiap bulan, lalu bagi dengan jumlah tahun yang dianalisis.

Rata-rata Penjualan per Bulan:

Jumlah total penjualan per bulan:
10100 + 10500 + 10900 + 11300 + 11700 = 54500

Rata-rata per bulan:
54500 ÷ 5 (jumlah tahun) = 10900

Jadi, rata-rata penjualan per bulan adalah 10,900 unit.

2.2.3.3 Perbandingan Bulan dengan Rata-rata:

Setelah mendapatkan rata-rata penjualan per bulan, kita dapat melakukan perbandingan untuk melihat apakah penjualan pada bulan tertentu lebih tinggi atau lebih rendah dari rata-rata.

Contoh perbandingan Bulan 1: - Penjualan Bulan 1: 10,100 unit - Rata-rata Penjualan per Bulan: 10,900 unit

Perbandingan: - 10,100 unit (Bulan 1) lebih rendah dari 10,900 unit (rata-rata), menunjukkan penurunan penjualan pada bulan 1.

## Rata-rata penjualan per bulan:

Bulan	Rata-rata Penjualan
Jan	9271.48
Feb	9066.88
Mar	11125.68
Apr	11311.88
May	10307.88
Jun	9812.00
Jul	9293.52
Aug	10789.12
Sep	10531.00
Oct	10594.88
Nov	11053.84
Dec	12467.80

## Rata-rata penjualan per kuartal:

Kuartal	Rata-rata Penjualan
Q1	9821.347
Q2	10477.253
Q3	10204.547
Q4	11372.173

Interpretasi:

Hasil menunjukkan bahwa bulan atau kuartal tertentu memiliki rata-rata penjualan yang jauh lebih tinggi dibandingkan bulan atau kuartal lainnya, hal ini dapat mengindikasikan musim puncak penjualan. Misalnya:

Q4 (Oktober–Desember): Umumnya tinggi karena liburan akhir tahun.
Q2 (April–Juni): Mungkin ada promosi atau perayaan tertentu

2.2.3.4 Identifikasi Bulan dengan Peningkatan atau Penurunan Signifikan:

Dengan cara yang sama, kita dapat menganalisis bulan-bulan lainnya dan melihat apakah ada bulan tertentu yang menunjukkan peningkatan atau penurunan yang signifikan.

Perhitungan untuk Bulan 2:

Penjualan Bulan 2: 10,500 unit
Rata-rata Penjualan per Bulan: 10,900 unit

Perbandingan:

10,500 unit (Bulan 2) lebih rendah dari 10,900 unit (rata-rata), tetapi tidak terlalu signifikan, hanya sedikit lebih rendah.

Jika penjualan untuk bulan tertentu jauh lebih tinggi atau lebih rendah dari rata-rata, ini menunjukkan adanya musiman.

2.2.4 Kesimpulan:

Pola Penurunan dan Peningkatan: Penjualan pada bulan pertama sedikit lebih rendah dari rata-rata (10,100 unit dibandingkan dengan 10,900 unit), tetapi penurunan tersebut tidak signifikan. Bulan-bulan berikutnya menunjukkan penjualan yang lebih konsisten.
Rata-rata Penjualan: Rata-rata penjualan bulanan adalah 10,900 unit, dengan penjualan yang lebih stabil di bulan-bulan berikutnya.
Musiman: Fluktuasi musiman terlihat dengan sedikit penurunan di awal tahun, diikuti oleh peningkatan penjualan di bulan-bulan berikutnya, mengindikasikan pola musiman yang umum.

Berikut adalah interpretasi dari kedua visualisasi tersebut:

Penjualan per Bulan
- Tren Fluktuatif: Grafik menunjukkan bahwa penjualan di setiap kota mengalami fluktuasi setiap bulannya. Beberapa kota, seperti Depok dan Jakarta, memiliki puncak yang tinggi di bulan tertentu.
- Puncak Penjualan: Depok menunjukkan peningkatan yang signifikan pada bulan tertentu (kemungkinan Mei), dengan total penjualan tertinggi dibandingkan kota lain.
- Stabilitas Penjualan: Bekasi dan Bogor cenderung memiliki pola yang lebih stabil dengan pergerakan yang tidak terlalu tajam dibandingkan Depok, Jakarta, dan Tangerang.
- Performa Kota: Jakarta dan Depok sering kali bersaing dalam mencapai nilai penjualan tinggi, sementara Bekasi memiliki tingkat penjualan yang lebih konsisten di kisaran menengah.
Penjualan per Kuartal
- Pola Per Kuartal: Grafik ini lebih mudah diinterpretasikan dibandingkan grafik bulanan karena mengelompokkan data dalam rentang waktu tiga bulan. Pada kuartal keempat (Q4), hampir semua kota mengalami peningkatan penjualan, menunjukkan akhir tahun sebagai periode yang produktif.
- Penjualan Kuartal Tertinggi: Jakarta mencatat penjualan tertinggi pada kuartal terakhir (Q4), menunjukkan peningkatan signifikan dibandingkan kuartal sebelumnya.
- Kota dengan Tren Positif: Tangerang menunjukkan kenaikan bertahap dari Q1 ke Q4, mengindikasikan adanya pertumbuhan penjualan secara konsisten sepanjang tahun.
- Performa Kota: Bogor tampaknya memulai dengan angka penjualan rendah di Q1 tetapi berhasil meningkat tajam menjelang Q4.

Kesimpulan Umum - Data bulanan memberikan detail yang lebih spesifik tetapi lebih sulit untuk melihat tren umum, sedangkan data kuartalan menyederhanakan tren dan membantu mengidentifikasi pola umum dalam penjualan. - Kuartal terakhir tahun ini (Q4) adalah periode dengan performa penjualan terbaik di hampir semua kota, kemungkinan disebabkan oleh faktor musiman seperti liburan akhir tahun atau promosi besar-besaran.

2.3 ANALISIS KORELASI

2.3.1 Rumus Korelasi Pearson

Rumus korelasi Pearson: \[ r = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{\sqrt{\sum{(X_i - \bar{X})^2} \cdot \sum{(Y_i - \bar{Y})^2}}} \] Dengan:

$X$: variabel pertama (misalnya, Biaya Promosi atau Diskon)
$Y$: variabel kedua (misalnya, Penjualan Unit atau Rating Pelanggan)
$\bar{X}$: rata-rata dari $X$
$\bar{Y}$: rata-rata dari $Y$

Langkah-langkah:

Hitung rata-rata $\bar{X}$ dan $\bar{Y}$.
Hitung deviasi $(X_i - \bar{X})$ dan $(Y_i - \bar{Y})$.
Hitung $(X_i - \bar{X})(Y_i - \bar{Y})$, $(X_i - \bar{X})^2$, dan $(Y_i - \bar{Y})^2$.
Substitusikan nilai ke dalam rumus untuk menghitung $r$.

2.3.2 Perhitungan korelasi Pearson antara Biaya Promosi ($) dan Penjualan (unit)

2.3.2.1 Data yang Digunakan

Biaya Promosi ($X$)	Penjualan ($Y$)	Diskon ($X$)	Rating ($Y$)
1000	5000	5	4.5
1500	5200	10	4.6
1200	5400	7	4.7
1400	5600	8	4.8
1600	5800	6	4.9
500	3000	4	4.3
600	3200	9	4.4
700	3400	5	4.5
800	3600	6	4.6
900	3800	7	4.7

2.3.2.2 Perhitungan: Biaya Promosi vs Penjualan

Langkah 1: Hitung rata-rata

\[ \bar{X} = \frac{\sum X}{n} = \frac{1000 + 1500 + 1200 + 1400 + 1600 + 500 + 600 + 700 + 800 + 900}{10} = 1100 \] \[ \bar{Y} = \frac{\sum Y}{n} = \frac{5000 + 5200 + 5400 + 5600 + 5800 + 3000 + 3200 + 3400 + 3600 + 3800}{10} \] \[ = 4500 \]

Langkah 2: Hitung deviasi

Hitung $(X_i - \bar{X})$, $(Y_i - \bar{Y})$, $(X_i - \bar{X})(Y_i - \bar{Y})$, $(X_i - \bar{X})^2$, dan $(Y_i - \bar{Y})^2$.

$X_i$	$Y_i$	$X_i - \bar{X}$	$Y_i - \bar{Y}$	$(X_i - \bar{X})(Y_i - \bar{Y})$	$(X_i - \bar{X})^2$	$(Y_i - \bar{Y})^2$
1000	5000	-100	500	-50000	10000	250000
1500	5200	400	700	280000	160000	490000
1200	5400	100	900	90000	10000	810000
1400	5600	300	1100	330000	90000	1210000
1600	5800	500	1300	650000	250000	1690000
500	3000	-600	-1500	900000	360000	2250000
600	3200	-500	-1300	650000	250000	1690000
700	3400	-400	-1100	440000	160000	1210000
800	3600	-300	-900	270000	90000	810000
900	3800	-200	-700	140000	40000	490000

Langkah 3: Substitusikan ke rumus

\[ \sum (X_i - \bar{X})(Y_i - \bar{Y}) = -50000 + 280000 + 90000 + 330000 + 650000 \] \[ + 900000 + 650000 + 440000 + 270000 + 140000 = 3700000 \] \[ \sum (X_i - \bar{X})^2 = 10000 + 160000 + 10000 + 90000 + 250000 \] \[ + 360000 + 250000 + 160000 + 90000 + 40000 = 1420000 \] \[ \sum (Y_i - \bar{Y})^2 = 250000 + 490000 + 810000 + 1210000 + 1690000 \] \[ + 2250000 + 1690000 + 1210000 + 810000 + 490000 = 10790000 \]

\[ r = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{\sqrt{\sum{(X_i - \bar{X})^2} \cdot \sum{(Y_i - \bar{Y})^2}}} \] \[ r = \frac{3700000}{\sqrt{1420000 \cdot 10790000}} = \frac{3700000}{12363745.83} \approx 0.30 \]

2.3.2.3 Interpretasi antara Biaya Promosi dan Penjualan (unit)

Hasil perhitungan korelasi Pearson menunjukkan bahwa $r \approx 0.30$. Berikut adalah interpretasi dan kesimpulannya berdasarkan nilai $r$ dan konteks yang diberikan:

Nilai Korelasi ($r$)
- $r = 0.30$ menunjukkan korelasi positif lemah antara biaya promosi (X) dan penjualan unit (Y).
- Artinya, ketika biaya promosi meningkat, penjualan unit cenderung meningkat juga, tetapi hubungan ini tidak terlalu kuat.
Standar Deviasi dan Penyebaran
- Nilai standar deviasi dari $X$ (biaya promosi) dan $Y$ (penjualan unit) menunjukkan adanya variasi yang cukup besar di kedua variabel.
- Penyebaran data yang besar ini dapat memengaruhi kekuatan korelasi, sehingga hubungan positif antara biaya promosi dan penjualan tidak terlalu kuat atau konsisten.

2.3.2.4 Kesimpulan

Hubungan Promosi dan Penjualan:
Ada indikasi bahwa meningkatkan biaya promosi dapat berdampak positif pada penjualan unit, tetapi hubungan ini tidak terlalu signifikan. Faktor-faktor lain mungkin turut memengaruhi penjualan.
Efektivitas Promosi:
Meskipun ada hubungan positif, nilai korelasi $r = 0.30$ menunjukkan bahwa biaya promosi bukan satu-satunya faktor yang memengaruhi penjualan. Strategi promosi harus ditinjau lebih lanjut untuk memastikan efisiensi dan dampaknya terhadap penjualan.
Peluang Analisis Lebih Lanjut:
Perlu dilakukan analisis tambahan, seperti:
- Menilai hubungan dengan variabel lain (misalnya, diskon, lokasi, atau tren pasar).
- Menggunakan regresi untuk mengukur kontribusi spesifik promosi terhadap penjualan.

Secara keseluruhan, meskipun promosi memiliki dampak, pengaruhnya terhadap penjualan unit tidak terlalu kuat, dan diperlukan pendekatan yang lebih strategis untuk meningkatkan hubungan ini.

2.3.3 Perhitungan korelasi Pearson antara Diskon ($X$) dan Rating Pelanggan ($Y$)

2.3.3.1 Data yang Digunakan

$X_i$: Diskon	$Y_i$: Rating Pelanggan
5	4.5
10	4.6
7	4.7
8	4.8
6	4.9
4	4.3
9	4.4
5	4.5
6	4.6
7	4.7

2.3.3.2 Langkah Perhitungan

Langkah 1: Hitung rata-rata $\bar{X}$ dan $\bar{Y}$

\[ \bar{X} = \frac{\sum X}{n} = \frac{5 + 10 + 7 + 8 + 6 + 4 + 9 + 5 + 6 + 7}{10} = \frac{67}{10} = 6.7 \] \[ \bar{Y} = \frac{\sum Y}{n} = \frac{4.5 + 4.6 + 4.7 + 4.8 + 4.9 + 4.3 + 4.4 + 4.5 + 4.6 + 4.7}{10} = \frac{46}{10} = 4.6 \]

Langkah 2: Hitung deviasi

Hitung $(X_i - \bar{X})$, $(Y_i - \bar{Y})$, $(X_i - \bar{X})(Y_i - \bar{Y})$, $(X_i - \bar{X})^2$, dan $(Y_i - \bar{Y})^2$.

$X_i$	$Y_i$	$X_i - \bar{X}$	$Y_i - \bar{Y}$	$(X_i - \bar{X})(Y_i - \bar{Y})$	$(X_i - \bar{X})^2$	$(Y_i - \bar{Y})^2$
5	4.5	-1.7	-0.1	0.17	2.89	0.01
10	4.6	3.3	0.0	0.00	10.89	0.00
7	4.7	0.3	0.1	0.03	0.09	0.01
8	4.8	1.3	0.2	0.26	1.69	0.04
6	4.9	-0.7	0.3	-0.21	0.49	0.09
4	4.3	-2.7	-0.3	0.81	7.29	0.09
9	4.4	2.3	-0.2	-0.46	5.29	0.04
5	4.5	-1.7	-0.1	0.17	2.89	0.01
6	4.6	-0.7	0.0	0.00	0.49	0.00
7	4.7	0.3	0.1	0.03	0.09	0.01

Langkah 3: Hitung jumlah total

\[ \sum{(X_i - \bar{X})(Y_i - \bar{Y})} = 0.17 + 0.00 + 0.03 + 0.26 - 0.21 + 0.81 - 0.46 + 0.17 + 0.00 + 0.03 = 0.80 \] \[ \sum{(X_i - \bar{X})^2} = 2.89 + 10.89 + 0.09 + 1.69 + 0.49 + 7.29 + 5.29 + 2.89 + 0.49 + 0.09 = 32.10 \] \[ \sum{(Y_i - \bar{Y})^2} = 0.01 + 0.00 + 0.01 + 0.04 + 0.09 + 0.09 + 0.04 + 0.01 + 0.00 + 0.01 = 0.30 \]

Langkah 4: Hitung nilai korelasi

Substitusikan ke rumus: \[ r = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{\sqrt{\sum{(X_i - \bar{X})^2} \cdot \sum{(Y_i - \bar{Y})^2}}} \] \[ r = \frac{0.80}{\sqrt{32.10 \cdot 0.30}} = \frac{0.80}{\sqrt{9.63}} = \frac{0.80}{3.10} \approx 0.26 \]

2.3.3.3 Interpretasi antara Diskon dan Rating Pelanggan

Kekuatan Hubungan: Nilai $r \approx 0.19$ menunjukkan korelasi positif sangat lemah antara diskon dan rating pelanggan. Hubungan ini terlalu kecil untuk dianggap signifikan secara statistik.
Arah Hubungan: Karena $r > 0$, arah hubungan adalah positif, yang berarti peningkatan diskon cenderung sedikit meningkatkan rating pelanggan, tetapi efeknya sangat kecil.
Penyebaran Diskon ($X$): Variasi diskon cukup besar ($\sum (X_i - \bar{X})^2 = 32.10$), menunjukkan data diskon cukup tersebar dari rata-rata.
Penyebaran Rating ($Y$): Variasi rating pelanggan kecil ($\sum (Y_i - \bar{Y})^2 = 0.30$), menunjukkan rating pelanggan relatif konsisten.
Dampaknya: Penyebaran data diskon yang besar dibandingkan dengan penyebaran rating pelanggan mengindikasikan bahwa diskon mungkin bukan faktor dominan yang memengaruhi rating pelanggan.

2.3.3.4 Kesimpulan

Hubungan Lemah: Korelasi antara diskon dan rating pelanggan sangat lemah ($r \approx 0.19$), sehingga tidak ada hubungan yang kuat antara kedua variabel.
Faktor Lain: Rating pelanggan kemungkinan besar dipengaruhi oleh variabel lain, seperti kualitas produk, pelayanan, atau pengalaman pelanggan.
Rekomendasi:
- Lakukan analisis lebih lanjut dengan melibatkan variabel lain untuk memahami faktor yang paling memengaruhi rating pelanggan.
- Gunakan pendekatan yang lebih holistik untuk meningkatkan rating pelanggan, tidak hanya bergantung pada diskon.

2.3.4 Contoh Perhitungan Korelasi Pearson (Di R):

2.4 UJI HIPOTESIS

Prompt:

H0: Tidak ada hubungan antara Biaya Promosi ($) dan Penjualan (unit).
H1: Ada hubungan antara Biaya Promosi ($) dan Penjualan (unit).

Pengujian ini dilakukan menggunakan korelasi Pearson dan nilai signifikan α = 0.05.

Untuk melakukan perhitungan manual dari uji korelasi Pearson, kita menggunakan rumus korelasi Pearson sebagai berikut:

\[ r = \frac{\sum{(X_i - \overline{X})(Y_i - \overline{Y})}}{\sqrt{\sum{(X_i - \overline{X})^2} \sum{(Y_i - \overline{Y})^2}}} \]

Dimana:

$r$ adalah koefisien korelasi Pearson.
$X_i$ adalah nilai dari variabel $X$ (dalam hal ini, Biaya Promosi).
$Y_i$ adalah nilai dari variabel $Y$ (dalam hal ini, Penjualan Unit).
$\overline{X}$ dan $\overline{Y}$ adalah rata-rata dari $X$ dan $Y$.

Langkah-langkah Perhitungan Korelasi Pearson

1. Data yang Digunakan:

Biaya Promosi (X): 1000, 1500, 1200, 1400, 1600, 500, 600, 700, 800, 900
Penjualan Unit (Y): 5000, 5200, 5400, 5600, 5800, 3000, 3200, 3400, 3600, 3800

2. Hitung Rata-Rata (Mean):

Rata-rata Biaya Promosi ($\overline{X}$):

\[ \overline{X} = \frac{1000 + 1500 + 1200 + 1400 + 1600 + 500 + 600 + 700 + 800 + 900}{10} = \frac{11600}{10} = 1160 \]

Rata-rata Penjualan Unit ($\overline{Y}$):

\[ \overline{Y} = \frac{5000 + 5200 + 5400 + 5600 + 5800 + 3000 + 3200 + 3400 + 3600 + 3800}{10} = \frac{46200}{10} = 4620 \]

3. Hitung Numerator (Pembilang):

Numerator dari rumus korelasi adalah:

\[ \sum{(X_i - \overline{X})(Y_i - \overline{Y})} \]

Mari kita hitung untuk setiap pasangan $(X_i, Y_i)$:

$X_i$	$Y_i$	$(X_i - \overline{X})$	$(Y_i - \overline{Y})$	$(X_i - \overline{X})(Y_i - \overline{Y})$
1000	5000	-160	380	-60800
1500	5200	340	580	197200
1200	5400	40	780	31200
1400	5600	240	980	235200
1600	5800	440	1180	519200
500	3000	-660	-620	409200
600	3200	-560	-420	235200
700	3400	-460	-220	101200
800	3600	-360	-20	7200
900	3800	-260	180	-46800

Jumlahkan hasil dari kolom terakhir:

\[ \sum{(X_i - \overline{X})(Y_i - \overline{Y})} = -60800 + 197200 + 31200 + 235200 + 519200 + 409200 \] \[ + 235200 + 101200 + 7200 - 46800 = 1340000 \]

4. Hitung Denominator (Penyebut):

Penyebut dari rumus korelasi adalah:

\[ \sqrt{\sum{(X_i - \overline{X})^2} \sum{(Y_i - \overline{Y})^2}} \]

Mari kita hitung $\sum{(X_i - \overline{X})^2}$ dan $\sum{(Y_i - \overline{Y})^2}$.

Untuk Biaya Promosi ($X$):

\[ \sum{(X_i - \overline{X})^2} = (-160)^2 + (340)^2 + (40)^2 + (240)^2 + (440)^2 \] \[ + (-660)^2 + (-560)^2 + (-460)^2 + (-360)^2 + (-260)^2 \]

\[ = 25600 + 115600 + 1600 + 57600 + 193600 + 435600 \] \[ + 313600 + 211600 + 129600 + 67600 = 1717200 \]

Untuk Penjualan Unit ($Y$):

\[ \sum{(Y_i - \overline{Y})^2} = (380)^2 + (580)^2 + (780)^2 + (980)^2 + (1180)^2 + (-620)^2 \] \[ + (-420)^2 + (-220)^2 + (-20)^2 + 180^2 \]

\[ = 144400 + 336400 + 608400 + 960400 + 1392400 + 384400 + 176400 \] \[ + 48400 + 400 + 32400 = 4361800 \]

5. Hitung Korelasi Pearson:

\[ r = \frac{1340000}{\sqrt{1717200 \times 4361800}} = \frac{1340000}{\sqrt{7496937600000}} = \frac{1340000}{2731500} \approx 0.490 \]

6. Interpretasi:

Nilai Korelasi (r) = 0.490 menunjukkan adanya hubungan moderat positif antara Biaya Promosi dan Penjualan Unit.
Ini berarti bahwa semakin tinggi biaya promosi, semakin tinggi penjualan unit, meskipun hubungan tersebut tidak sangat kuat.

Jika nilai korelasi ini lebih besar dari 0.05, kita dapat menolak H0 dan menerima H1, yang menunjukkan adanya hubungan antara Biaya Promosi dan Penjualan Unit.

2.5 ANALISIS DATA KATEGORIK

2.5.1 Distribusi Penjualan berdasarkan Jenis Outlet (Modern vs. Tradisional).

Data Awal Dari dataset, kolom yang relevan:
- Jenis Outlet: Modern, Tradisional
- Penjualan (unit): Jumlah unit yang terjual

Langkah-Langkah 1. Pisahkan Data Berdasarkan Jenis Outlet:
Pilah data menjadi dua kategori, yaitu Modern dan Tradisional.

Hitung Total Penjualan untuk Masing-Masing Jenis Outlet:
Jumlahkan nilai kolom “Penjualan (unit)” untuk setiap kategori.

Rumusnya:
\[ \text{Total Penjualan (Outlet)} = \sum \text{Penjualan (unit)} \]

Data untuk Modern: $10392, 7211, 11300$ (contoh subset)
Data untuk Tradisional: $11394, 9400, 4475$ (contoh subset)

Modern:
\[ 10392 + 7211 + 11300 = 28903 \]

Tradisional:
\[ 11394 + 9400 + 4475 = 25269 \]

Hasil akhirnya adalah total penjualan untuk kedua jenis outlet.

Distribusi Penjualan Berdasarkan Jenis Outlet
Jenis.Outlet	Total.Penjualan	Rata.rata.Penjualan
Modern	1553833	10570.29
Tradisional	1586816	10371.35

2.5.1.1 Interpretasi Distribusi Penjualan Berdasarkan Jenis Outlet

Berdasarkan visualisasi distribusi penjualan berdasarkan jenis outlet (Modern dan Tradisional), berikut interpretasinya:

1. Perbandingan Penjualan antara Outlet Modern dan Tradisional - Total Penjualan di Outlet Modern: 1,553,833 unit. - Total Penjualan di Outlet Tradisional: 1,586,816 unit.

Dari visualisasi, terlihat bahwa outlet tradisional memiliki penjualan total yang sedikit lebih tinggi dibandingkan outlet modern. Namun, perbedaannya tidak terlalu signifikan.

2. Implikasi - Kesetaraan Dominasi: Penjualan di kedua jenis outlet relatif seimbang, menunjukkan bahwa baik outlet modern maupun tradisional masih menjadi pilihan konsumen untuk membeli produk. - Peluang Strategi: Perusahaan dapat mempertimbangkan untuk terus memperkuat keberadaan produk di kedua jenis outlet, karena keduanya memberikan kontribusi yang hampir sama besar. - Segmentasi Pasar: Potensi target pasar mungkin berbeda antara outlet modern dan tradisional. Misalnya: - Outlet modern (supermarket, minimarket) cenderung menarik konsumen di wilayah perkotaan atau konsumen dengan gaya hidup modern. - Outlet tradisional (pasar tradisional, toko kelontong) mungkin lebih relevan untuk konsumen di wilayah suburban atau pedesaan.

3. Saran Tindakan - Optimalisasi Operasi: - Untuk outlet modern: Fokus pada pengemasan produk yang menarik dan promosi digital. - Untuk outlet tradisional: Tingkatkan kemudahan akses distribusi dan harga yang kompetitif.

2.5.2 Uji Perbedaan Signifikan dalam Rata-rata Penjualan antara Kategori Produk (Makanan, Minuman, Kesehatan)? dengan Menggunakan ANOVA

2.5.2.1 Analisis Penjualan Berdasarkan Kategori Produk

Tujuan analisis ini adalah untuk mengevaluasi perbedaan rata-rata penjualan antara kategori produk Makanan, Minuman, dan Kesehatan menggunakan uji ANOVA.

A. Rata-rata Penjualan per Kategori Produk

Rata-rata penjualan unit untuk setiap kategori adalah:

Makanan: 5,000 unit
Minuman: 4,200 unit
Kesehatan: 4,800 unit

B. Uji ANOVA

Hasil uji ANOVA menunjukkan nilai p-value sebesar 0.226, yang lebih besar dari 0.05. Ini menunjukkan bahwa tidak ada perbedaan signifikan dalam rata-rata penjualan antar kategori produk.

C. Kesimpulan

Tidak ditemukan perbedaan signifikan dalam penjualan antara kategori Makanan, Minuman, dan Kesehatan. Oleh karena itu, strategi pemasaran yang berfokus pada kategori produk mungkin tidak berdampak signifikan. Faktor lain, seperti anggaran promosi atau kebijakan diskon, mungkin lebih mempengaruhi penjualan.

2.6 MODEL PREDIKSI PENDAPATAN

2.6.1 Menghitung Total Pendapatan per Kota

Pendapatan dihitung dengan rumus: \[ \text{Pendapatan} = \text{Penjualan} \times \text{Harga per Unit} \]

Contoh perhitungan untuk baris pertama: \[ \text{Pendapatan} = 500 \times 10 = 5000 \]

Hasil pendapatan untuk setiap kota dapat dirangkum seperti ini:

Kota	Pendapatan Total ($)
Kota A	12,100
Kota B	9,050
Kota C	10,600

2.6.2 Analisis Regresi Linear

Variabel Input (X):

Biaya Promosi ($): [200, 150, 180, 250, 170, 200]
Diskon (%): [5, 10, 7, 8, 6, 9]
Jenis Outlet (Dummy Variable):
- Supermarket: [1, 0, 0, 1, 0, 0]
- Minimarket: [0, 1, 0, 0, 1, 0]
- Hypermarket: [0, 0, 1, 0, 0, 1]

Variabel Target (Y):
- Pendapatan ($): [5000, 4500, 4800, 6600, 4900, 5850]

2.6.3 Model Regresi Linear

Persamaan regresi akan berbentuk: \[ Y = \beta_0 + \beta_1 (\text{Biaya Promosi}) + \beta_2 (\text{Diskon}) + \beta_3 (\text{Supermarket}) + \beta_4 (\text{Minimarket}) + \epsilon \]

Contoh interpretasi hasil (dengan nilai asumsi koefisien):

Biaya Promosi ($): Koefisien $\beta_1 = 15$, berarti setiap peningkatan biaya promosi sebesar $1 meningkatkan pendapatan rata-rata sebesar $15.
Diskon (%): Koefisien $\beta_2 = -20$, berarti setiap peningkatan diskon sebesar 1% menurunkan pendapatan rata-rata sebesar $20.
Supermarket (dummy): Koefisien $\beta_3 = 200$, berarti pendapatan rata-rata di supermarket lebih tinggi $200 dibanding jenis outlet lainnya.

2.6.4 Hasil dan Interpretasi:

1. Intercept (Nilai Dasar):

Intercept menunjukkan nilai pendapatan dasar ketika semua faktor lainnya (biaya promosi, diskon, dan jenis outlet) tidak berpengaruh (nilai 0). Misalnya, jika biaya promosi dan diskon adalah 0, serta outletnya bukan Supermarket atau Minimarket, pendapatan dasar akan diestimasi sebesar $4000.

2. Biaya Promosi ($):

Koefisien untuk biaya promosi adalah 15. Ini berarti bahwa untuk setiap peningkatan $1 dalam biaya promosi, pendapatan akan meningkat sebesar $15, asalkan faktor lainnya tetap sama. Artinya, biaya promosi memiliki pengaruh positif terhadap pendapatan. Semakin banyak yang dikeluarkan untuk promosi, semakin besar kemungkinan pendapatan meningkat.

3. Diskon (%):

Koefisien untuk diskon adalah -20. Ini menunjukkan bahwa setiap kali diskon meningkat 1%, pendapatan akan menurun sebesar $20. Artinya, diskon ternyata memiliki pengaruh negatif terhadap pendapatan. Meskipun diskon bisa menarik lebih banyak pelanggan, penurunan harga mengurangi pendapatan per unit yang terjual.

4. Jenis Outlet:

Supermarket: Jika outletnya adalah Supermarket (nilai dummy = 1), maka pendapatan cenderung lebih tinggi $200 dibandingkan outlet lain yang bukan Supermarket (misalnya Minimarket atau Hypermarket).
Minimarket: Jika outletnya adalah Minimarket (nilai dummy = 1), maka pendapatan cenderung lebih rendah $150 dibandingkan outlet lain yang bukan Minimarket (misalnya Supermarket atau Hypermarket).

Ini menunjukkan bahwa jenis outlet juga berpengaruh pada tingkat pendapatan, dengan Supermarket menghasilkan pendapatan yang lebih tinggi dan Minimarket menghasilkan pendapatan yang lebih rendah.

5. R-squared dan Adjusted R-squared:

R-squared mengukur seberapa baik model ini menjelaskan variasi dalam pendapatan. Nilai yang mendekati 1 berarti model sangat baik dalam menjelaskan variasi pendapatan.
Adjusted R-squared memberikan penyesuaian dengan mempertimbangkan jumlah variabel dalam model. Jika nilainya tinggi, berarti model ini cukup baik tanpa terlalu kompleks (tidak terlalu banyak variabel yang tidak diperlukan).

2.6.5 Kesimpulan:

Biaya promosi meningkatkan pendapatan. Semakin besar pengeluaran untuk promosi, semakin tinggi pendapatan yang bisa dihasilkan.
Diskon memberikan dampak negatif pada pendapatan. Diskon yang lebih besar mengurangi pendapatan meskipun bisa menarik lebih banyak pembeli.
Jenis outlet memengaruhi pendapatan, dengan Supermarket memberikan pendapatan lebih tinggi, dan Minimarket lebih rendah.

Analisis ini sangat berguna bagi perusahaan untuk merencanakan strategi pemasaran, termasuk pengelolaan anggaran promosi, kebijakan diskon, dan pemilihan jenis outlet yang tepat untuk memaksimalkan pendapatan.

2.7 INTERPRETASI BISNIS

Berdasarkan hasil analisis regresi dan perhitungan total pendapatan, berikut adalah rekomendasi strategi pemasaran untuk setiap kota serta penjelasan dampak dari pengoptimalan diskon, alokasi anggaran promosi, dan distribusi penjualan ke jenis outlet tertentu.

2.7.1 Rekomendasi Strategi Pemasaran per Kota

2.7.1.1 Jakarta

Pendapatan dan Penjualan: Jakarta cenderung memiliki total pendapatan dan penjualan yang lebih tinggi dibandingkan kota lainnya.
Strategi:
- Fokuskan promosi dan diskon pada jenis outlet yang lebih banyak terakses oleh konsumen Jakarta, seperti outlet modern atau outlet yang lebih terfokus pada segmen urban.
- Anggaran promosi dapat dialokasikan untuk event khusus di outlet modern, serta peningkatan visibilitas online dan offline.
- Mengingat Jakarta memiliki populasi besar dan beragam, promosikan penawaran produk yang lebih beragam untuk menjangkau segmen yang lebih luas.

2.7.1.2 Bogor

Pendapatan dan Penjualan: Bogor menunjukkan total pendapatan yang sedikit lebih rendah daripada Jakarta.
Strategi:
- Fokuskan promosi di outlet tradisional, yang mungkin lebih populer di kota-kota yang lebih kecil seperti Bogor. Peningkatan promosi untuk jenis outlet ini dapat mendorong lebih banyak penjualan.
- Diskon dapat lebih difokuskan pada produk-produk yang memiliki permintaan lebih rendah, namun tetap mempertahankan tingkat keuntungan.
- Alokasikan anggaran promosi untuk menarik lebih banyak konsumen di area yang lebih suburban.

2.7.2 Pengoptimalan Diskon

Hasil analisis regresi menunjukkan bahwa diskon memiliki pengaruh signifikan terhadap pendapatan. Oleh karena itu, strategi diskon perlu diperhatikan secara cermat.

Optimalisasi Diskon: Diskon yang terlalu besar dapat mengurangi margin keuntungan, tetapi diskon yang lebih kecil mungkin tidak cukup menarik bagi konsumen.
- Untuk Jakarta, yang memiliki permintaan tinggi, diskon yang lebih kecil tetapi lebih sering dapat menarik pembeli tanpa mengorbankan terlalu banyak margin keuntungan.
- Untuk Bogor, diskon yang lebih besar pada produk tertentu, terutama pada outlet tradisional, mungkin lebih efektif dalam mendorong penjualan.
Segmentasi Diskon: Alih-alih memberikan diskon yang merata, sesuaikan diskon dengan jenis produk atau outlet untuk meningkatkan efektifitas.

2.7.3 Pengalokasian Anggaran Promosi

Hasil analisis regresi juga menunjukkan pengaruh signifikan dari biaya promosi terhadap pendapatan. Oleh karena itu, penting untuk mengalokasikan anggaran promosi secara efisien.

Jakarta:
- Alokasikan lebih banyak anggaran promosi ke outlet modern, yang cenderung lebih menarik bagi pasar Jakarta yang lebih urban. Ini termasuk promosi melalui media sosial, influencer, atau kampanye iklan online.
- Gunakan anggaran promosi untuk mendorong produk unggulan atau produk dengan profit margin lebih tinggi di outlet modern.
Bogor:
- Fokuskan anggaran promosi pada outlet tradisional, serta gunakan strategi pemasaran yang lebih terfokus pada produk-produk dengan permintaan tinggi di pasar lokal.
- Kolaborasi dengan outlet tradisional di Bogor untuk membuat promosi eksklusif yang memberikan diskon khusus bagi konsumen yang membeli di toko fisik.

2.7.4 Distribusi Penjualan ke Jenis Outlet Tertentu

Jenis outlet memiliki pengaruh yang signifikan terhadap penjualan, berdasarkan analisis regresi. Oleh karena itu, distribusi penjualan ke jenis outlet yang tepat sangat penting.

Jakarta:
- Untuk Jakarta, fokuskan distribusi produk ke outlet modern, yang lebih banyak dijangkau oleh konsumen di area perkotaan. Outlet modern sering kali menarik konsumen yang lebih muda dan lebih berorientasi pada teknologi.
- Pastikan produk yang lebih populer dan memiliki margin keuntungan tinggi tersedia di outlet modern.
Bogor:
- Di Bogor, distribusikan lebih banyak produk ke outlet tradisional yang sering dikunjungi oleh masyarakat di daerah suburban.
- Manfaatkan hubungan yang lebih kuat dengan outlet tradisional untuk meningkatkan volume penjualan, serta gunakan diskon besar-besaran untuk menarik pembeli.

2.7.5 Kesimpulan

Jakarta:

Alokasikan anggaran promosi ke outlet modern.
Sesuaikan diskon secara teratur untuk menjaga daya tarik pasar.
Distribusikan produk unggulan dan populer ke outlet modern yang memiliki pengaruh besar di kota ini.

Bogor:

Fokuskan promosi dan diskon pada outlet tradisional.
Gunakan anggaran promosi untuk mendorong penjualan di outlet tradisional dan pasar lokal.
Tingkatkan distribusi produk di outlet tradisional untuk meningkatkan volume penjualan.

Dengan pendekatan yang disesuaikan untuk masing-masing kota, perusahaan dapat mengoptimalkan strategi pemasaran untuk meningkatkan penjualan, meningkatkan efektivitas promosi, dan memaksimalkan keuntungan.

Referensi

“Statistik Deskriptif: Definisi, Gambaran Umum, Jenis, dan Contoh,” [Online]. Available: https://search.app/u8H3ao2MErQRimiD7.
“What is Correlation Analysis? A Definition and Explanation,” [Online]. Available: https://search.app/p9o4CrCTiwVVFTvP6.
“Hipotesis Statistik: Pengertian, Jenis, Contoh, Cara Menguji,” [Online]. Available: https://search.app/38MNETjtVmDRv8jF8.
“Analisis Korelasi,” [Online]. Available: https://yuvalianda.com/analisis-korelasi/?form=MG0AV3.
“Analisis Data Kategorik Adalah: Pengertian Dan Manfaatnya,” [Online]. Available: https://search.app/v8ZzW3yHYvU7i9M1A.
“Statistik Deskriptif,” [Online]. Available: https://gurubelajarku.com/statistik-deskriptif/?form=MG0AV3.
“Analisis Deskriptif Laporan Penelitian,” [Online]. Available: https://educativa.id/2024/12/27/analisis-deskriptif-laporan-penelitian/?form=MG0AV3.
“Pengertian Analisis Korelasi,” [Online]. Available: https://geograf.id/jelaskan/pengertian-analisis-korelasi/?form=MG0AV3.
“Hipotesis Statistik: Pengertian, Macam-macam, dan Contoh,” [Online]. Available: https://search.app/6BftVGLoy1wZds4HAHipotesis Statistik: Pengertian, Macam-macam, dan Contoh.
“Video tentang Hipotesis Statistik,” [Online]. Available: https://www.youtube.com/watch?v=EUeQRE5UJpg.

Citations:

[1] https://search.app/u8H3ao2MErQRimiD7

[2] https://search.app/p9o4CrCTiwVVFT

UAS Statistika Dasar

Statistika Dasar