Analisis data merupakan bagian penting dalam mendukung pengambilan keputusan berbasis informasi, khususnya dalam mengevaluasi kinerja penjualan. Dengan memanfaatkan data yang tersedia, perusahaan dapat memahami pola serta perbedaan kinerja yang terjadi di berbagai wilayah.
Data yang digunakan dalam laporan ini merupakan data yang bersumber dari dataset Coffee Chain. Variabel yang dianalisis meliputi State, Budget Sales, Sales, serta variabel turunan berupa Gap (Sales-Budget Sales) sebagai indikator selisih antara realisasi dan target penjualan.
Proses pengolahan data dilakukan dengan mengintegrasikan database MySQL ke dalam RStudio melalui R Markdown. Selanjutnya, dilakukan visualisasi data serta analisis statistik untuk mengidentifikasi pola dan perbedaan yang terdapat dalam data.
Analisis ini difokuskan pada produk chamomile yang termasuk dalam kategori herbal tea, dengan wilayah penjualan di negara bagian New Mexico dan Texas. Pemilihan produk dan kategori ini dilakukan sebagai bentuk penyederhanaan data agar analisis lebih terarah dan spesifik.
Dalam praktiknya, target penjualan (Budget Sales) yang ditetapkan perusahaan tidak selalu sesuai dengan realisasi penjualan (Sales), sehingga menimbulkan selisih yang disebut sebagai gap. Nilai gap ini menjadi indikator penting untuk menilai apakah suatu wilayah mengalami kelebihan atau kekurangan pencapaian terhadap target penjualan yang telah ditentukan.
Perbedaan karakteristik pasar antara New Mexico dan Texas memungkinkan terjadinya variasi dalam nilai gap. Oleh karena itu, analisis ini bertujuan untuk mengidentifikasi dan menguji apakah terdapat perbedaan yang signifikan dalam kinerja penjualan antara kedua wilayah tersebut.
Langkah pertama dalam analisis ini adalah persiapan data, yang meliputi pemuatan paket (library) yang diperlukan dalam R. Selanjutnya, dilakukan pembangunan koneksi antara RStudio dan database MySQL menggunakan fungsi dbConnect(). Kemudian, data diambil dari database untuk digunakan dalam proses visualisasi dan analisis statistik.
library(DBI)
library(odbc)
## Warning: package 'odbc' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
con_coffee <- DBI::dbConnect(odbc::odbc(),
Driver = "MySQL ODBC 8.0 ANSI Driver",
Server = "127.0.0.1",
Database = "coffee_chain",
UID = "root",
PWD = "merahdelima22",
Port = 3306)
Setelah koneksi ke database berhasil terjalin, dilakukan pengambilan data dari MySQL sebagai berikut:
Blok kode SQL yang akan digunakan untuk menghitung rata-rata gap penjualan (sales-budget sales) produk Chamomile tipe herbal tea untuk masing-masing negara bagian, yaitu New Mexico dan Texas. Data hasil kueri kemudian disimpan dalam data frame R bernama NewMexico_mean untuk New Mexico dan Texas_mean untuk Texas. Selanjutnya, kedua data frame tersebut digabungkan menggunakan fungsi rbind() menjadi satu data frame utuh bernama Mean_Gabung yang siap digunakan untuk visualisasi.
Blok kode SQL kedua digunakan untuk menghitung total penjualan (Sales) produk chamomile tipe herbal tea untuk masing-masing negara bagian, yaitu New Mexico dan Texas. Data hasil kueri kemudian disimpan dalam data frame R bernama Sales_NewMexico untuk New Mexico dan Sales_Texas untuk Texas. Selanjutnya, kedua data frame tersebut digabungkan menggunakan fungsi rbind() menjadi satu data frame bernama Sales_Gabung yang siap digunakan untuk visualisasi kedua.
Blok kode SQL ketiga digunakan untuk menghitung nilai gap (Sales-Budget Sales) produk chamomile dengan tipe herbal tea untuk masing-masing kedua negara bagian. Data hasil kueri tersebut masing-masing disimpan dalam data frame bernama Gap_NewMexico dan Gap_Texas yang kemudian digabungkan menggunakan fungsi rbind() menjadi satu data frame bernama Gap_Gabung. Kolom GAP kemudian dikonversi menjadi tipe numerik menggunakan as.numeric() agar dapat dianalisis lebih lanjut.
NewMexico_mean <- dbGetQuery(con_coffee, "SELECT state, AVG(`sales`-`budget sales`) AS MEAN_GAP
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND State = 'New Mexico'
group by State")
NewMexico_mean
## state MEAN_GAP
## 1 New Mexico 8.7083
Texas_mean <- dbGetQuery(con_coffee, "SELECT state, AVG(`sales`-`budget sales`) AS MEAN_GAP
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND State = 'Texas'
group by State")
Texas_mean
## state MEAN_GAP
## 1 Texas 12.5833
Sales_NewMexico <- dbGetQuery(con_coffee, "SELECT state, SUM(Sales) AS TOTAL_SALES
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND State = 'New Mexico'
group by State")
Sales_NewMexico
## state TOTAL_SALES
## 1 New Mexico 1209
Sales_Texas <- dbGetQuery(con_coffee, "SELECT state, SUM(Sales) AS TOTAL_SALES
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND State = 'Texas'
group by State")
Sales_Texas
## state TOTAL_SALES
## 1 Texas 3102
Gap_NewMexico <- dbGetQuery(con_coffee, "SELECT state, (`sales`-`budget sales`) AS GAP
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND state ='New Mexico'")
Gap_NewMexico
## state GAP
## 1 New Mexico 5
## 2 New Mexico 5
## 3 New Mexico 5
## 4 New Mexico 7
## 5 New Mexico 9
## 6 New Mexico 8
## 7 New Mexico 11
## 8 New Mexico 3
## 9 New Mexico 8
## 10 New Mexico 12
## 11 New Mexico 9
## 12 New Mexico 11
## 13 New Mexico 10
## 14 New Mexico 8
## 15 New Mexico 8
## 16 New Mexico 10
## 17 New Mexico 9
## 18 New Mexico 7
## 19 New Mexico 10
## 20 New Mexico 2
## 21 New Mexico 11
## 22 New Mexico 15
## 23 New Mexico 12
## 24 New Mexico 14
Gap_Texas <- dbGetQuery(con_coffee, "SELECT state, (`sales`-`budget sales`) AS GAP
FROM facttable
JOIN product USING (ProductId)
JOIN location USING (`Area Code`)
WHERE product = 'Chamomile' AND `product type` = 'Herbal Tea' AND state ='Texas'")
Gap_Texas
## state GAP
## 1 Texas 10
## 2 Texas 10
## 3 Texas 4
## 4 Texas 9
## 5 Texas 3
## 6 Texas 8
## 7 Texas 10
## 8 Texas 8
## 9 Texas 5
## 10 Texas 13
## 11 Texas 18
## 12 Texas 17
## 13 Texas 27
## 14 Texas 19
## 15 Texas 13
## 16 Texas 17
## 17 Texas 2
## 18 Texas 7
## 19 Texas 9
## 20 Texas 7
## 21 Texas 13
## 22 Texas 21
## 23 Texas 27
## 24 Texas 25
# untuk visualisasi pertama (Rata-rata Gap)
Mean_Gabung <- rbind(NewMexico_mean, Texas_mean)
Mean_Gabung
## state MEAN_GAP
## 1 New Mexico 8.7083
## 2 Texas 12.5833
# untuk visualisasi kedua (Total Sales)
Sales_Gabung <- rbind(Sales_NewMexico, Sales_Texas)
Sales_Gabung
## state TOTAL_SALES
## 1 New Mexico 1209
## 2 Texas 3102
# untuk analisis data
Gap_Gabung <- rbind(Gap_NewMexico, Gap_Texas)
Gap_Gabung$GAP <- as.numeric(Gap_Gabung$GAP)
Gap_Gabung
## state GAP
## 1 New Mexico 5
## 2 New Mexico 5
## 3 New Mexico 5
## 4 New Mexico 7
## 5 New Mexico 9
## 6 New Mexico 8
## 7 New Mexico 11
## 8 New Mexico 3
## 9 New Mexico 8
## 10 New Mexico 12
## 11 New Mexico 9
## 12 New Mexico 11
## 13 New Mexico 10
## 14 New Mexico 8
## 15 New Mexico 8
## 16 New Mexico 10
## 17 New Mexico 9
## 18 New Mexico 7
## 19 New Mexico 10
## 20 New Mexico 2
## 21 New Mexico 11
## 22 New Mexico 15
## 23 New Mexico 12
## 24 New Mexico 14
## 25 Texas 10
## 26 Texas 10
## 27 Texas 4
## 28 Texas 9
## 29 Texas 3
## 30 Texas 8
## 31 Texas 10
## 32 Texas 8
## 33 Texas 5
## 34 Texas 13
## 35 Texas 18
## 36 Texas 17
## 37 Texas 27
## 38 Texas 19
## 39 Texas 13
## 40 Texas 17
## 41 Texas 2
## 42 Texas 7
## 43 Texas 9
## 44 Texas 7
## 45 Texas 13
## 46 Texas 21
## 47 Texas 27
## 48 Texas 25
barchart_Mean<-ggplot(Mean_Gabung, aes(x = state, y = MEAN_GAP)) +
geom_bar(stat = "identity", fill= c("#DD9E59", "#FFC193"), alpha = 1) +
theme_minimal() +
labs(title = "Perbandingan Rata-rata Gap Penjualan Chamomile di New Mexico dan Texas",
x = "Negara Bagian",
y = "Rata-rata Gap (USD)") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
barchart_Mean
Diagram batang di atas menyajikan perbandingan rata-rata gap penjualan produk chamomile antara negara bagian New Mexico dan Texas dalam satuan USD (Dolar Amerika Serikat). Gap penjualan yang dimaksud dalam analisis ini merupakan selisih antara realisasi penjualan (Sales) dengan target penjualan (Budget Sales) atau secara matematis dapat dituliskan sebagai Gap = Sales - Budget Sales.
Rata-rata gap penjualan berfungsi sebagai indikator untuk menilai sejauh mana pencapaian realisasi penjualan terhadap target yang telah ditentukan secara keseluruhan. Apabila hasil dari gap menunjukkan nilai yang positif, maka realisasi penjualan chamomile sudah melebihi target yang ditetapkan yang berarti target telah tercapai dengan baik. Sebaliknya, jika nilai gap negatif, maka realisasi penjualan berada di bawah target sehingga perlu dilakukan evaluasi terhadap strategi penjualan yang diterapkan.
Berdasarkan diagram batang tersebut, terlihat bahwa rata-rata gap penjualan chamomile di New Mexico adalah 8.71, sedangkan di Texas adalah 12.58. Kedua nilai tersebut sama-sama positif yang berarti penjualan produk chamomile di kedua negara bagian telah berhasil melampaui target penjualan yang ditetapkan perusahaan. Meskipun keduanya bernilai positif, nilai rata-rata gap antara kedua wilayah menunjukkan perbedaan. New Mexico memiliki nilai rata-rata gap sebesar 8.71 yang berarti secara rata-rata realisasi penjualan produk chamomile di New Mexico melebihi target sebesar 8.71 per transaksi. Sementara itu, Texas memiliki nilai rata-rata gap sebesar 12.58 yang berarti secara rata-rata realisasi penjualan produk Chamomile di Texas melebihi target sebesar 12.58 per transaksi. Dari data tersebut, terlihat bahwa Texas memiliki tingkat kelebihan target yang lebih tinggi dibandingkan New Mexico, dengan selisih sekitar 3.87.
Sehingga, dapat dikatakan kinerja penjualan produk Chamomile di Texas lebih baik daripada di New Mexico dalam hal kemampuan melampaui target penjualan. Dari hasil ini, perusahaan perlu mempertahankan bahkan meningkatkan target penjualan di kedua wilayah dengan perhatian khusus pada faktor-faktor yang membuat Texas lebih unggul dalam melampaui target.
Sales_barchart <- ggplot(Sales_Gabung, aes(x = state, y = TOTAL_SALES)) +
geom_bar(stat = "identity", fill = c("#D8E983", "#AEB877"), alpha = 1) +
geom_text(aes(label = TOTAL_SALES), vjust = -0.5, size = 3) +
theme_minimal() +
labs(title = "Total Penjualan Chamomile di New Mexico dan Texas",
x = "Negara Bagian",
y = "Total Penjualan (USD)") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Sales_barchart
Berdasarkan diagram batang di atas, total penjualan produk Chamomile di Texas tercatat sebesar 3.102 USD, sedangkan di New Mexico sebesar 1.209 USD. Dengan demikian, total penjualan di Texas lebih tinggi sebesar 1.893 USD dibandingkan dengan New Mexico. Kondisi ini mengindikasikan bahwa produk chamomile lebih laku terjual di Texas dibandingkan di New Mexico, yang turut didukung oleh faktor-faktor lain seperti target penjualan yang lebih besar, biaya produksi yang lebih tinggi, hingga laba yang lebih besar dibandingkan New Mexico. Secara keseluruhan, Texas merupakan pasar yang lebih besar dan lebih menguntungkan bagi produk chamomile dibandingkan New Mexico, baik dari sisi volume penjualan maupun profitabilitas. Oleh karena itu, selain perusahaan mempertahankan fokus pemasaran di Texas, hal yang lebih penting adalah perusahaan disarankan untuk mengevaluasi, mengembangkan, dan meningkatkan strategi pemasaran di New Mexico agar penjualan produk chamomile dapat berkembang lebih luas.
Untuk menguji perbedaan gap penjualan chamomile antara New Mexico dan Texas, digunakan uji independent t-test (Welch’s t-test) dengan tingkat signifikansi sebesar 0.05. Uji ini dipilih karena data yang dianalisis terdiri dari dua kelompok independen, yaitu kelompok New Mexico dan kelompok Texas, serta tidak mensyaratkan asumsi varians yang sama antara kedua kelompok.
Uji_Gap_Chamomile = t.test(GAP ~ state, data = Gap_Gabung)
Uji_Gap_Chamomile
##
## Welch Two Sample t-test
##
## data: GAP by state
## t = -2.3723, df = 31.507, p-value = 0.02396
## alternative hypothesis: true difference in means between group New Mexico and group Texas is not equal to 0
## 95 percent confidence interval:
## -7.2042345 -0.5457655
## sample estimates:
## mean in group New Mexico mean in group Texas
## 8.708333 12.583333
Berdasarkan hasil uji independent t-test (Welch’s t-test) yang dilakukan untuk membandingkan nilai gap penjualan produk chamomile antara New Mexico dan Texas, diperoleh nilai p-value sebesar 0.02396. Nilai p-value tersebut lebih kecil dari tingkat signifikansi 0.05, sehingga H0 ditolak dan dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara nilai gap penjualan chamomile di New Mexico dan Texas. Secara deskriptif, rata-rata nilai gap di New Mexico adalah 8.71, sedangkan di Texas adalah 12.58. Kedua nilai rata-rata tersebut positif yang mengindikasikan bahwa realisasi penjualan di kedua wilayah telah melebihi target penjualan. Namun, nilai gap di Texas secara signifikan lebih tinggi dibandingkan New Mexico, dengan selisih rata-rata sebesar 3.87. Selang kepercayaan 95% berada pada rentang -7,20 hingga -0,55 menunjukkan bahwa nilai gap di Texas secara konsisten lebih tinggi daripada di New Mexico. Nilai t-statistik sebesar -2,3723 juga memperkuat bahwa nilai gap New Mexico lebih rendah daripada Texas. Secara keseluruhan, hasil uji ini menunjukkan bahwa terdapat perbedaan yang signifikan antara nilai gap penjualan produk chamomile di Texas dan New Mexico.
Berdasarkan hasil analisis penjualan produk chamomile di New Mexico dan Texas, diperoleh kesimpulan sebagai berikut. Dari sisi visualisasi, New Mexico dan Texas sama-sama memiliki nilai gap positif, yang berarti realisasi penjualan telah melebihi target. Namun, Texas tetap menunjukkan kinerja yang lebih baik. Selain itu, total penjualan di Texas sebesar 3.102 USD jauh lebih tinggi dibandingkan New Mexico yang hanya sebesar 1.209 USD, mengindikasikan bahwa Texas merupakan pasar yang lebih besar. Dari sisi analisis, hasil uji independent t-test yang menunjukkan nilai p-value sebesar 0,02396 memberikan kesimpulan bahwa terdapat perbedaan yang signifikan pada nilai gap penjualan antara kedua wilayah. Rata-rata gap di Texas sebesar 12.58 USD, lebih tinggi dibandingkan New Mexico sebesar 8.71 USD menunjukkan bahwa Texas lebih unggul dalam melampaui target penjualan.
Secara keseluruhan, Texas dapat dikatakan memiliki kinerja penjualan yang lebih kuat dibandingkan New Mexico, baik dari sisi pencapaian target maupun volume penjualan. Adapun saran bagi perusahaan yakni mempertahankan kinerja di Texas sekaligus mengevaluasi dan meningkatkan strategi pemasaran di New Mexico agar penjualannya dapat berkembang lebih luas.