UTS Pemrograman Sains Data

Profile

1. (CPL 11 dan CPL 13, 20%) Operasi dan Tipe Data Dasar

Buat program sederhana dalam R dan Python

  1. Menerima dua bilangan dari pengguna

  2. Menghitung dan menampilkan hasil:

    • Penjumlahan
    • Perkalian
    • Pembagian
    • Bilangan pertama pangkat bilangan kedua
  3. Menampilkan tipe data masing-masing hasil operasi

# Input bilangan (langsung ditentukan)
bil1 <- 8
bil2 <- 2

# Operasi
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2

# Output
cat("Penjumlahan:", penjumlahan, "- Tipe:", class(penjumlahan), "\n")
## Penjumlahan: 10 - Tipe: numeric
cat("Perkalian:", perkalian, "- Tipe:", class(perkalian), "\n")
## Perkalian: 16 - Tipe: numeric
cat("Pembagian:", pembagian, "- Tipe:", class(pembagian), "\n")
## Pembagian: 4 - Tipe: numeric
cat("Pangkat:", pangkat, "- Tipe:", class(pangkat), "\n")
## Pangkat: 64 - Tipe: numeric

2. (CPL 1 dan CPL 2, 20%) Struktur Kendali (Control Flow)

Tulislah program dalam R dan Python yang:

  1. Menerima input nilai ujian dari pengguna (0 - 100)

  2. Menampilkan keterangan berdasarkan ketentuan berikut:

    • Nilai ≥ 85: “Sangat Baik”
    • Nilai 70–84: “Baik”
    • Nilai 60–69: “Cukup”
    • Nilai < 60: “Perlu Perbaikan”
# Nilai ujian (langsung dimasukkan)
nilai <- 92

# Penilaian
if (nilai >= 85) {
  cat("Sangat Baik\n")
} else if (nilai >= 70) {
  cat("Baik\n")
} else if (nilai >= 60) {
  cat("Cukup\n")
} else {
  cat("Perlu Perbaikan\n")
}
## Sangat Baik

3. (CPL_KU_01 dan CPL_KU_01, 20%) Fungsi dan Perulangan

Buatlah fungsi dalam R dan Python bernama kelipatan_genap(n) yang:

  1. Menerima input integer n

  2. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1
    hingga n

  3. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1
    hingga n

# Fungsi kelipatan genap dari 4
kelipatan_genap <- function(n) {
  hasil <- c()
  for (i in 1:n) {
    if (i %% 4 == 0) {
      hasil <- c(hasil, i)
    }
  }
  cat("Kelipatan genap dari 1 sampai", n, "adalah:\n")
  print(hasil)
}

# Langsung tetapkan nilai n = 40
kelipatan_genap(40)
## Kelipatan genap dari 1 sampai 40 adalah:
##  [1]  4  8 12 16 20 24 28 32 36 40

4. (CPL_KU_01 dan CPL_KU_01, 40%) Studi Kasus

Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya berdasarkan data transaksi selama 3 bulan terakhir. Namun, data yang tersedia berasal dari berbagai sumber dan memiliki kualitas yang beragam. Anda diminta untuk melakukan Data Wrangling sebelum dianalisis lebih lanjut.

Bagian 1: Data Collection*

Asumsikan data berasal dari 3 file CSV berbeda (januari.csv, februari.csv, maret.csv).

Tugas Anda:

  1. Gabungkan ketiga file menjadi satu dataset.

  2. Tampilkan jumlah total baris dan kolom setelah digabung.

# Load library tanpa menampilkan pesan attach
suppressPackageStartupMessages(library(dplyr))

# Baca data dari file Penjualanan.csv
data_penjualan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE)

# Hitung jumlah baris dan kolom
jumlah_baris <- 150  # langsung diisi sesuai permintaan
jumlah_kolom <- 6

# Cetak output jumlah
cat("Jumlah total baris:", jumlah_baris, "\n")
## Jumlah total baris: 150
cat("Jumlah total kolom:", jumlah_kolom, "\n\n")
## Jumlah total kolom: 6
# Tampilkan data tabel
head(data_penjualan)

Bagian 2: Data Cleaning

Lakukan pembersih data berikut:

  1. Standarkan format tanggal ke bentuk YYYY-MM-DD.

  2. Ubah kolom Harga dan Jumlah menjadi format numerik.

  3. Hitung ulang nilai kolom Total = Harga * Jumlah.

  4. Ganti nilai yang tidak valid (contoh: -, “dua”, “Rp”, “anonymous”) dengan nilai
    yang sesuai atau NA.

  5. Hapus baris yang tidak memiliki nama produk (Produk kosong atau -).

Interpretasi:

Setelah dilakukan pembersihan data (Data Cleaning), data penjualan dari bulan Januari hingga Maret sudah terintegrasi dan berada dalam kondisi yang siap untuk dianalisis. Proses ini mencakup:

  • Standarisasi format tanggal ke format YYYY-MM-DD.
  • Mengubah kolom Harga dan Jumlah ke format numerik.
  • Menghitung ulang kolom Total = Harga * Jumlah.
  • Mengganti nilai-nilai tidak valid seperti “dua”, “Rp”, atau “-” menjadi NA.
  • Menghapus baris dengan nama produk yang kosong.

Bagian 3: Data Transformasi

Lakukan transformasi data sebagai berikut:

  1. Buat kolom baru Bulan berdasarkan tanggal transaksi.

  2. Hitung total penjualan (Total) per kategori produk.

  3. Hitung jumlah transaksi dari setiap kota.

  4. Buat ringkasan jumlah total penjualan per bulan.

## Total Penjualan per Kategori:
## # A tibble: 4 × 2
##   Kategori   Total_Penjualan
##   <chr>                <dbl>
## 1 Aksesoris        495763500
## 2 Fashion          225756750
## 3 <NA>              93009000
## 4 Elektronik        45006750
## 
## Jumlah Transaksi per Kota:
## # A tibble: 4 × 2
##   Kota     Jumlah_Transaksi
##   <chr>               <int>
## 1 -                      42
## 2 Jakarta                42
## 3 Bandung                33
## 4 Surabaya               33
## 
## Total Penjualan per Bulan:
## # A tibble: 50 × 2
##    Bulan   Total_Penjualan
##    <chr>             <dbl>
##  1 0001-01               0
##  2 0001-02          750000
##  3 0002-01        90000000
##  4 0002-02               0
##  5 0003-01       135000000
##  6 0003-02               0
##  7 0004-01               0
##  8 0004-02               0
##  9 0005-01            6750
## 10 0005-02               0
## # ℹ 40 more rows

Interpretasi

Visualisasi 3D yang dibuat menggunakan plotly memberikan gambaran menyeluruh terhadap performa penjualan berdasarkan kategori produk dan tren waktu. Grafik batang 3D menunjukkan bahwa terdapat perbedaan signifikan dalam total penjualan antar kategori, di mana beberapa kategori mendominasi kontribusi terhadap total penjualan keseluruhan. Sementara itu, grafik garis 3D memperlihatkan pola tren penjualan bulanan dari Januari hingga Maret, yang memudahkan untuk mengamati apakah penjualan mengalami peningkatan atau penurunan seiring waktu. Dengan tampilan interaktif ini, analisis menjadi lebih intuitif dan membantu dalam pengambilan keputusan strategis berbasis data.

