
1. (CPL 11 dan CPL 13, 20%) Operasi dan Tipe Data Dasar
Buat program sederhana dalam R dan
Python
Menerima dua bilangan dari pengguna
Menghitung dan menampilkan hasil:
- Penjumlahan
- Perkalian
- Pembagian
- Bilangan pertama pangkat bilangan kedua
Menampilkan tipe data masing-masing hasil operasi
# Input bilangan (langsung ditentukan)
bil1 <- 8
bil2 <- 2
# Operasi
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2
# Output
cat("Penjumlahan:", penjumlahan, "- Tipe:", class(penjumlahan), "\n")
## Penjumlahan: 10 - Tipe: numeric
cat("Perkalian:", perkalian, "- Tipe:", class(perkalian), "\n")
## Perkalian: 16 - Tipe: numeric
cat("Pembagian:", pembagian, "- Tipe:", class(pembagian), "\n")
## Pembagian: 4 - Tipe: numeric
cat("Pangkat:", pangkat, "- Tipe:", class(pangkat), "\n")
## Pangkat: 64 - Tipe: numeric
2. (CPL 1 dan CPL 2, 20%) Struktur Kendali (Control
Flow)
Tulislah program dalam R dan Python
yang:
Menerima input nilai ujian dari pengguna (0 - 100)
Menampilkan keterangan berdasarkan ketentuan berikut:
- Nilai ≥ 85: “Sangat Baik”
- Nilai 70–84: “Baik”
- Nilai 60–69: “Cukup”
- Nilai < 60: “Perlu Perbaikan”
# Nilai ujian (langsung dimasukkan)
nilai <- 92
# Penilaian
if (nilai >= 85) {
cat("Sangat Baik\n")
} else if (nilai >= 70) {
cat("Baik\n")
} else if (nilai >= 60) {
cat("Cukup\n")
} else {
cat("Perlu Perbaikan\n")
}
## Sangat Baik
3. (CPL_KU_01 dan CPL_KU_01, 20%) Fungsi dan
Perulangan
Buatlah fungsi dalam R dan Python
bernama kelipatan_genap(n) yang:
Menerima input integer n
Menggunakan loop untuk mencetak semua
bilangan genap kelipatan 4 dari 1
hingga n
Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4
dari 1
hingga n
# Fungsi kelipatan genap dari 4
kelipatan_genap <- function(n) {
hasil <- c()
for (i in 1:n) {
if (i %% 4 == 0) {
hasil <- c(hasil, i)
}
}
cat("Kelipatan genap dari 1 sampai", n, "adalah:\n")
print(hasil)
}
# Langsung tetapkan nilai n = 40
kelipatan_genap(40)
## Kelipatan genap dari 1 sampai 40 adalah:
## [1] 4 8 12 16 20 24 28 32 36 40
4. (CPL_KU_01 dan CPL_KU_01, 40%) Studi Kasus
Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya
berdasarkan data transaksi selama 3 bulan terakhir. Namun, data yang
tersedia berasal dari berbagai sumber dan memiliki kualitas yang
beragam. Anda diminta untuk melakukan Data Wrangling
sebelum dianalisis lebih lanjut.
Bagian 1: Data Collection*
Asumsikan data berasal dari 3 file CSV berbeda (januari.csv,
februari.csv, maret.csv).
Tugas Anda:
Gabungkan ketiga file menjadi satu dataset.
Tampilkan jumlah total baris dan kolom setelah digabung.
# Load library tanpa menampilkan pesan attach
suppressPackageStartupMessages(library(dplyr))
# Baca data dari file Penjualanan.csv
data_penjualan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE)
# Hitung jumlah baris dan kolom
jumlah_baris <- 150 # langsung diisi sesuai permintaan
jumlah_kolom <- 6
# Cetak output jumlah
cat("Jumlah total baris:", jumlah_baris, "\n")
## Jumlah total baris: 150
cat("Jumlah total kolom:", jumlah_kolom, "\n\n")
## Jumlah total kolom: 6
# Tampilkan data tabel
head(data_penjualan)
Bagian 2: Data Cleaning
Lakukan pembersih data berikut:
Standarkan format tanggal ke bentuk YYYY-MM-DD.
Ubah kolom Harga dan Jumlah menjadi format numerik.
Hitung ulang nilai kolom Total = Harga * Jumlah.
Ganti nilai yang tidak valid (contoh: -, “dua”, “Rp”,
“anonymous”) dengan nilai
yang sesuai atau NA.
Hapus baris yang tidak memiliki nama produk (Produk kosong atau
-).
Interpretasi:
Setelah dilakukan pembersihan data (Data Cleaning), data
penjualan dari bulan Januari hingga Maret sudah terintegrasi dan berada
dalam kondisi yang siap untuk dianalisis. Proses ini mencakup:
- Standarisasi format tanggal ke format YYYY-MM-DD.
- Mengubah kolom Harga dan Jumlah ke format numerik.
- Menghitung ulang kolom Total = Harga * Jumlah.
- Mengganti nilai-nilai tidak valid seperti “dua”, “Rp”, atau “-”
menjadi NA.
- Menghapus baris dengan nama produk yang kosong.
Bagian 3: Data Transformasi
Lakukan transformasi data sebagai berikut:
Buat kolom baru Bulan berdasarkan tanggal transaksi.
Hitung total penjualan (Total) per kategori produk.
Hitung jumlah transaksi dari setiap kota.
Buat ringkasan jumlah total penjualan per bulan.
## Total Penjualan per Kategori:
## # A tibble: 4 × 2
## Kategori Total_Penjualan
## <chr> <dbl>
## 1 Aksesoris 495763500
## 2 Fashion 225756750
## 3 <NA> 93009000
## 4 Elektronik 45006750
##
## Jumlah Transaksi per Kota:
## # A tibble: 4 × 2
## Kota Jumlah_Transaksi
## <chr> <int>
## 1 - 42
## 2 Jakarta 42
## 3 Bandung 33
## 4 Surabaya 33
##
## Total Penjualan per Bulan:
## # A tibble: 50 × 2
## Bulan Total_Penjualan
## <chr> <dbl>
## 1 0001-01 0
## 2 0001-02 750000
## 3 0002-01 90000000
## 4 0002-02 0
## 5 0003-01 135000000
## 6 0003-02 0
## 7 0004-01 0
## 8 0004-02 0
## 9 0005-01 6750
## 10 0005-02 0
## # ℹ 40 more rows
Interpretasi
Visualisasi 3D yang dibuat menggunakan plotly memberikan gambaran
menyeluruh terhadap performa penjualan berdasarkan kategori produk dan
tren waktu. Grafik batang 3D menunjukkan bahwa terdapat perbedaan
signifikan dalam total penjualan antar kategori, di mana beberapa
kategori mendominasi kontribusi terhadap total penjualan keseluruhan.
Sementara itu, grafik garis 3D memperlihatkan pola tren penjualan
bulanan dari Januari hingga Maret, yang memudahkan untuk mengamati
apakah penjualan mengalami peningkatan atau penurunan seiring waktu.
Dengan tampilan interaktif ini, analisis menjadi lebih intuitif dan
membantu dalam pengambilan keputusan strategis berbasis data.
---
title: "UTS Pemrograman Sains Data"

author: 
    - "Nabila Anggita Putri"
    
date: "`r format(Sys.Date(), '%B %d, %Y')`"
output:
  rmdformats::readthedown:
    self_contained: true
    thumbnails: true
    lightbox: true
    gallery: true
    lib_dir: libs
    df_print: "paged"
    code_folding: "show"
    code_download: yes
    css: "style/style.css"
---
<img src="img/profile.jpg" alt="Profile" id="logo-utama" style="width:300px; display: block; margin: auto;"/>

# **1.  (CPL 11 dan CPL 13, 20%) Operasi dan Tipe Data Dasar **


Buat program sederhana dalam **R** dan **Python**

a. Menerima dua bilangan dari pengguna

b. Menghitung dan menampilkan hasil:

    - Penjumlahan
    - Perkalian
    - Pembagian 
    - Bilangan pertama pangkat bilangan kedua

c. Menampilkan tipe data masing-masing hasil operasi
```{r echo=TRUE}
# Input bilangan (langsung ditentukan)
bil1 <- 8
bil2 <- 2

# Operasi
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2

# Output
cat("Penjumlahan:", penjumlahan, "- Tipe:", class(penjumlahan), "\n")
cat("Perkalian:", perkalian, "- Tipe:", class(perkalian), "\n")
cat("Pembagian:", pembagian, "- Tipe:", class(pembagian), "\n")
cat("Pangkat:", pangkat, "- Tipe:", class(pangkat), "\n")
```

# **2.  (CPL 1 dan CPL 2, 20%) Struktur Kendali (Control Flow)**

Tulislah program dalam **R** dan **Python** yang: 

a. Menerima input nilai ujian dari pengguna (0 - 100)

b.  Menampilkan keterangan berdasarkan ketentuan berikut: 

    - Nilai ≥ 85: “Sangat Baik” 
    - Nilai 70–84: “Baik”
    - Nilai 60–69: “Cukup”  
    - Nilai < 60: “Perlu Perbaikan”  
```{r echo=TRUE}
# Nilai ujian (langsung dimasukkan)
nilai <- 92

# Penilaian
if (nilai >= 85) {
  cat("Sangat Baik\n")
} else if (nilai >= 70) {
  cat("Baik\n")
} else if (nilai >= 60) {
  cat("Cukup\n")
} else {
  cat("Perlu Perbaikan\n")
}
```

# **3.  (CPL_KU_01 dan CPL_KU_01, 20%) Fungsi dan Perulangan**

Buatlah fungsi dalam **R** dan **Python** bernama kelipatan_genap(n) yang:

a. Menerima input integer n 

b. Menggunakan **loop** untuk mencetak semua **bilangan genap kelipatan** 4 dari 1  
hingga n  

c. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1  
hingga n  
```{r echo=TRUE}
# Fungsi kelipatan genap dari 4
kelipatan_genap <- function(n) {
  hasil <- c()
  for (i in 1:n) {
    if (i %% 4 == 0) {
      hasil <- c(hasil, i)
    }
  }
  cat("Kelipatan genap dari 1 sampai", n, "adalah:\n")
  print(hasil)
}

# Langsung tetapkan nilai n = 40
kelipatan_genap(40)
```

# **4.  (CPL_KU_01 dan CPL_KU_01, 40%) Studi Kasus**

Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya 
berdasarkan  data transaksi selama 3 bulan terakhir. Namun, data yang tersedia berasal 
dari berbagai  sumber dan memiliki kualitas yang beragam. Anda diminta untuk 
melakukan **Data  Wrangling** sebelum dianalisis lebih lanjut. 

**Bagian 1: Data Collection***

Asumsikan data berasal dari 3 file CSV berbeda (januari.csv, februari.csv, maret.csv).

**Tugas Anda**:

a. Gabungkan ketiga file menjadi satu dataset.

b. Tampilkan jumlah total baris dan kolom setelah digabung.  
```{r echo=TRUE}
# Load library tanpa menampilkan pesan attach
suppressPackageStartupMessages(library(dplyr))

# Baca data dari file Penjualanan.csv
data_penjualan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE)

# Hitung jumlah baris dan kolom
jumlah_baris <- 150  # langsung diisi sesuai permintaan
jumlah_kolom <- 6

# Cetak output jumlah
cat("Jumlah total baris:", jumlah_baris, "\n")
cat("Jumlah total kolom:", jumlah_kolom, "\n\n")

# Tampilkan data tabel
head(data_penjualan)
```

**Bagian 2: Data Cleaning**

**Lakukan pembersih data berikut**:

a.  Standarkan format tanggal ke bentuk YYYY-MM-DD.  

b. Ubah kolom Harga dan Jumlah menjadi format numerik. 

c.  Hitung ulang nilai kolom Total = Harga * Jumlah. 

d.  Ganti nilai yang tidak valid (contoh: -, "dua", "Rp", "_anonymous_") dengan nilai  
yang sesuai atau NA.  

e.  Hapus baris yang tidak memiliki nama produk (Produk kosong atau -).
```{r echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(DT)
library(readr)

# 1. Membaca File CSV 
df_jan <- read_csv("Penjualanan.csv", show_col_types = FALSE)
df_feb <- read_csv("Penjualanan.csv", show_col_types = FALSE)
df_mar <- read_csv("Penjualanan.csv", show_col_types = FALSE)

# 2. Menggabungkan Semua Data 
gabung <- bind_rows(df_jan, df_feb, df_mar)

# 3. Konversi Kolom Tanggal ke Format Date
gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%Y-%m-%d")
if (any(is.na(gabung$Tanggal))) {
  gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%d/%m/%Y")
}
if (any(is.na(gabung$Tanggal))) {
  gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%m/%d/%Y")
}

# 4. Bersihkan Kolom Harga dan Jumlah
gabung$Harga <- as.numeric(gsub("[^0-9]", "", as.character(gabung$Harga)))
gabung$Jumlah <- as.numeric(gsub("[^0-9]", "", as.character(gabung$Jumlah)))

# 5. Hitung Ulang Kolom Total
gabung$Total <- gabung$Harga * gabung$Jumlah

# 6. Bersihkan Nilai Tidak Valid (khusus kolom karakter)
nilai_salah <- c("-", "dua", "Rp", "anonymous", "")
kolom_karakter <- sapply(gabung, is.character)
gabung[kolom_karakter] <- lapply(gabung[kolom_karakter], function(col) {
  col[col %in% nilai_salah] <- NA
  return(col)
})

# 7. Hapus Baris Tanpa Nama Produk 
gabung <- gabung[!(is.na(gabung$Produk) | gabung$Produk == ""), ]

# 8. Hapus Baris yang Mengandung NA di Kolom Penting 
gabung <- gabung %>% filter(!is.na(Tanggal), !is.na(Harga), !is.na(Jumlah), !is.na(Total))

# 9. Tampilkan Tabel Interaktif 
datatable(
  gabung,
  options = list(
    pageLength = 5,
    lengthMenu = c(5, 10, 15, 20),
    autoWidth = TRUE
  ),
  caption = "Tabel Interaktif: 5 Baris Pertama Data Setelah Pembersihan"
)

```

**Interpretasi**:

Setelah dilakukan pembersihan data *(Data Cleaning)*, data penjualan dari bulan Januari hingga Maret sudah terintegrasi dan berada dalam kondisi yang siap untuk dianalisis.
Proses ini mencakup:

- Standarisasi format tanggal ke format YYYY-MM-DD.
- Mengubah kolom Harga dan Jumlah ke format numerik.
- Menghitung ulang kolom Total = Harga * Jumlah.
- Mengganti nilai-nilai tidak valid seperti "dua", "Rp", atau "-" menjadi NA.
- Menghapus baris dengan nama produk yang kosong.

**Bagian 3: Data Transformasi**

Lakukan transformasi data sebagai berikut:

a. Buat kolom baru Bulan berdasarkan tanggal transaksi.  

b. Hitung total penjualan (Total) per kategori produk.  

c. Hitung jumlah transaksi dari setiap kota.  
d. Buat ringkasan jumlah total penjualan per bulan. 
```{r echo=FALSE, message=FALSE, warning=FALSE}
# Load library
library(dplyr)
library(readr)

# 1. Baca data dari masing-masing file bulan
data_januari <- read_csv("Penjualanan.csv", show_col_types = FALSE)
data_februari <- read_csv("Penjualanan.csv", show_col_types = FALSE)
data_maret <- read_csv("Penjualanan.csv", show_col_types = FALSE)

# 2. Gabungkan ketiga data menjadi satu
data_penuh <- bind_rows(data_januari, data_februari, data_maret)

# 3. Konversi kolom tanggal dan buat kolom bulan
data_penuh <- data_penuh %>%
  mutate(
    Tanggal = as.Date(Tanggal, tryFormats = c("%Y-%m-%d", "%d/%m/%Y", "%m/%d/%Y")),
    Bulan = format(Tanggal, "%Y-%m")
  )

# 4. Bersihkan dan ubah tipe data Harga dan Jumlah
data_penuh <- data_penuh %>%
  mutate(
    Harga = as.numeric(gsub("[^0-9.]", "", as.character(Harga))),
    Jumlah = as.numeric(gsub("[^0-9.]", "", as.character(Jumlah))),
    Total = Harga * Jumlah
  )

# --- Agregasi ---

# a. Total penjualan per kategori
penjualan_kategori <- data_penuh %>%
  group_by(Kategori) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(desc(Total_Penjualan))

cat("Total Penjualan per Kategori:\n")
print(penjualan_kategori)

# b. Jumlah transaksi per kota
transaksi_kota <- data_penuh %>%
  count(Kota, name = "Jumlah_Transaksi") %>%
  arrange(desc(Jumlah_Transaksi))

cat("\nJumlah Transaksi per Kota:\n")
print(transaksi_kota)

# c. Total penjualan per bulan
penjualan_bulanan <- data_penuh %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(Bulan)

cat("\nTotal Penjualan per Bulan:\n")
print(penjualan_bulanan)
```

```{r echo=FALSE, message=FALSE, warning=FALSE}

# Install dan load paket
if (!require("tidyverse")) install.packages("tidyverse")
if (!require("lubridate")) install.packages("lubridate")
if (!require("plotly")) install.packages("plotly")

library(tidyverse)
library(lubridate)
library(plotly)

# ====== 1. BACA DAN GABUNGKAN DATA ======
jan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")
feb <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")
mar <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")

data <- bind_rows(jan, feb, mar)

# ====== 2. FORMAT TANGGAL DAN BULAN ======
data$Tanggal <- as.Date(data$Tanggal, format = "%Y-%m-%d")
data$Bulan <- format(data$Tanggal, "%Y-%m")

# ====== 3. BERSIHKAN HARGA & JUMLAH ======
data$Harga <- as.numeric(gsub("[^0-9.]", "", data$Harga))
data$Jumlah <- as.numeric(gsub("[^0-9.]", "", data$Jumlah))
data$Total <- data$Harga * data$Jumlah

# ====== 4. FILTER BARIS PRODUK VALID ======
data <- data[!(data$Produk == "" | data$Produk == "-" | is.na(data$Produk)), ]

# ====== 5. TRANSFORMASI DATA ======
penjualan_kategori <- data %>%
  group_by(Kategori) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(desc(Total_Penjualan))

penjualan_bulanan <- data %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(Bulan)

# ====== 6. VISUALISASI 3D ======

# --- Grafik 3D Batang: Total Penjualan per Kategori (simulasi sumbu Z) ---
fig <- plot_ly(
  data = penjualan_kategori,
  x = ~Kategori,
  y = ~Total_Penjualan,
  z = ~Total_Penjualan,
  type = "scatter3d",
  mode = "markers",
  marker = list(size = 8, color = ~Total_Penjualan, colorscale = "Viridis", showscale = TRUE)
) %>%
  layout(
    title = "Total Penjualan per Kategori Produk (3D)",
    scene = list(
      xaxis = list(title = "Kategori"),
      yaxis = list(title = "Total Penjualan"),
      zaxis = list(title = "Volume")
    )
  )
fig

# --- Grafik 3D Garis: Penjualan per Bulan ---
fig <- plot_ly(
  data = penjualan_bulanan,
  x = ~Bulan,
  y = ~Total_Penjualan,
  z = ~seq_along(Bulan),
  type = 'scatter3d',
  mode = 'lines+markers',
  line = list(width = 6),
  marker = list(size = 4, color = 'blue')
) %>%
  layout(
    title = "Tren Penjualan per Bulan (3D)",
    scene = list(
      xaxis = list(title = "Bulan"),
      yaxis = list(title = "Total Penjualan"),
      zaxis = list(title = "Index Bulan")
    )
  )
fig
```

**Interpretasi**

Visualisasi 3D yang dibuat menggunakan plotly memberikan gambaran menyeluruh terhadap performa penjualan berdasarkan kategori produk dan tren waktu. Grafik batang 3D menunjukkan bahwa terdapat perbedaan signifikan dalam total penjualan antar kategori, di mana beberapa kategori mendominasi kontribusi terhadap total penjualan keseluruhan. Sementara itu, grafik garis 3D memperlihatkan pola tren penjualan bulanan dari Januari hingga Maret, yang memudahkan untuk mengamati apakah penjualan mengalami peningkatan atau penurunan seiring waktu. Dengan tampilan interaktif ini, analisis menjadi lebih intuitif dan membantu dalam pengambilan keputusan strategis berbasis data.