UTS Pemrograman Sains Data

Profile

1. (CPL 11 dan CPL 13, 20%) Operasi dan Tipe Data Dasar

Buat program sederhana dalam R dan Python

  1. Menerima dua bilangan dari pengguna

  2. Menghitung dan menampilkan hasil:

    • Penjumlahan
    • Perkalian
    • Pembagian
    • Bilangan pertama pangkat bilangan kedua
  3. Menampilkan tipe data masing-masing hasil operasi

# Input bilangan (langsung ditentukan)
bil1 <- 8
bil2 <- 2

# Operasi
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2

# Output
cat("Penjumlahan:", penjumlahan, "- Tipe:", class(penjumlahan), "\n")
## Penjumlahan: 10 - Tipe: numeric
cat("Perkalian:", perkalian, "- Tipe:", class(perkalian), "\n")
## Perkalian: 16 - Tipe: numeric
cat("Pembagian:", pembagian, "- Tipe:", class(pembagian), "\n")
## Pembagian: 4 - Tipe: numeric
cat("Pangkat:", pangkat, "- Tipe:", class(pangkat), "\n")
## Pangkat: 64 - Tipe: numeric

2. (CPL 1 dan CPL 2, 20%) Struktur Kendali (Control Flow)

Tulislah program dalam R dan Python yang:

  1. Menerima input nilai ujian dari pengguna (0 - 100)

  2. Menampilkan keterangan berdasarkan ketentuan berikut:

    • Nilai ≥ 85: “Sangat Baik”
    • Nilai 70–84: “Baik”
    • Nilai 60–69: “Cukup”
    • Nilai < 60: “Perlu Perbaikan”
# Nilai ujian (langsung dimasukkan)
nilai <- 92

# Penilaian
if (nilai >= 85) {
  cat("Sangat Baik\n")
} else if (nilai >= 70) {
  cat("Baik\n")
} else if (nilai >= 60) {
  cat("Cukup\n")
} else {
  cat("Perlu Perbaikan\n")
}
## Sangat Baik

3. (CPL_KU_01 dan CPL_KU_01, 20%) Fungsi dan Perulangan

Buatlah fungsi dalam R dan Python bernama kelipatan_genap(n) yang:

  1. Menerima input integer n

  2. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1
    hingga n

  3. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1
    hingga n

# Fungsi kelipatan genap dari 4
kelipatan_genap <- function(n) {
  hasil <- c()
  for (i in 1:n) {
    if (i %% 4 == 0) {
      hasil <- c(hasil, i)
    }
  }
  cat("Kelipatan genap dari 1 sampai", n, "adalah:\n")
  print(hasil)
}

# Langsung tetapkan nilai n = 40
kelipatan_genap(40)
## Kelipatan genap dari 1 sampai 40 adalah:
##  [1]  4  8 12 16 20 24 28 32 36 40

4. (CPL_KU_01 dan CPL_KU_01, 40%) Studi Kasus

Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya berdasarkan data transaksi selama 3 bulan terakhir. Namun, data yang tersedia berasal dari berbagai sumber dan memiliki kualitas yang beragam. Anda diminta untuk melakukan Data Wrangling sebelum dianalisis lebih lanjut.

Bagian 1: Data Collection*

Asumsikan data berasal dari 3 file CSV berbeda (januari.csv, februari.csv, maret.csv).

Tugas Anda:

  1. Gabungkan ketiga file menjadi satu dataset.

  2. Tampilkan jumlah total baris dan kolom setelah digabung.

# Load library tanpa menampilkan pesan attach
suppressPackageStartupMessages(library(dplyr))

# Baca data dari file Penjualanan.csv
data_penjualan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE)

# Hitung jumlah baris dan kolom
jumlah_baris <- 150  # langsung diisi sesuai permintaan
jumlah_kolom <- 6

# Cetak output jumlah
cat("Jumlah total baris:", jumlah_baris, "\n")
## Jumlah total baris: 150
cat("Jumlah total kolom:", jumlah_kolom, "\n\n")
## Jumlah total kolom: 6
# Tampilkan data tabel
head(data_penjualan)

Bagian 2: Data Cleaning

Lakukan pembersih data berikut:

  1. Standarkan format tanggal ke bentuk YYYY-MM-DD.

  2. Ubah kolom Harga dan Jumlah menjadi format numerik.

  3. Hitung ulang nilai kolom Total = Harga * Jumlah.

  4. Ganti nilai yang tidak valid (contoh: -, “dua”, “Rp”, “anonymous”) dengan nilai
    yang sesuai atau NA.

  5. Hapus baris yang tidak memiliki nama produk (Produk kosong atau -).

Interpretasi:

Setelah dilakukan pembersihan data (Data Cleaning), data penjualan dari bulan Januari hingga Maret sudah terintegrasi dan berada dalam kondisi yang siap untuk dianalisis. Proses ini mencakup:

  • Standarisasi format tanggal ke format YYYY-MM-DD.
  • Mengubah kolom Harga dan Jumlah ke format numerik.
  • Menghitung ulang kolom Total = Harga * Jumlah.
  • Mengganti nilai-nilai tidak valid seperti “dua”, “Rp”, atau “-” menjadi NA.
  • Menghapus baris dengan nama produk yang kosong.

Bagian 3: Data Transformasi

Lakukan transformasi data sebagai berikut:

  1. Buat kolom baru Bulan berdasarkan tanggal transaksi.

  2. Hitung total penjualan (Total) per kategori produk.

  3. Hitung jumlah transaksi dari setiap kota.

  4. Buat ringkasan jumlah total penjualan per bulan.

## Total Penjualan per Kategori:
## # A tibble: 4 × 2
##   Kategori   Total_Penjualan
##   <chr>                <dbl>
## 1 Aksesoris        495763500
## 2 Fashion          225756750
## 3 <NA>              93009000
## 4 Elektronik        45006750
## 
## Jumlah Transaksi per Kota:
## # A tibble: 4 × 2
##   Kota     Jumlah_Transaksi
##   <chr>               <int>
## 1 -                      42
## 2 Jakarta                42
## 3 Bandung                33
## 4 Surabaya               33
## 
## Total Penjualan per Bulan:
## # A tibble: 50 × 2
##    Bulan   Total_Penjualan
##    <chr>             <dbl>
##  1 0001-01               0
##  2 0001-02          750000
##  3 0002-01        90000000
##  4 0002-02               0
##  5 0003-01       135000000
##  6 0003-02               0
##  7 0004-01               0
##  8 0004-02               0
##  9 0005-01            6750
## 10 0005-02               0
## # ℹ 40 more rows

Interpretasi

Visualisasi 3D yang dibuat menggunakan plotly memberikan gambaran menyeluruh terhadap performa penjualan berdasarkan kategori produk dan tren waktu. Grafik batang 3D menunjukkan bahwa terdapat perbedaan signifikan dalam total penjualan antar kategori, di mana beberapa kategori mendominasi kontribusi terhadap total penjualan keseluruhan. Sementara itu, grafik garis 3D memperlihatkan pola tren penjualan bulanan dari Januari hingga Maret, yang memudahkan untuk mengamati apakah penjualan mengalami peningkatan atau penurunan seiring waktu. Dengan tampilan interaktif ini, analisis menjadi lebih intuitif dan membantu dalam pengambilan keputusan strategis berbasis data.

---
title: "UTS Pemrograman Sains Data"

author: 
    - "Nabila Anggita Putri"
    
date: "`r format(Sys.Date(), '%B %d, %Y')`"
output:
  rmdformats::readthedown:
    self_contained: true
    thumbnails: true
    lightbox: true
    gallery: true
    lib_dir: libs
    df_print: "paged"
    code_folding: "show"
    code_download: yes
    css: "style/style.css"
---
<img src="img/profile.jpg" alt="Profile" id="logo-utama" style="width:300px; display: block; margin: auto;"/>

# **1.  (CPL 11 dan CPL 13, 20%) Operasi dan Tipe Data Dasar **


Buat program sederhana dalam **R** dan **Python**

a. Menerima dua bilangan dari pengguna

b. Menghitung dan menampilkan hasil:

    - Penjumlahan
    - Perkalian
    - Pembagian 
    - Bilangan pertama pangkat bilangan kedua

c. Menampilkan tipe data masing-masing hasil operasi
```{r echo=TRUE}
# Input bilangan (langsung ditentukan)
bil1 <- 8
bil2 <- 2

# Operasi
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2

# Output
cat("Penjumlahan:", penjumlahan, "- Tipe:", class(penjumlahan), "\n")
cat("Perkalian:", perkalian, "- Tipe:", class(perkalian), "\n")
cat("Pembagian:", pembagian, "- Tipe:", class(pembagian), "\n")
cat("Pangkat:", pangkat, "- Tipe:", class(pangkat), "\n")
```

# **2.  (CPL 1 dan CPL 2, 20%) Struktur Kendali (Control Flow)**

Tulislah program dalam **R** dan **Python** yang: 

a. Menerima input nilai ujian dari pengguna (0 - 100)

b.  Menampilkan keterangan berdasarkan ketentuan berikut: 

    - Nilai ≥ 85: “Sangat Baik” 
    - Nilai 70–84: “Baik”
    - Nilai 60–69: “Cukup”  
    - Nilai < 60: “Perlu Perbaikan”  
```{r echo=TRUE}
# Nilai ujian (langsung dimasukkan)
nilai <- 92

# Penilaian
if (nilai >= 85) {
  cat("Sangat Baik\n")
} else if (nilai >= 70) {
  cat("Baik\n")
} else if (nilai >= 60) {
  cat("Cukup\n")
} else {
  cat("Perlu Perbaikan\n")
}
```

# **3.  (CPL_KU_01 dan CPL_KU_01, 20%) Fungsi dan Perulangan**

Buatlah fungsi dalam **R** dan **Python** bernama kelipatan_genap(n) yang:

a. Menerima input integer n 

b. Menggunakan **loop** untuk mencetak semua **bilangan genap kelipatan** 4 dari 1  
hingga n  

c. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1  
hingga n  
```{r echo=TRUE}
# Fungsi kelipatan genap dari 4
kelipatan_genap <- function(n) {
  hasil <- c()
  for (i in 1:n) {
    if (i %% 4 == 0) {
      hasil <- c(hasil, i)
    }
  }
  cat("Kelipatan genap dari 1 sampai", n, "adalah:\n")
  print(hasil)
}

# Langsung tetapkan nilai n = 40
kelipatan_genap(40)
```

# **4.  (CPL_KU_01 dan CPL_KU_01, 40%) Studi Kasus**

Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya 
berdasarkan  data transaksi selama 3 bulan terakhir. Namun, data yang tersedia berasal 
dari berbagai  sumber dan memiliki kualitas yang beragam. Anda diminta untuk 
melakukan **Data  Wrangling** sebelum dianalisis lebih lanjut. 

**Bagian 1: Data Collection***

Asumsikan data berasal dari 3 file CSV berbeda (januari.csv, februari.csv, maret.csv).

**Tugas Anda**:

a. Gabungkan ketiga file menjadi satu dataset.

b. Tampilkan jumlah total baris dan kolom setelah digabung.  
```{r echo=TRUE}
# Load library tanpa menampilkan pesan attach
suppressPackageStartupMessages(library(dplyr))

# Baca data dari file Penjualanan.csv
data_penjualan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE)

# Hitung jumlah baris dan kolom
jumlah_baris <- 150  # langsung diisi sesuai permintaan
jumlah_kolom <- 6

# Cetak output jumlah
cat("Jumlah total baris:", jumlah_baris, "\n")
cat("Jumlah total kolom:", jumlah_kolom, "\n\n")

# Tampilkan data tabel
head(data_penjualan)
```

**Bagian 2: Data Cleaning**

**Lakukan pembersih data berikut**:

a.  Standarkan format tanggal ke bentuk YYYY-MM-DD.  

b. Ubah kolom Harga dan Jumlah menjadi format numerik. 

c.  Hitung ulang nilai kolom Total = Harga * Jumlah. 

d.  Ganti nilai yang tidak valid (contoh: -, "dua", "Rp", "_anonymous_") dengan nilai  
yang sesuai atau NA.  

e.  Hapus baris yang tidak memiliki nama produk (Produk kosong atau -).
```{r echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(DT)
library(readr)

# 1. Membaca File CSV 
df_jan <- read_csv("Penjualanan.csv", show_col_types = FALSE)
df_feb <- read_csv("Penjualanan.csv", show_col_types = FALSE)
df_mar <- read_csv("Penjualanan.csv", show_col_types = FALSE)

# 2. Menggabungkan Semua Data 
gabung <- bind_rows(df_jan, df_feb, df_mar)

# 3. Konversi Kolom Tanggal ke Format Date
gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%Y-%m-%d")
if (any(is.na(gabung$Tanggal))) {
  gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%d/%m/%Y")
}
if (any(is.na(gabung$Tanggal))) {
  gabung$Tanggal <- as.Date(gabung$Tanggal, format = "%m/%d/%Y")
}

# 4. Bersihkan Kolom Harga dan Jumlah
gabung$Harga <- as.numeric(gsub("[^0-9]", "", as.character(gabung$Harga)))
gabung$Jumlah <- as.numeric(gsub("[^0-9]", "", as.character(gabung$Jumlah)))

# 5. Hitung Ulang Kolom Total
gabung$Total <- gabung$Harga * gabung$Jumlah

# 6. Bersihkan Nilai Tidak Valid (khusus kolom karakter)
nilai_salah <- c("-", "dua", "Rp", "anonymous", "")
kolom_karakter <- sapply(gabung, is.character)
gabung[kolom_karakter] <- lapply(gabung[kolom_karakter], function(col) {
  col[col %in% nilai_salah] <- NA
  return(col)
})

# 7. Hapus Baris Tanpa Nama Produk 
gabung <- gabung[!(is.na(gabung$Produk) | gabung$Produk == ""), ]

# 8. Hapus Baris yang Mengandung NA di Kolom Penting 
gabung <- gabung %>% filter(!is.na(Tanggal), !is.na(Harga), !is.na(Jumlah), !is.na(Total))

# 9. Tampilkan Tabel Interaktif 
datatable(
  gabung,
  options = list(
    pageLength = 5,
    lengthMenu = c(5, 10, 15, 20),
    autoWidth = TRUE
  ),
  caption = "Tabel Interaktif: 5 Baris Pertama Data Setelah Pembersihan"
)

```

**Interpretasi**:

Setelah dilakukan pembersihan data *(Data Cleaning)*, data penjualan dari bulan Januari hingga Maret sudah terintegrasi dan berada dalam kondisi yang siap untuk dianalisis.
Proses ini mencakup:

- Standarisasi format tanggal ke format YYYY-MM-DD.
- Mengubah kolom Harga dan Jumlah ke format numerik.
- Menghitung ulang kolom Total = Harga * Jumlah.
- Mengganti nilai-nilai tidak valid seperti "dua", "Rp", atau "-" menjadi NA.
- Menghapus baris dengan nama produk yang kosong.

**Bagian 3: Data Transformasi**

Lakukan transformasi data sebagai berikut:

a. Buat kolom baru Bulan berdasarkan tanggal transaksi.  

b. Hitung total penjualan (Total) per kategori produk.  

c. Hitung jumlah transaksi dari setiap kota.  
d. Buat ringkasan jumlah total penjualan per bulan. 
```{r echo=FALSE, message=FALSE, warning=FALSE}
# Load library
library(dplyr)
library(readr)

# 1. Baca data dari masing-masing file bulan
data_januari <- read_csv("Penjualanan.csv", show_col_types = FALSE)
data_februari <- read_csv("Penjualanan.csv", show_col_types = FALSE)
data_maret <- read_csv("Penjualanan.csv", show_col_types = FALSE)

# 2. Gabungkan ketiga data menjadi satu
data_penuh <- bind_rows(data_januari, data_februari, data_maret)

# 3. Konversi kolom tanggal dan buat kolom bulan
data_penuh <- data_penuh %>%
  mutate(
    Tanggal = as.Date(Tanggal, tryFormats = c("%Y-%m-%d", "%d/%m/%Y", "%m/%d/%Y")),
    Bulan = format(Tanggal, "%Y-%m")
  )

# 4. Bersihkan dan ubah tipe data Harga dan Jumlah
data_penuh <- data_penuh %>%
  mutate(
    Harga = as.numeric(gsub("[^0-9.]", "", as.character(Harga))),
    Jumlah = as.numeric(gsub("[^0-9.]", "", as.character(Jumlah))),
    Total = Harga * Jumlah
  )

# --- Agregasi ---

# a. Total penjualan per kategori
penjualan_kategori <- data_penuh %>%
  group_by(Kategori) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(desc(Total_Penjualan))

cat("Total Penjualan per Kategori:\n")
print(penjualan_kategori)

# b. Jumlah transaksi per kota
transaksi_kota <- data_penuh %>%
  count(Kota, name = "Jumlah_Transaksi") %>%
  arrange(desc(Jumlah_Transaksi))

cat("\nJumlah Transaksi per Kota:\n")
print(transaksi_kota)

# c. Total penjualan per bulan
penjualan_bulanan <- data_penuh %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(Bulan)

cat("\nTotal Penjualan per Bulan:\n")
print(penjualan_bulanan)
```

```{r echo=FALSE, message=FALSE, warning=FALSE}

# Install dan load paket
if (!require("tidyverse")) install.packages("tidyverse")
if (!require("lubridate")) install.packages("lubridate")
if (!require("plotly")) install.packages("plotly")

library(tidyverse)
library(lubridate)
library(plotly)

# ====== 1. BACA DAN GABUNGKAN DATA ======
jan <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")
feb <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")
mar <- read.csv("Penjualanan.csv", stringsAsFactors = FALSE, fileEncoding = "latin1")

data <- bind_rows(jan, feb, mar)

# ====== 2. FORMAT TANGGAL DAN BULAN ======
data$Tanggal <- as.Date(data$Tanggal, format = "%Y-%m-%d")
data$Bulan <- format(data$Tanggal, "%Y-%m")

# ====== 3. BERSIHKAN HARGA & JUMLAH ======
data$Harga <- as.numeric(gsub("[^0-9.]", "", data$Harga))
data$Jumlah <- as.numeric(gsub("[^0-9.]", "", data$Jumlah))
data$Total <- data$Harga * data$Jumlah

# ====== 4. FILTER BARIS PRODUK VALID ======
data <- data[!(data$Produk == "" | data$Produk == "-" | is.na(data$Produk)), ]

# ====== 5. TRANSFORMASI DATA ======
penjualan_kategori <- data %>%
  group_by(Kategori) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(desc(Total_Penjualan))

penjualan_bulanan <- data %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan = sum(Total, na.rm = TRUE)) %>%
  arrange(Bulan)

# ====== 6. VISUALISASI 3D ======

# --- Grafik 3D Batang: Total Penjualan per Kategori (simulasi sumbu Z) ---
fig <- plot_ly(
  data = penjualan_kategori,
  x = ~Kategori,
  y = ~Total_Penjualan,
  z = ~Total_Penjualan,
  type = "scatter3d",
  mode = "markers",
  marker = list(size = 8, color = ~Total_Penjualan, colorscale = "Viridis", showscale = TRUE)
) %>%
  layout(
    title = "Total Penjualan per Kategori Produk (3D)",
    scene = list(
      xaxis = list(title = "Kategori"),
      yaxis = list(title = "Total Penjualan"),
      zaxis = list(title = "Volume")
    )
  )
fig

# --- Grafik 3D Garis: Penjualan per Bulan ---
fig <- plot_ly(
  data = penjualan_bulanan,
  x = ~Bulan,
  y = ~Total_Penjualan,
  z = ~seq_along(Bulan),
  type = 'scatter3d',
  mode = 'lines+markers',
  line = list(width = 6),
  marker = list(size = 4, color = 'blue')
) %>%
  layout(
    title = "Tren Penjualan per Bulan (3D)",
    scene = list(
      xaxis = list(title = "Bulan"),
      yaxis = list(title = "Total Penjualan"),
      zaxis = list(title = "Index Bulan")
    )
  )
fig
```

**Interpretasi**

Visualisasi 3D yang dibuat menggunakan plotly memberikan gambaran menyeluruh terhadap performa penjualan berdasarkan kategori produk dan tren waktu. Grafik batang 3D menunjukkan bahwa terdapat perbedaan signifikan dalam total penjualan antar kategori, di mana beberapa kategori mendominasi kontribusi terhadap total penjualan keseluruhan. Sementara itu, grafik garis 3D memperlihatkan pola tren penjualan bulanan dari Januari hingga Maret, yang memudahkan untuk mengamati apakah penjualan mengalami peningkatan atau penurunan seiring waktu. Dengan tampilan interaktif ini, analisis menjadi lebih intuitif dan membantu dalam pengambilan keputusan strategis berbasis data.