UTS Pemrograman Data Science

Data Science Programming

1 1. Operasi dan Tipe Data Dasar

# a. Menerima dua bilangan dari pengguna
A <- as.integer(readline(prompt = "Masukkan bilangan pertama (int): "))
## Masukkan bilangan pertama (int):
B <- as.integer(readline(prompt = "Masukkan bilangan kedua (int): "))
## Masukkan bilangan kedua (int):
# b. Menghitung hasil operasi
penjumlahan <- A + B
perkalian <- A * B
pembagian <- A/B
pangkat <- A ^ B

# c. Menampilkan hasil dan tipe datanya
cat("\nHasil Operasi:\n")
## 
## Hasil Operasi:
cat("Penjumlahan:", penjumlahan, "(tipe:", typeof(penjumlahan), ")\n")
## Penjumlahan: NA (tipe: integer )
cat("Perkalian:", perkalian, "(tipe:", typeof(perkalian), ")\n")
## Perkalian: NA (tipe: integer )
cat("Pembagian:", pembagian, "(tipe:", if (is.numeric(pembagian)) typeof(pembagian) else typeof(as.character(pembagian)), ")\n")
## Pembagian: NA (tipe: double )
cat("Pangkat:", pangkat, "(tipe:", typeof(pangkat), ")\n")
## Pangkat: NA (tipe: double )

2 2. Struktur Kendali (Control Flow)

# Input nilai
nilai <- as.integer(readline(prompt = "Masukkan nilai ujian (0–100): "))
## Masukkan nilai ujian (0–100):
# Menentukan keterangan nilai
if (!is.na(nilai)) {
  if (nilai >= 0 && nilai < 60) {
    keterangan <- "Perlu Perbaikan"
  } else if (nilai <= 69) {
    keterangan <- "Cukup"
  } else if (nilai <= 84) {
    keterangan <- "Baik"
  } else if (nilai <= 100) {
    keterangan <- "Sangat Baik"
  } else {
    keterangan <- "Nilai tidak valid (di luar 0–100)"
  }
} else {
  keterangan <- "Input tidak valid (bukan angka)"
}

# Tampilkan hasil
cat("Nilai Anda:", nilai, "\n")
## Nilai Anda: NA
cat("Keterangan:", keterangan, "\n")
## Keterangan: Input tidak valid (bukan angka)

3 3. Fungsi dan Perulangan

# a. Menerima input integer n
if (interactive()) {
  n <- as.integer(readline(prompt = "Masukkan bilangan bulat n: "))
} else {
  n <- 40  # Nilai default saat proses knit
}

# b. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1 hingga n
cat(sprintf("Semua bilangan genap kelipatan 4 dari 1 hingga %d:\n", n))
## Semua bilangan genap kelipatan 4 dari 1 hingga 40:
for (i in seq(4, n, by = 4)) {
  if (i + 4 <= n) {
    cat(i, ", ", sep = "")
  } else {
    cat(i, "\n")
  }
}
## 4, 8, 12, 16, 20, 24, 28, 32, 36, 40

4 4. Studi Kasus

Bagian 1 Data Collection

library(readr)
## Warning: package 'readr' was built under R version 4.4.3
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Mengunggah file CSV
januari_df <- read_csv("Januari.csv")
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
februari_df <- read_csv("Februari.csv")
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
maret_df <- read_csv("Maret.csv")
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Gabungkan ketiga data menjadi satu dataset
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# Tampilkan jumlah total baris dan kolom setelah digabung
jumlah_baris_kolom <- dim(gabungan_df)
print(jumlah_baris_kolom)
## [1] 150   9
# Tampilkan beberapa baris pertama dari dataset
head(gabungan_df)

Bagian 2 Data Cleaning

library(dplyr)
library(lubridate)
## Warning: package 'lubridate' was built under R version 4.4.3
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(readr)
library(stringr)

# 1. Baca file CSV
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)

# 2. Gabungkan ketiga data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# 3. a. Standarkan format tanggal ke YYYY-MM-DD
gabungan_df$Tanggal <- dmy(gabungan_df$Tanggal)

# 4. b & d. Bersihkan Harga dan Jumlah → hilangkan karakter non-numerik lalu ubah ke numerik
gabungan_df <- gabungan_df %>%
  mutate(
    Harga = str_replace_all(Harga, "[^0-9]", ""),
    Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
    Harga = as.numeric(Harga),
    Jumlah = as.numeric(Jumlah)
  )

# 5. c. Hitung ulang kolom Total
gabungan_df <- gabungan_df %>%
  mutate(Total = Harga * Jumlah)

# 6. e. Hapus baris yang Produk-nya kosong atau "-"
gabungan_df <- gabungan_df %>%
  filter(!is.na(Produk) & Produk != "" & Produk != "-")

# 7. Opsional: Buang baris dengan Harga atau Jumlah kosong (supaya Total valid)
gabungan_df <- gabungan_df %>%
  filter(!is.na(Harga), !is.na(Jumlah), !is.na(Total))

# 8. Tampilkan hasil bersih
head(gabungan_df)

Bagian 3 Data Transformation

library(dplyr)
library(lubridate)
library(readr)
library(stringr)

# 1. Baca data
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)

# 2. Gabungkan data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# 3. Bersihkan kolom Harga dan Jumlah
gabungan_df <- gabungan_df %>%
  mutate(
    Tanggal = dmy(Tanggal),
    Harga = str_replace_all(Harga, "[^0-9]", ""),
    Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
    Harga = as.numeric(Harga),
    Jumlah = as.numeric(Jumlah),
    Total = Harga * Jumlah
  )

# 4. Filter data valid (tanpa NA dan tanpa 0)
gabungan_df <- gabungan_df %>%
  filter(
    !is.na(Tanggal),
    !is.na(Produk), Produk != "", Produk != "-",
    !is.na(Harga), Harga > 0,
    !is.na(Jumlah), Jumlah > 0,
    !is.na(Total), Total > 0
  )

# 5. Tambah kolom Bulan
gabungan_df <- gabungan_df %>%
  mutate(Bulan = format(Tanggal, "%Y-%m"))

# 6. Analisis

# a. Total penjualan per kategori produk
total_per_kategori <- gabungan_df %>%
  group_by(Produk) %>%
  summarise(Total_Penjualan = sum(Total)) %>%
  filter(Total_Penjualan > 0)

# b. Jumlah transaksi per kota
jumlah_transaksi_per_kota <- gabungan_df %>%
  group_by(Kota) %>%
  summarise(Jumlah_Transaksi = n()) %>%
  filter(Jumlah_Transaksi > 0)

# c. Ringkasan total penjualan per bulan
ringkasan_bulanan <- gabungan_df %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan_Bulanan = sum(Total)) %>%
  filter(Total_Penjualan_Bulanan > 0)

# 7. Tampilkan hasil
cat("\n=== Total Penjualan per Kategori Produk ===\n")
## 
## === Total Penjualan per Kategori Produk ===
print(total_per_kategori)
## # A tibble: 5 × 2
##   Produk        Total_Penjualan
##   <chr>                   <dbl>
## 1 Kemeja              302200000
## 2 Laptop A            163150000
## 3 Sepatu 'Nike'       111900000
## 4 Smartphone X        114000000
## 5 Tas Branded         239950000
cat("\n=== Jumlah Transaksi per Kota ===\n")
## 
## === Jumlah Transaksi per Kota ===
print(jumlah_transaksi_per_kota)
## # A tibble: 4 × 2
##   Kota     Jumlah_Transaksi
##   <chr>               <int>
## 1 -                      19
## 2 Bandung                22
## 3 Jakarta                18
## 4 Surabaya               20
cat("\n=== Ringkasan Total Penjualan per Bulan ===\n")
## 
## === Ringkasan Total Penjualan per Bulan ===
print(ringkasan_bulanan)
## # A tibble: 4 × 2
##   Bulan   Total_Penjualan_Bulanan
##   <chr>                     <dbl>
## 1 2024-01               211650000
## 2 2024-02               311200000
## 3 2024-03               350250000
## 4 2024-04                58100000
