UTS Pemrograman Data Science
Data Science Programming
1 1. Operasi dan Tipe Data Dasar
# a. Menerima dua bilangan dari pengguna
A <- as.integer(readline(prompt = "Masukkan bilangan pertama (int): "))
## Masukkan bilangan pertama (int):
## Masukkan bilangan kedua (int):
# b. Menghitung hasil operasi
penjumlahan <- A + B
perkalian <- A * B
pembagian <- A/B
pangkat <- A ^ B
# c. Menampilkan hasil dan tipe datanya
cat("\nHasil Operasi:\n")
##
## Hasil Operasi:
## Penjumlahan: NA (tipe: integer )
## Perkalian: NA (tipe: integer )
cat("Pembagian:", pembagian, "(tipe:", if (is.numeric(pembagian)) typeof(pembagian) else typeof(as.character(pembagian)), ")\n")
## Pembagian: NA (tipe: double )
## Pangkat: NA (tipe: double )
2 2. Struktur Kendali (Control Flow)
## Masukkan nilai ujian (0–100):
# Menentukan keterangan nilai
if (!is.na(nilai)) {
if (nilai >= 0 && nilai < 60) {
keterangan <- "Perlu Perbaikan"
} else if (nilai <= 69) {
keterangan <- "Cukup"
} else if (nilai <= 84) {
keterangan <- "Baik"
} else if (nilai <= 100) {
keterangan <- "Sangat Baik"
} else {
keterangan <- "Nilai tidak valid (di luar 0–100)"
}
} else {
keterangan <- "Input tidak valid (bukan angka)"
}
# Tampilkan hasil
cat("Nilai Anda:", nilai, "\n")
## Nilai Anda: NA
## Keterangan: Input tidak valid (bukan angka)
3 3. Fungsi dan Perulangan
# a. Menerima input integer n
if (interactive()) {
n <- as.integer(readline(prompt = "Masukkan bilangan bulat n: "))
} else {
n <- 40 # Nilai default saat proses knit
}
# b. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1 hingga n
cat(sprintf("Semua bilangan genap kelipatan 4 dari 1 hingga %d:\n", n))
## Semua bilangan genap kelipatan 4 dari 1 hingga 40:
## 4, 8, 12, 16, 20, 24, 28, 32, 36, 40
4 4. Studi Kasus
Bagian 1 Data Collection
## Warning: package 'readr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Gabungkan ketiga data menjadi satu dataset
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# Tampilkan jumlah total baris dan kolom setelah digabung
jumlah_baris_kolom <- dim(gabungan_df)
print(jumlah_baris_kolom)
## [1] 150 9
Bagian 2 Data Cleaning
## Warning: package 'lubridate' was built under R version 4.4.3
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
library(readr)
library(stringr)
# 1. Baca file CSV
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)
# 2. Gabungkan ketiga data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# 3. a. Standarkan format tanggal ke YYYY-MM-DD
gabungan_df$Tanggal <- dmy(gabungan_df$Tanggal)
# 4. b & d. Bersihkan Harga dan Jumlah → hilangkan karakter non-numerik lalu ubah ke numerik
gabungan_df <- gabungan_df %>%
mutate(
Harga = str_replace_all(Harga, "[^0-9]", ""),
Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
Harga = as.numeric(Harga),
Jumlah = as.numeric(Jumlah)
)
# 5. c. Hitung ulang kolom Total
gabungan_df <- gabungan_df %>%
mutate(Total = Harga * Jumlah)
# 6. e. Hapus baris yang Produk-nya kosong atau "-"
gabungan_df <- gabungan_df %>%
filter(!is.na(Produk) & Produk != "" & Produk != "-")
# 7. Opsional: Buang baris dengan Harga atau Jumlah kosong (supaya Total valid)
gabungan_df <- gabungan_df %>%
filter(!is.na(Harga), !is.na(Jumlah), !is.na(Total))
# 8. Tampilkan hasil bersih
head(gabungan_df)
Bagian 3 Data Transformation
library(dplyr)
library(lubridate)
library(readr)
library(stringr)
# 1. Baca data
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)
# 2. Gabungkan data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# 3. Bersihkan kolom Harga dan Jumlah
gabungan_df <- gabungan_df %>%
mutate(
Tanggal = dmy(Tanggal),
Harga = str_replace_all(Harga, "[^0-9]", ""),
Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
Harga = as.numeric(Harga),
Jumlah = as.numeric(Jumlah),
Total = Harga * Jumlah
)
# 4. Filter data valid (tanpa NA dan tanpa 0)
gabungan_df <- gabungan_df %>%
filter(
!is.na(Tanggal),
!is.na(Produk), Produk != "", Produk != "-",
!is.na(Harga), Harga > 0,
!is.na(Jumlah), Jumlah > 0,
!is.na(Total), Total > 0
)
# 5. Tambah kolom Bulan
gabungan_df <- gabungan_df %>%
mutate(Bulan = format(Tanggal, "%Y-%m"))
# 6. Analisis
# a. Total penjualan per kategori produk
total_per_kategori <- gabungan_df %>%
group_by(Produk) %>%
summarise(Total_Penjualan = sum(Total)) %>%
filter(Total_Penjualan > 0)
# b. Jumlah transaksi per kota
jumlah_transaksi_per_kota <- gabungan_df %>%
group_by(Kota) %>%
summarise(Jumlah_Transaksi = n()) %>%
filter(Jumlah_Transaksi > 0)
# c. Ringkasan total penjualan per bulan
ringkasan_bulanan <- gabungan_df %>%
group_by(Bulan) %>%
summarise(Total_Penjualan_Bulanan = sum(Total)) %>%
filter(Total_Penjualan_Bulanan > 0)
# 7. Tampilkan hasil
cat("\n=== Total Penjualan per Kategori Produk ===\n")
##
## === Total Penjualan per Kategori Produk ===
## # A tibble: 5 × 2
## Produk Total_Penjualan
## <chr> <dbl>
## 1 Kemeja 302200000
## 2 Laptop A 163150000
## 3 Sepatu 'Nike' 111900000
## 4 Smartphone X 114000000
## 5 Tas Branded 239950000
##
## === Jumlah Transaksi per Kota ===
## # A tibble: 4 × 2
## Kota Jumlah_Transaksi
## <chr> <int>
## 1 - 19
## 2 Bandung 22
## 3 Jakarta 18
## 4 Surabaya 20
##
## === Ringkasan Total Penjualan per Bulan ===
## # A tibble: 4 × 2
## Bulan Total_Penjualan_Bulanan
## <chr> <dbl>
## 1 2024-01 211650000
## 2 2024-02 311200000
## 3 2024-03 350250000
## 4 2024-04 58100000
