UTS Pemrograman Data Science
Data Science Programming
1 1. Operasi dan Tipe Data Dasar
# a. Menerima dua bilangan dari pengguna
A <- as.integer(readline(prompt = "Masukkan bilangan pertama (int): "))
## Masukkan bilangan pertama (int):
## Masukkan bilangan kedua (int):
# b. Menghitung hasil operasi
penjumlahan <- A + B
perkalian <- A * B
pembagian <- A/B
pangkat <- A ^ B
# c. Menampilkan hasil dan tipe datanya
cat("\nHasil Operasi:\n")
##
## Hasil Operasi:
## Penjumlahan: NA (tipe: integer )
## Perkalian: NA (tipe: integer )
cat("Pembagian:", pembagian, "(tipe:", if (is.numeric(pembagian)) typeof(pembagian) else typeof(as.character(pembagian)), ")\n")
## Pembagian: NA (tipe: double )
## Pangkat: NA (tipe: double )
2 2. Struktur Kendali (Control Flow)
## Masukkan nilai ujian (0–100):
# Menentukan keterangan nilai
if (!is.na(nilai)) {
if (nilai >= 0 && nilai < 60) {
keterangan <- "Perlu Perbaikan"
} else if (nilai <= 69) {
keterangan <- "Cukup"
} else if (nilai <= 84) {
keterangan <- "Baik"
} else if (nilai <= 100) {
keterangan <- "Sangat Baik"
} else {
keterangan <- "Nilai tidak valid (di luar 0–100)"
}
} else {
keterangan <- "Input tidak valid (bukan angka)"
}
# Tampilkan hasil
cat("Nilai Anda:", nilai, "\n")
## Nilai Anda: NA
## Keterangan: Input tidak valid (bukan angka)
3 3. Fungsi dan Perulangan
# a. Menerima input integer n
if (interactive()) {
n <- as.integer(readline(prompt = "Masukkan bilangan bulat n: "))
} else {
n <- 40 # Nilai default saat proses knit
}
# b. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1 hingga n
cat(sprintf("Semua bilangan genap kelipatan 4 dari 1 hingga %d:\n", n))
## Semua bilangan genap kelipatan 4 dari 1 hingga 40:
## 4, 8, 12, 16, 20, 24, 28, 32, 36, 40
4 4. Studi Kasus
Bagian 1 Data Collection
## Warning: package 'readr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## Rows: 50 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Tanggal, Produk, Kategori, Harga, Jumlah, Pembeli, Kota
## dbl (1): OrderID
## lgl (1): Total
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Gabungkan ketiga data menjadi satu dataset
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# Tampilkan jumlah total baris dan kolom setelah digabung
jumlah_baris_kolom <- dim(gabungan_df)
print(jumlah_baris_kolom)
## [1] 150 9
Bagian 2 Data Cleaning
## Warning: package 'lubridate' was built under R version 4.4.3
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
library(readr)
library(stringr)
# 1. Baca file CSV
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)
# 2. Gabungkan ketiga data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# 3. a. Standarkan format tanggal ke YYYY-MM-DD
gabungan_df$Tanggal <- dmy(gabungan_df$Tanggal)
# 4. b & d. Bersihkan Harga dan Jumlah → hilangkan karakter non-numerik lalu ubah ke numerik
gabungan_df <- gabungan_df %>%
mutate(
Harga = str_replace_all(Harga, "[^0-9]", ""),
Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
Harga = as.numeric(Harga),
Jumlah = as.numeric(Jumlah)
)
# 5. c. Hitung ulang kolom Total
gabungan_df <- gabungan_df %>%
mutate(Total = Harga * Jumlah)
# 6. e. Hapus baris yang Produk-nya kosong atau "-"
gabungan_df <- gabungan_df %>%
filter(!is.na(Produk) & Produk != "" & Produk != "-")
# 7. Opsional: Buang baris dengan Harga atau Jumlah kosong (supaya Total valid)
gabungan_df <- gabungan_df %>%
filter(!is.na(Harga), !is.na(Jumlah), !is.na(Total))
# 8. Tampilkan hasil bersih
head(gabungan_df)
Bagian 3 Data Transformation
library(dplyr)
library(lubridate)
library(readr)
library(stringr)
# 1. Baca data
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)
# 2. Gabungkan data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)
# 3. Bersihkan kolom Harga dan Jumlah
gabungan_df <- gabungan_df %>%
mutate(
Tanggal = dmy(Tanggal),
Harga = str_replace_all(Harga, "[^0-9]", ""),
Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
Harga = as.numeric(Harga),
Jumlah = as.numeric(Jumlah),
Total = Harga * Jumlah
)
# 4. Filter data valid (tanpa NA dan tanpa 0)
gabungan_df <- gabungan_df %>%
filter(
!is.na(Tanggal),
!is.na(Produk), Produk != "", Produk != "-",
!is.na(Harga), Harga > 0,
!is.na(Jumlah), Jumlah > 0,
!is.na(Total), Total > 0
)
# 5. Tambah kolom Bulan
gabungan_df <- gabungan_df %>%
mutate(Bulan = format(Tanggal, "%Y-%m"))
# 6. Analisis
# a. Total penjualan per kategori produk
total_per_kategori <- gabungan_df %>%
group_by(Produk) %>%
summarise(Total_Penjualan = sum(Total)) %>%
filter(Total_Penjualan > 0)
# b. Jumlah transaksi per kota
jumlah_transaksi_per_kota <- gabungan_df %>%
group_by(Kota) %>%
summarise(Jumlah_Transaksi = n()) %>%
filter(Jumlah_Transaksi > 0)
# c. Ringkasan total penjualan per bulan
ringkasan_bulanan <- gabungan_df %>%
group_by(Bulan) %>%
summarise(Total_Penjualan_Bulanan = sum(Total)) %>%
filter(Total_Penjualan_Bulanan > 0)
# 7. Tampilkan hasil
cat("\n=== Total Penjualan per Kategori Produk ===\n")
##
## === Total Penjualan per Kategori Produk ===
## # A tibble: 5 × 2
## Produk Total_Penjualan
## <chr> <dbl>
## 1 Kemeja 302200000
## 2 Laptop A 163150000
## 3 Sepatu 'Nike' 111900000
## 4 Smartphone X 114000000
## 5 Tas Branded 239950000
##
## === Jumlah Transaksi per Kota ===
## # A tibble: 4 × 2
## Kota Jumlah_Transaksi
## <chr> <int>
## 1 - 19
## 2 Bandung 22
## 3 Jakarta 18
## 4 Surabaya 20
##
## === Ringkasan Total Penjualan per Bulan ===
## # A tibble: 4 × 2
## Bulan Total_Penjualan_Bulanan
## <chr> <dbl>
## 1 2024-01 211650000
## 2 2024-02 311200000
## 3 2024-03 350250000
## 4 2024-04 58100000
---
title: "UTS Pemrograman Data Science"
subtitle: "Data Science Programming"
author: 
  - "Chello Frhino Mike M (52240031)"
date:  "`r format(Sys.Date(), '%B %d, %Y')`"
output:
  rmdformats::readthedown:   # https://github.com/juba/rmdformats
    self_contained: true
    thumbnails: true
    lightbox: true
    gallery: true
    number_sections: true
    lib_dir: libs
    df_print: "paged"
    code_folding: "show"
    code_download: yes
    
---

# **1. Operasi dan Tipe Data Dasar**

```{r,warning=FALSE,message=FALSE}
# a. Menerima dua bilangan dari pengguna
A <- as.integer(readline(prompt = "Masukkan bilangan pertama (int): "))
B <- as.integer(readline(prompt = "Masukkan bilangan kedua (int): "))

# b. Menghitung hasil operasi
penjumlahan <- A + B
perkalian <- A * B
pembagian <- A/B
pangkat <- A ^ B

# c. Menampilkan hasil dan tipe datanya
cat("\nHasil Operasi:\n")
cat("Penjumlahan:", penjumlahan, "(tipe:", typeof(penjumlahan), ")\n")
cat("Perkalian:", perkalian, "(tipe:", typeof(perkalian), ")\n")
cat("Pembagian:", pembagian, "(tipe:", if (is.numeric(pembagian)) typeof(pembagian) else typeof(as.character(pembagian)), ")\n")
cat("Pangkat:", pangkat, "(tipe:", typeof(pangkat), ")\n")

```

# **2. Struktur Kendali (Control Flow)**

```{r}
# Input nilai
nilai <- as.integer(readline(prompt = "Masukkan nilai ujian (0–100): "))

# Menentukan keterangan nilai
if (!is.na(nilai)) {
  if (nilai >= 0 && nilai < 60) {
    keterangan <- "Perlu Perbaikan"
  } else if (nilai <= 69) {
    keterangan <- "Cukup"
  } else if (nilai <= 84) {
    keterangan <- "Baik"
  } else if (nilai <= 100) {
    keterangan <- "Sangat Baik"
  } else {
    keterangan <- "Nilai tidak valid (di luar 0–100)"
  }
} else {
  keterangan <- "Input tidak valid (bukan angka)"
}

# Tampilkan hasil
cat("Nilai Anda:", nilai, "\n")
cat("Keterangan:", keterangan, "\n")

```

# **3. Fungsi dan Perulangan**

```{r}
# a. Menerima input integer n
if (interactive()) {
  n <- as.integer(readline(prompt = "Masukkan bilangan bulat n: "))
} else {
  n <- 40  # Nilai default saat proses knit
}

# b. Menggunakan loop untuk mencetak semua bilangan genap kelipatan 4 dari 1 hingga n
cat(sprintf("Semua bilangan genap kelipatan 4 dari 1 hingga %d:\n", n))
for (i in seq(4, n, by = 4)) {
  if (i + 4 <= n) {
    cat(i, ", ", sep = "")
  } else {
    cat(i, "\n")
  }
}

```

# **4. Studi Kasus**
Bagian 1 Data Collection
```{r}
library(readr)
library(dplyr)

# Mengunggah file CSV
januari_df <- read_csv("Januari.csv")
februari_df <- read_csv("Februari.csv")
maret_df <- read_csv("Maret.csv")

# Gabungkan ketiga data menjadi satu dataset
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# Tampilkan jumlah total baris dan kolom setelah digabung
jumlah_baris_kolom <- dim(gabungan_df)
print(jumlah_baris_kolom)

# Tampilkan beberapa baris pertama dari dataset
head(gabungan_df)

```

Bagian 2 Data Cleaning

```{r}
library(dplyr)
library(lubridate)
library(readr)
library(stringr)

# 1. Baca file CSV
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)

# 2. Gabungkan ketiga data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# 3. a. Standarkan format tanggal ke YYYY-MM-DD
gabungan_df$Tanggal <- dmy(gabungan_df$Tanggal)

# 4. b & d. Bersihkan Harga dan Jumlah → hilangkan karakter non-numerik lalu ubah ke numerik
gabungan_df <- gabungan_df %>%
  mutate(
    Harga = str_replace_all(Harga, "[^0-9]", ""),
    Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
    Harga = as.numeric(Harga),
    Jumlah = as.numeric(Jumlah)
  )

# 5. c. Hitung ulang kolom Total
gabungan_df <- gabungan_df %>%
  mutate(Total = Harga * Jumlah)

# 6. e. Hapus baris yang Produk-nya kosong atau "-"
gabungan_df <- gabungan_df %>%
  filter(!is.na(Produk) & Produk != "" & Produk != "-")

# 7. Opsional: Buang baris dengan Harga atau Jumlah kosong (supaya Total valid)
gabungan_df <- gabungan_df %>%
  filter(!is.na(Harga), !is.na(Jumlah), !is.na(Total))

# 8. Tampilkan hasil bersih
head(gabungan_df)

```

Bagian 3 Data Transformation

```{r}
library(dplyr)
library(lubridate)
library(readr)
library(stringr)

# 1. Baca data
januari_df <- read_csv("Januari.csv", show_col_types = FALSE)
februari_df <- read_csv("Februari.csv", show_col_types = FALSE)
maret_df <- read_csv("Maret.csv", show_col_types = FALSE)

# 2. Gabungkan data
gabungan_df <- bind_rows(januari_df, februari_df, maret_df)

# 3. Bersihkan kolom Harga dan Jumlah
gabungan_df <- gabungan_df %>%
  mutate(
    Tanggal = dmy(Tanggal),
    Harga = str_replace_all(Harga, "[^0-9]", ""),
    Jumlah = str_replace_all(Jumlah, "[^0-9]", ""),
    Harga = as.numeric(Harga),
    Jumlah = as.numeric(Jumlah),
    Total = Harga * Jumlah
  )

# 4. Filter data valid (tanpa NA dan tanpa 0)
gabungan_df <- gabungan_df %>%
  filter(
    !is.na(Tanggal),
    !is.na(Produk), Produk != "", Produk != "-",
    !is.na(Harga), Harga > 0,
    !is.na(Jumlah), Jumlah > 0,
    !is.na(Total), Total > 0
  )

# 5. Tambah kolom Bulan
gabungan_df <- gabungan_df %>%
  mutate(Bulan = format(Tanggal, "%Y-%m"))

# 6. Analisis

# a. Total penjualan per kategori produk
total_per_kategori <- gabungan_df %>%
  group_by(Produk) %>%
  summarise(Total_Penjualan = sum(Total)) %>%
  filter(Total_Penjualan > 0)

# b. Jumlah transaksi per kota
jumlah_transaksi_per_kota <- gabungan_df %>%
  group_by(Kota) %>%
  summarise(Jumlah_Transaksi = n()) %>%
  filter(Jumlah_Transaksi > 0)

# c. Ringkasan total penjualan per bulan
ringkasan_bulanan <- gabungan_df %>%
  group_by(Bulan) %>%
  summarise(Total_Penjualan_Bulanan = sum(Total)) %>%
  filter(Total_Penjualan_Bulanan > 0)

# 7. Tampilkan hasil
cat("\n=== Total Penjualan per Kategori Produk ===\n")
print(total_per_kategori)

cat("\n=== Jumlah Transaksi per Kota ===\n")
print(jumlah_transaksi_per_kota)

cat("\n=== Ringkasan Total Penjualan per Bulan ===\n")
print(ringkasan_bulanan)


```

