Pemprogram Sains Data

UTS Pemprograman Sains Data

Logo

1 Operasi dan Tipe Data Dasar

Berikut adalah program sederhana R dalam Operasi dan Tie Data Dasar:

# Meminta input dari pengguna
bil1 <- as.numeric(readline(prompt = "Masukkan bilangan pertama: "))
## Masukkan bilangan pertama:
bil2 <- as.numeric(readline(prompt = "Masukkan bilangan kedua: "))
## Masukkan bilangan kedua:
# Operasi matematika
penjumlahan <- bil1 + bil2
perkalian <- bil1 * bil2
pembagian <- bil1 / bil2
pangkat <- bil1 ^ bil2

# Output sesuai permintaan
cat("Penjumlahan:", penjumlahan, "| Tipe:", class(penjumlahan), "\n")
## Penjumlahan: NA | Tipe: numeric
cat("Perkalian:", perkalian, "| Tipe:", class(perkalian), "\n")
## Perkalian: NA | Tipe: numeric
cat("Pembagian:", pembagian, "| Tipe:", class(pembagian), "\n")
## Pembagian: NA | Tipe: numeric
cat("Pangkat:", pangkat, "| Tipe:", class(pangkat), "\n")
## Pangkat: NA | Tipe: numeric

2 Struktur Kendali (Control Flow)

Berikut adalah program sederhana R dalam Control Flow:

# Menerima input dari pengguna
nilai <- as.numeric(readline(prompt = "Masukkan nilai ujian (0-100): "))
## Masukkan nilai ujian (0-100):
# Mengecek apakah input valid
if (is.na(nilai) || nilai < 0 || nilai > 100) {
  cat("Input tidak valid. Harap masukkan angka antara 0 dan 100.\n")
} else {
  # Menentukan keterangan berdasarkan nilai
  if (nilai >= 85) {
    keterangan <- "Sangat Baik"
  } else if (nilai >= 70) {
    keterangan <- "Baik"
  } else if (nilai >= 60) {
    keterangan <- "Cukup"
  } else {
    keterangan <- "Perlu Perbaikan"
  }

  # Menampilkan hasil
  cat("Nilai:", nilai, "\n")
  cat("Keterangan:", keterangan, "\n")
}
## Input tidak valid. Harap masukkan angka antara 0 dan 100.

3 Fungsi dan Perulangan

Berikut adalah program R sederhana dalam Fungsi dan Perulangan:

kelipatan_genap <- function(n) {
  # Validasi input: harus bilangan bulat positif
  if (is.na(n) || !is.numeric(n) || n <= 0 || n != floor(n)) {
    cat("Input harus berupa bilangan bulat positif.\n")
    return()
  }

  cat("Bilangan genap kelipatan 4 dari 1 hingga", n, ":\n")
  
  hasil <- c()  # vektor penampung hasil
  for (i in 1:n) {
    if (i %% 4 == 0) {
      hasil <- c(hasil, i)
    }
  }
  
  # Tampilkan hasil sebagai daftar angka yang dipisah koma
  cat(paste(hasil, collapse = ", "), "\n")
}

# Minta input dari pengguna
input <- readline(prompt = "Masukkan bilangan bulat positif: ")
## Masukkan bilangan bulat positif:
n <- as.numeric(input)

# Panggil fungsi
kelipatan_genap(n)
## Input harus berupa bilangan bulat positif.
## NULL

4 Studi Kasus

Sebuah perusahaan e-commerce ingin menganalisis performa penjualannya berdasarkan data transaksi selama 3 bulan terakhir. Namun, data yang tersedia berasal dari berbagai sumber dan memiliki kualitas yang beragam.

4.1 Data Collection

## Jumlah Baris: 150 
## Jumlah Kolom: 9

Setelah nggabungin data dari tiga file transaksi bulanan (Januari, Februari, dan Maret), totalnya ada 150 baris transaksi. Ini ngasih gambaran kalau tiap file isinya kira-kira 50 transaksi. Di dataset gabungan ini juga ada 9 kolom, yang nunjukin tiap transaksi punya sembilan info penting — kayak tanggal beli, nama produk, kategori, harga, jumlah yang dibeli, dan juga siapa pembelinya.

4.2 Data Cleaning

Pada tahap ini data nya di bersihkan. Data yang tadinya berantakan sekarang udah dibersihin. Tanggal semua udah disamain jadi format YYYY-MM-DD, harga dan jumlah barang yang tadinya masih ada tulisan kayak “Rp” atau “dua” udah diganti jadi angka.

Kolom Total juga udah dihitung otomatis dari Harga × Jumlah. Kalau ada data yang aneh atau kosong, langsung diganti NA. Produk yang nggak ada namanya juga dihapus.

Sekarang datanya udah rapi dan siap dipakai buat analisis.

4.3 Data Transformasi

Total Penjualan per Kategori
Kategori Total Penjualan
123009750
Aksesoris 331762000
Elektronik 167006750
Fashion 225006750
Jumlah Transaksi per Kota
Kota Jumlah Transaksi
- 30
Bandung 33
Jakarta 29
Surabaya 30
Ringkasan Penjualan per Bulan
Bulan Total Penjualan
2024-01 195757500
2024-02 286761250
2024-03 318008250
2024-04 46258250

4.4 Visualisasi

