Assignment Week 2

ITSB

Syafif Azmi Lontoh (52250060)

Student Major in Data Science

1 Pengertian dan Tujuan Data Science Programming

Data Science Programming adalah proses penggunaan teknik pemrograman untuk mengolah, menganalisis, dan menginterpretasikan data sehingga menghasilkan informasi yang bernilai. Bidang ini menggabungkan ilmu komputer, statistik, dan pemahaman domain tertentu untuk menyelesaikan permasalahan berbasis data.

Tujuan utama dari Data Science Programming adalah:

  • Mengumpulkan data dari berbagai sumber.

  • Membersihkan dan memproses data agar siap dianalisis.

  • Menganalisis data untuk menemukan pola atau hubungan tertentu.

  • Membangun model prediksi menggunakan algoritma Machine Learning.

  • Mendukung proses pengambilan keputusan berbasis data.

Dengan kata lain, data science bertujuan untuk mengubah data mentah menjadi insight yang dapat membantu individu maupun organisasi dalam mengambil keputusan yang lebih tepat dan strategis.

2 Alasan Mempelajari Data Science Programming

Mempelajari Data Science Programming menjadi penting karena beberapa alasan berikut:

2.1 Perkembangan Era Digital

Saat ini hampir seluruh aktivitas menghasilkan data, baik dalam bidang bisnis, pendidikan, kesehatan, maupun teknologi. Data tersebut perlu dianalisis agar memiliki nilai guna.

2.2 Kebutuhan Industri

Banyak perusahaan membutuhkan tenaga profesional yang mampu mengolah dan menganalisis data untuk meningkatkan efisiensi, produktivitas, dan keuntungan.

2.3 Dasar Artificial Intelligence

Data Science merupakan fondasi dari Artificial Intelligence (AI) dan Machine Learning, yang saat ini berkembang pesat dalam berbagai sektor.

2.4 Meningkatkan Kemampuan Analitis

Pembelajaran data science melatih kemampuan berpikir logis, kritis, dan sistematis dalam memecahkan masalah.

3 Tools dan Teknologi yang Diperlukan

Untuk menjadi ahli dalam Data Science Programming, terdapat beberapa tools dan teknologi yang perlu dikuasai:

3.1 Bahasa Pemrograman

  • Python → Bahasa paling populer karena mudah dipelajari dan memiliki banyak library pendukung.

  • R → Digunakan untuk analisis statistik.

  • SQL → Digunakan untuk mengelola dan mengambil data dari database.

3.2 Library dan Framework

  • Pandas → Manipulasi dan analisis data.

  • NumPy → Komputasi numerik.

  • Matplotlib dan Seaborn → Visualisasi data.

  • Scikit-learn → Machine Learning.

  • TensorFlow dan PyTorch → Deep Learning.

3.3 Database

  • MySQL

  • PostgreSQL

  • MongoDB

3.4 Tools Visualisasi

  • Power BI

  • Tableau

Selain tools teknis, pemahaman mengenai Statistik, Probabilitas, dan Aljabar Linear juga sangat penting.

4 Bidang Minat (Domain Knowledge) dalam Data Science

Dalam penerapan Data Science, pemahaman terhadap domain tertentu sangat diperlukan agar analisis yang dilakukan relevan dan akurat. Beberapa bidang yang sering menjadi fokus dalam Data Science antara lain:

  • Machine Learning

  • Natural Language Processing (NLP)

  • Predictive Modeling

  • Business Intelligence

  • Educational Data Analytics

  • Sistem Optimasi dan Penjadwalan

Domain knowledge membantu seorang data scientist memahami konteks permasalahan sehingga model yang dibangun tidak hanya akurat secara matematis, tetapi juga relevan secara praktis.