Assignment Week 2
ITSB
Syafif Azmi Lontoh (52250060)
Student Major in Data Science
1 Pengertian dan Tujuan Data Science Programming
Data Science Programming adalah proses penggunaan teknik pemrograman untuk mengolah, menganalisis, dan menginterpretasikan data sehingga menghasilkan informasi yang bernilai. Bidang ini menggabungkan ilmu komputer, statistik, dan pemahaman domain tertentu untuk menyelesaikan permasalahan berbasis data.
Tujuan utama dari Data Science Programming adalah:
Mengumpulkan data dari berbagai sumber.
Membersihkan dan memproses data agar siap dianalisis.
Menganalisis data untuk menemukan pola atau hubungan tertentu.
Membangun model prediksi menggunakan algoritma Machine Learning.
Mendukung proses pengambilan keputusan berbasis data.
Dengan kata lain, data science bertujuan untuk mengubah data mentah menjadi insight yang dapat membantu individu maupun organisasi dalam mengambil keputusan yang lebih tepat dan strategis.
2 Alasan Mempelajari Data Science Programming
Mempelajari Data Science Programming menjadi penting karena beberapa alasan berikut:
2.1 Perkembangan Era Digital
Saat ini hampir seluruh aktivitas menghasilkan data, baik dalam bidang bisnis, pendidikan, kesehatan, maupun teknologi. Data tersebut perlu dianalisis agar memiliki nilai guna.
2.2 Kebutuhan Industri
Banyak perusahaan membutuhkan tenaga profesional yang mampu mengolah dan menganalisis data untuk meningkatkan efisiensi, produktivitas, dan keuntungan.
2.3 Dasar Artificial Intelligence
Data Science merupakan fondasi dari Artificial Intelligence (AI) dan Machine Learning, yang saat ini berkembang pesat dalam berbagai sektor.
2.4 Meningkatkan Kemampuan Analitis
Pembelajaran data science melatih kemampuan berpikir logis, kritis, dan sistematis dalam memecahkan masalah.
3 Tools dan Teknologi yang Diperlukan
Untuk menjadi ahli dalam Data Science Programming, terdapat beberapa tools dan teknologi yang perlu dikuasai:
3.1 Bahasa Pemrograman
Python → Bahasa paling populer karena mudah dipelajari dan memiliki banyak library pendukung.
R → Digunakan untuk analisis statistik.
SQL → Digunakan untuk mengelola dan mengambil data dari database.
3.2 Library dan Framework
Pandas → Manipulasi dan analisis data.
NumPy → Komputasi numerik.
Matplotlib dan Seaborn → Visualisasi data.
Scikit-learn → Machine Learning.
TensorFlow dan PyTorch → Deep Learning.
3.3 Database
MySQL
PostgreSQL
MongoDB
3.4 Tools Visualisasi
Power BI
Tableau
Selain tools teknis, pemahaman mengenai Statistik, Probabilitas, dan Aljabar Linear juga sangat penting.
4 Bidang Minat (Domain Knowledge) dalam Data Science
Dalam penerapan Data Science, pemahaman terhadap domain tertentu sangat diperlukan agar analisis yang dilakukan relevan dan akurat. Beberapa bidang yang sering menjadi fokus dalam Data Science antara lain:
Machine Learning
Natural Language Processing (NLP)
Predictive Modeling
Business Intelligence
Educational Data Analytics
Sistem Optimasi dan Penjadwalan
Domain knowledge membantu seorang data scientist memahami konteks permasalahan sehingga model yang dibangun tidak hanya akurat secara matematis, tetapi juga relevan secara praktis.