Data Science adalah disiplin ilmu yang memadukan statistika, matematika, dan ilmu komputer untuk menganalisis data dalam jumlah besar, yang sering disebut sebagai big data. Dengan adanya revolusi industri 4.0, kebutuhan akan ahli Data Science meningkat pesat seiring kebutuhan perusahaan-perusahaan di berbagai sektor untuk memanfaatkan data guna pengambilan keputusan. Data Science kini semakin diminati oleh banyak orang karena terbuka bagi siapa saja, tanpa memandang latar belakang pendidikan. Meskipun demikian, menjadi seorang ahli Data Science tidak mudah, karena dibutuhkan ketekunan dan konsistensi dalam mempelajari ilmu ini.
Salah satu bidang yang menjadi bagian dari Data Science adalah machine learning. Untuk menggali lebih dalam mengenai machine learning, Program Studi Teknik Informatika menyelenggarakan kuliah tamu dengan mengundang pakar untuk membahas topik tersebut. Pada kesempatan kali ini, narasumber yang diundang adalah Ibu Dr. Chairani, S.Kom., M.Eng, dosen dari Institut Informatika dan Bisnis Darmajaya. Dalam pembahasan awal, Ibu Chairani menjelaskan bahwa machine learning adalah ilmu yang mengajarkan komputer untuk belajar dari data agar dapat bertindak seperti otak manusia. Sebagai bagian dari kecerdasan buatan (AI), machine learning sangat berperan dalam berbagai aplikasi modern dengan tujuan utama untuk meningkatkan kemampuan mesin dalam memecahkan masalah melalui pembelajaran mandiri.
Proses dalam machine learning dimulai dengan menginput data latih ke dalam algoritma yang dipilih sesuai dengan tujuan pemodelan. Data latih ini berfungsi untuk mengajarkan mesin cara memecahkan masalah, menjawab pertanyaan, atau membuat prediksi berdasarkan data. Setelah melalui proses pelatihan, algoritma akan diuji menggunakan data baru untuk memeriksa akurasinya. Jika akurasi prediksi belum memuaskan, algoritma akan dilatih ulang hingga menghasilkan output yang optimal. Proses pelatihan ulang ini membantu mesin terus belajar dan meningkatkan akurasinya seiring waktu.
Machine learning memiliki algoritma yang terbagi menjadi dua jenis utama: supervised learning dan unsupervised learning. Supervised learning menggunakan data berlabel sebagai data latih, sehingga prosesnya lebih terarah dan biasanya menghasilkan akurasi yang tinggi. Beberapa algoritma supervised learning yang sering digunakan adalah regresi, random forest, decision trees, K-Nearest Neighbor (KNN), dan naive bayes. Di sisi lain, unsupervised learning bekerja dengan data yang tidak berlabel dan berfokus pada pengelompokan data. Algoritma unsupervised learning yang umum digunakan meliputi K-means clustering, hierarchical clustering, dan principal component analysis. Selain kedua jenis ini, terdapat juga reinforcement learning yang saat ini sedang dikembangkan.
Machine learning mampu diterapkan dalam berbagai industri untuk menyelesaikan berbagai masalah secara otomatis. Di bidang bisnis, machine learning digunakan dalam layanan pelanggan, seperti pada chatbots dan analisis sentimen, untuk memahami dan merespon umpan balik pelanggan. Di sektor perbankan, algoritma machine learning dapat membantu mendeteksi kasus penipuan dengan menganalisis pola transaksi. Sementara itu, di bidang kesehatan, machine learning berperan dalam mendukung diagnosis penyakit, membantu dokter untuk mengidentifikasi dan mendiagnosis kondisi medis lebih awal dan akurat. Kehadiran machine learning memungkinkan pemrosesan data dalam jumlah besar dalam waktu singkat, memberikan dampak signifikan pada efisiensi di berbagai sektor industri.