Tahukah kamu, data yang dihasilkan di dunia ini meningkat 50 kali lipat dari tahun 2011. International Data Corporation memprediksi bahwa jumlah data akan lebih meningkat lagi hingga tahun 2025. Peningkatan drastis inilah yang menjadi alasan mengapa istilah data science mulai dikenal hingga sekarang.
Data science menjadi salah satu cabang ilmu yang sangat populer dan dibutuhkan di berbagai industri. Didorong dengan kemajuan teknologi serta meningkatnya jumlah data secara pesat, implementasi data science tidak terhindarkan lagi.
Yuk simak artikel ini sampai akhir, agar kamu bisa memahami apa itu data science dan bagaimana penerapannya.
Pengertian Data Science
Menurut Prof. Murtaza dari Ryerson University Canada, data science merupakan keterampilan yang menggabungkan antara ilmu komputer, pemrograman, teknologi dan statistik. Sejalan dengan pernyataan tersebut, datarobot menuliskan bahwa data science adalah ilmu yang menggabungkan sebuah kemampuan di bidang pemrograman, matematika & statistik, dan bisnis.
Dari kedua pernyataan di atas dapat disimpulkan bahwa data science merupakan keterampilan yang menggabungkan 3 bidang ilmu yaitu pemrograman, matematika & statistik, dan bisnis. Data science bertujuan untuk menghasilkan informasi yang sebenar-benarnya dengan kuantitas dan kualitas yang baik sebagai dasar membuat kebijakan yang tepat.
Seseorang yang mahir dalam bidang data science biasanya menggunakan algoritma machine learning atau pembelajaran mesin yang berguna untuk mengolah teks, gambar, dan audio video untuk menghasilkan sebuah sistem yang dirancang untuk melakukan analisis yang rumit yang tidak mampu dijangkau oleh kecerdasan manusia.
Sejarah Data Science
Data science atau ilmu data sendiri pertama kali muncul pada tahun 2008 oleh Dr DJ Patil scientist dari Linkedln dan Jeff Hammerbacher dari Facebook. Mereka menciptakan istilah data science untuk menggambarkan sebuah bidang ilmu yang fokus untuk mencari nilai tersembunyi dalam sebuah informasi dari data yang dikumpulkan.
Tetapi, sebelum terbentuk bidang ilmu data science, bagaimana seorang scientist mengelola data di sebuah industri? Faktanya, data science memiliki sejarah yang panjang dan menarik untuk diketahui. Ayo simak sejarah data science dari tahun ke tahun berikut ini.
1. Tahun 1990 - 2000
Pada tahun 1990 hingga tahun 2000 banyak sekali scientist yang mencoba memahami, menggunakan, dan membuat sistem yang mampu memberikan kemudahan dalam mengelola data dan bisa menghasilkan prediksi atau kesimpulan yang baik.
Diawali oleh John W. Tukey yang mulai mengamati dampak adanya komputerisasi pada analisis data. Seiring berjalannya waktu, scientist lain mulai ikut mengembangkan keilmuan tentang data sampai akhirnya tercipta ilmu di bidang data yaitu statistik.
Pada tahun 1999 Jacob Zahavi menemukan fakta bahwa dalam mengelola data membutuhkan sebuah alat baru yang mampu menangani jumlah data yang sangat besar dan terus berkembang. Jacob Zahavi menekankan dalam karyanya yang berjudul “Mining Data for Nuggets of Knowledge” bahwa akan muncul tantangan yang bersifat teknis untuk mengolah sebuah data.
2. Tahun 2001 - 2010
Pada tahun 2001, akhirnya pendapat Jacob Zahavi terjawab dengan terciptanya Software-as-a-Service (SaaS), sebuah software atau perangkat lunak berbasis cloud yang bersifat online.
Pada periode ini banyak bermunculan layanan SaaS dengan versi gratis seperti menggunakan Dropbox dan Google Drive. Karena meledaknya aliran data, layanan SaaS berkembang lagi dengan menyediakan kapasitas yang lebih besar walaupun berbayar seperti Amazon Web Services (AWS) dan Azure.
Dengan banyaknya aplikasi yang berkembang, akhirnya di tahun 2008 Dr DJ Patil & Jeff Hammerbacher menciptakan istilah data science untuk menggambarkan sebuah bidang ilmu yang fokus untuk mencari nilai tersembunyi dalam sebuah informasi dari data yang dikumpulkan. Pada masa ini juga mulai muncul istilah big data, yaitu kumpulan data yang sangat besar, kompleks, dan selalu bertambah seiring berjalannya waktu.
3. Tahun 2011-2022
Big data yang muncul di periode sebelumnya menyebabkan munculnya banyak data yang berkali-kali lipat jumlahnya. Karena hal itulah, banyak perusahaan pada tahun 2011 membuka lowongan kerja besar-besaran untuk posisi data scientist. Fakta ini menunjukkan bahwa industri mulai memperhatikan pentingnya data science untuk mencapai tujuan perusahaan.
Pada tahun 2015 mulai ditemukan teknik deep learning yang implementasinya dapat kita lihat misalnya pada Google Voice. Hingga saat ini, data science masih terus berkembang mengikuti perkembangan teknologi yang semakin maju dan kebutuhan industri yang semakin rumit.
Pentingnya Data Science
Dari waktu ke waktu, banyak bermunculan pelaku bisnis dengan bisnisnya masing-masing. Bahkan, banyak sekali bisnis yang muncul dengan produk atau layanan yang sama. Ini artinya, persaingan dalam dunia bisnis semakin ketat. Maka dari itu, data science menjadi starter pack atau senjata khusus yang bisa membuat bisnis bisa berkembang dan selangkah lebih maju.
Salah satu aset utama yang dimiliki oleh sebuah perusahaan adalah "data". Bahkan, belakangan ini mulai populer kalimat “Data is The New Oil” yang artinya saat ini data dianggap sebagai aset yang nilainya jauh lebih tinggi daripada minyak.
Banyak perusahaan perlahan mulai memperhatikan data mereka. Mereka menyadari bahwa data harus dikelola dan dijaga dengan baik agar tidak hilang. Bahkan jika sebuah data perusahaan dicuri oleh pihak lain, maka habislah sudah perusahaan tersebut. Strategi yang selama ini digunakan dan data-data rahasia dapat diketahui oleh pihak lain.
Penggunaan teknologi sudah bukan soal pilihan, melainkan suatu keharusan. Implementasi data science harus mampu dijalankan oleh perusahaan agar tetap bertahan di era disrupsi teknologi seperti sekarang. Semakin lama sebuah perusahaan beroperasi maka semakin besar dan rumit pula data yang dikumpulkan.
Jika sebuah perusahaan tidak mampu mengolah data, maka bisnis tidak akan bisa mengambil kebijakan yang tepat dan tidak bisa menentukan strategi yang efektif dan efisien. Jika hal itu terjadi, bagaimana sebuah perusahaan bisa berkembang?
Siapa yang Membutuhkan Data Science ?
Perusahaan yang berjalan di bidang apapun pasti membutuhkan data science untuk menjalankan usahanya dengan lebih efektif.
Di bidang kesehatan contohnya, setiap rumah sakit pasti memiliki pasien baru setiap harinya. Untuk merekap banyaknya informasi pasien baik itu informasi umum maupun medis. Tenaga medis harus menghimpun data untuk di kelola dengan baik oleh seorang ahli data (data scientist).
Setelah data berhasil di kumpulkan, maka data scientist akan mendapatkan informasi mengenai berapa orang yang sakit, jenis sakit apa yang diderita, dan obat-obatan apa yang diberikan oleh dokter. Dari informasi-informasi tadi, dapat dianalisis dan disimpulkan trend penyakit apa yang sering diderita, berapa lama seseorang bisa sembuh dari penyakit tertentu, dan obat apa yang manjur untuk mengobati suatu penyakit.
Lalu bagaimana di bidang bisnis? apakah data science sangat dibutuhkan oleh sebuah bisnis? Jawabannya adalah sangat butuh. Data science dibutuhkan baik untuk perusahaan dalam skala kecil maupun besar. Bahkan dignation menyebutkan bahwa UMKM juga membutuhkan data science untuk menjalankan bisnisnya.
Sebuah UMKM bisa memanfaatkan machine learning atau sebuah kecerdasan buatan dimana sebuah PC akan diisikan sejumlah data yang berukuran besar dan akan diolah menggunakan algoritma.
Saat ini bahkan banyak lembaga yang memberikan pelatihan data science bagi pelaku UMKM agar mau dan mampu mengimplementasikan data science.
Ternyata seorang pengelola sosial media ataupun toko online juga membutuhkan kemampuan data science. Dengan memiliki kemampuan data science, mereka akan mampu menciptakan rekomendasi produk dan memberikan konten yang relevan & diminati audiens.
Data Scientist
Kata data scientist sering disebutkan dalam artikel ini, sebetulnya data science dan data scientist itu sama atau berbeda?
1. Pengertian Data Scientist & Kemampuan yang Dibutuhkan
Jika data science itu adalah ilmunya maka data scientist adalah seseorang yang melaksanakan pekerjaan dengan menggunakan ilmu data science. Kemampuan apa saja yang harus dimiliki oleh seorang data scientist?
Seseorang yang menjadi seorang data scientist harus memiliki kemampuan yang tinggi untuk mengumpulkan, memahami, melakukan proses, dan menyimpulkan informasi dari suatu data. Jika seorang data scientist tidak memiliki kemampuan tersebut, maka informasi yang diperoleh dari semua data-data perusahaan tidak akan akurat.
Jika kesimpulan informasinya saja tidak akurat, maka kebijakan atau strategi yang dibuatpun tidak akan berhasil digunakan dan tujuan perusahaan sulit tercapai. Padahal adanya data scientist adalah untuk membantu menentukan strategi bisnis yang efektif, dan bukan untuk mempersulit bisnis. Selain kemampuan utama tersebut, seorang data scientist juga harus memiliki kemampuan programming berikut ini :
- Pemahaman yang baik mengenai machine learning dan algoritma
- Memiliki pengalaman dengan toolkit
- Mahir dalam SQL, Hive, Pig
- Pengalaman dalam database seperti SQL, Hive, Pig
- Mahir dalam menggunakan NoSQL database seperti MongoDB, Cassandra, dan Hbase
- Memiliki keahlian statistik terapan yang baik seperti distribusi, pengujian statistik, regresi dan teknik statistik lainnya
- Memiliki keterampilan scripting dan programming
Kamu belum memili kemampuan-kemampuan di atas? Jangan khawatir, karena Gamelab Indonesia menyediakan kelas-kelas programming untuk kamu yang ingin menambahkan skill programming. Klik di sini untuk kamu yang ingin belajar programming.
2. Peluang Kerja dan Gaji Data Scientist
Seseorang yang memiliki pemahaman yang baik tentang data science akan banyak dicari karena memang industri sangat membutuhkan seorang data scientist. Jadi, penting tidak belajar data science? Untung atau rugi kalau kita memiliki keterampilan data science? Jawabannya adalah penting dan sangat menguntungkan ketika kita memiliki skill data science.
California University of Pennsylvania menuliskan dalam situsnya bahwa pertumbuhan karir sebagai data scientist tumbuh 650% dari tahun 2012. Di Indonesia sendiri, pada tahun 2026 diprediksi akan muncul 11,5 juta data scientist. Apakah kamu mau menjadi bagian tersebut? Tentunya fakta ini membuktikan bahwa peluang karir sebagai data scientist sangatlah besar. Banyak posisi yang bisa diduduki ketika kita memiliki kemampuan data science, di antaranya:
- Senior Data Scientist
- Data Scientist
- Senior Data Analyst
- Data Analyst
- Senior Data Engineer
- Data Engineer
- Business Intelligence Analyst
Apakah kamu masih ragu untuk menjadi seorang data scientist? Coba baca fakta gaji seorang data scientist ini untuk meyakinkan diri kamu untuk belajar data science dan menjadi data scientist yang handal. Berdasarkan laporan Linkedin tahun 2020, data scientist masuk ke dalam 10 besar pekerjaan yang akan terus dibutuhkan di dunia industri.
Semakin dibutuhkannya posisi tersebut, perusahaan memberikan gaji yang cukup fantastis. Seorang senior data scientist memiliki rate gaji Rp 18.000.000,- sampai Rp 27.000.000,-. Bagi seorang data scientist yang belum berpengalaman, gaji yang diberikan juga sangat menggiurkan yaitu sekitar Rp 10.000.000,- sampai Rp 20.000.000,-. Bagaimana, apakah kamu sudah tertarik untuk menjadi data scientist?
Proses Data Science
Jika kamu bisa menjadi data scientist yang handal, kamu harus mengetahui terlebih dahulu bagaimana proses data science itu berlangsung. Hal ini penting agar tujuan dari data science tercapai yaitu menghasilkan informasi yang memiliki kuantitas tepat dan kualitas yang baik. Untuk lebih mudah memahami proses data science, perhatikan tabel berikut ini:
1. Obtain (Pengumpulan Data)
Pada Langkah pertama ini terdapat obtain, yaitu proses mengumpulkan data dari sumber-sumber data yang ada. Nantinya semua data akan di proses menggunakan teknis seperti MySQL atau Python R. Jika kita menggunakan Phyton R dalam memproses data, maka kita bisa membaca data langsung dari sumbernya ke program data science yang kita gunakan. Untuk memperoleh data dari sumbernya, maka diperlukan keahlian yang baik sesuai dengan ukuran file dan tipenya.
2. Analysis (Menganalisis Data)
Menganalisis data merupakan bagian inti dari sebuah proses data science, pada tahap ini kita bisa melakukan beberapa tips.
- Scrubbing
Scrubbing adalah proses melakukan filter atau standarisasi data yang telah didapatkan. Data yang tidak penting dan tidak relevan harus dieliminasi, sedangkan data yang terpakai harus dikelompokkan sesuai jenisnya masing-masing agar mempermudah membaca data.
Pada tahap ini, seorang data scientist harus melakukan standarisasi format data yang lolos tahap scrubbing. Apabila terdapat data yang kurang bahkan hilang sekalipun, data scientist harus segera melakukan penyesuaian terhadap data tersebut agar nantinya bisa diproses. - Explore
Kita sudah mendapatkan kategori-kategori data dari proses scrubbing, hal yang pertama dilakukan dari data tersebut adalah memeriksa data properti karena setiap jenis data akan memiliki perlakuan yang berbeda juga. Setelah itu statistik deskriptif harus dihitung agar variabel dapat diuji dengan signifikan agar data scientist bisa mengidentifikasi tren dan pola dari data-data yang telah diperoleh.
3. Visualization (Visualisasi Data)
Tahap terakhir adalah visualisasi, pada tahap ini seorang data scientist harus mengolah data final yang telah dianalisis agar menghasilkan sebuah output yang bisa dipahami oleh orang-orang awam yang tidak mengerti istilah teknis. Dalam tahap ini, seorang data scientist juga harus memiliki kemampuan komunikasi yang baik agar mampu menjelaskan secara verbal kepada pihak lain secara jelas dan detail.
Contoh Implementasi Data Science
Apakah kamu pecinta klub sepak bola dunia? Apakah kamu pernah berpikir kenapa Christiano Ronaldo selalu dijadikan pemain inti di Manchester United, bahkan ia juga sering mendapatkan tawaran bergabung dengan klub besar lainnya.
Tentu saja ini bukan keputusan yang sembrono yang dipilih oleh manajemen klub bola tersebut. Mereka melihat Christiano Ronaldo selalu memperlihatkan skill yang mumpuni ditambah mencetak gol berkali-kali. Mereka juga melihat performa Christiano Ronaldo tidak turun dan konsisten di setiap pertandingannya. Dari data jumlah skor gol Christiano Ronaldo, maka klub bola akan mempertahankan dia sebagai pemain utama.
Itu tadi contoh data science di luar bisnis, kalau di perusahan bagaimana? Semua jenis, bidang, dan skala usaha membutuhkan data science. Berikut 2 contohnya:
1. Bidang Finansial
Setiap perusahaan pasti memiliki divisi keuangan yang beranggotakan seseorang yang ahli di bidangnya untuk mengatur siklus keuangan perusahaan. Tetapi apakah menjamin mereka tidak melakukan kecurangan? Nah, di sinilah seorang data scientist bisa melakukan deteksi kecurangan. Data scientist dapat mengumpulkan, menganalisis, dan memvisualkan data keuangan yang mengindikasikan atau menandakan pola kecurangan.
2. Digital Marketing
Pasti kita pernah mengalami ketika kita mencari sesuatu topik di sebuat platform, maka dikesempatan berikutnya platform tersebut merekomendasikan topik serupa secara terus menerus. Data jangkauan yang dimiliki, data jumlah klik, data topik yang diminati audiens, dan data-data sejenis akan menjadi bahan pertimbangan untuk menentukan langkah digital marketing selanjutnya, seperti mengoptimalkan strategi yang kurang dan mempertahankan strategi yang bekerja dengan baik.
Berbicara tentang digital marketing, Gamelab Indonesia juga memiliki kelas untuk meningkatkan kemampuan di bidang bisnis daring & pemasaran. Ada beberapa kelas yang bisa melatih kemampuan analisis data untuk sebuah web, toko online, dan sosial media instagram. Klik link ini untuk melihat kompetensinya.
Cara Belajar Data Science
Prospek kerja data scientist sangat menjanjikan karena pentingnya penerapan data science di era digital. Ilmu ini wajib dikuasai sebagai seorang praktisi data agar kamu mendapatkan kesempatan untuk meraih posisi data scientist yang semakin hari semakin dicari oleh perusahaan. Jadi, siapapun bisa belajar tentang data science.
Bagaimana cara belajar data science? Untuk mempelajari data science, kita harus mengerti terlebih dahulu 3 ilmu yang digabungkan di dalamnya yaitu pemrograman, matematika & statistika, dan bisnis. Untuk kita yang awam dengan data science, kita bisa memahami topik-topik berikut ini:
1. Pemrograman Dasar Python
Python adalah salah satu bahasa pemrograman yang bisa dipakai untuk menganalisis data. Python merupakan bahasa pemrograman tingkat tinggi yang sintaksnya didesain semirip mungkin dengan bahasa manusia. Karena bahasanya yang sangat mirip dengan bahasa manusia, python lebih mudah dan cepat dipelajari oleh pemula. Pada pemrograman dasar python akan diajarkan variabel, tipe data, kondisi perulangan, prinsip-prinsip dasar, dan cara menggunakan python.
Mempelajari pemrograman dasar python ini dapat kamu akses dengan cara yang mudah dan menyenangkan. Tentunya pengalaman belajar tersebut dapat kamu rasakan di kelas Belajar Pemrograman Dasar Python di Gamelab Indonesia.
2. Statistika & Peluang
Statistika adalah ilmu yang mempelajari tentang pengumpulan ilmu yang mempelajari tentang pengumpulan, pengorganisasian, menyajikan dan menarik kesimpulan dari data yang tersedia. Dalam statistika terdapat 2 komponen penting yang harus diperhatikan yaitu:
- Populasi: Populasi adalah kumpulan semua data. Contoh dari populasi misalnya "Peserta Kelas Industri Gamelab Indonesia"
- Sampel: Sampel adalah sebagian data dari populasi. Contoh dari sampel misalnya "Peserta Kelas Industri Jurusan Bisnis Daring Pemasaran"
Peluang atau probabilitas sendiri dapat diartikan sebagai kesempatan atau kemungkinan yang mungkin terjadi dari suatu peristiwa.
3. Pemrograman Advance Python
Setelah kamu menguasai pemrograman dasar Python melalui kelas Pemrograman Dasar Python dan statistika, kamu bisa meningkatkan skill pemrograman Python dengan mengikuti kelas berikutnya yaitu Belajar Pemrograman Berorientasi Objek Phyton.
Pemrograman Advance Python sama-sama belajar tentang bahasa pemrograman Python. Tetapi pada Advance Python akan mempelajari hal yang lebih rumit seperti Object Oriented Programming (OOP), pewarisan, penggunaan library Python dan hal-hal lain yang lebih mendalam lagi.
4. Visualisasi Data
Pada visualisasi data, kita harus belajar mengenai teknik yang digunakan untuk mengkomunikasikan atau menyampaikan informasi dari data dengan menciptakan sebuah objek visual. Bentuk visualisasi data dapat berupa titik, garis, atau batang dalam grafik.
5. Machine Learning
Machine learning merupakan pengembangan algoritma dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas dengan mengandalkan pola. Secara singkat, machine learning merupakan sebuah kecerdasan buatan dimana sebuah PC akan diisikan sejumlah data yang berukuran besar dan akan diolah menggunakan algoritma.
Dengan mengandalkan pola, machine learning mampu untuk memprediksi hasil yang lebih akurat dari data yang dimasukan. Contohnya, seorang programmer yang menciptakan alat pembuat laporan keuangan perusahaan secara otomatis dari data-data transaksi yang telah dimasukan.
6. Manipulasi Data
Manipulasi data adalah penggambaran dari proses pengubahan struktur data agar menjadi informasi yang mudah dibaca. Kamu pernah menemui daftar hadir siswa saat kamu sekolah, bukan? Biasanya daftar hadir siswa dibuat urut sesuai abjad. Tentu saja hal tersebut akan mempermudah guru dalam melakukan absensi siswa setiap harinya tanpa harus mencari satu persatu secara acak.
Apa contoh manipulasi data di situs web? pada suatu web pasti memiliki sebuah log server web, sebuah fitur yang bisa digunakan untuk melihat traffic rate dan halaman website mana yang paling sering dilihat.
7. Deep Learning
Tahukah kamu, deep learning merupakan salah satu tipe teknik machine learning yang dimodelkan seperti otak manusia. Deep learning mampu bekerja menggunakan beberapa algoritma tertentu, karena hal tersebut deep learning banyak digunakan oleh aplikasi besar seperti Robot GO, alat pendeteksi paru-paru, Youtube, dan Netflix. Bahkan mobil tanpa pengemudi yang telah diciptakan juga menggunakan deep learning.
8. Data Story Telling
Data story telling adalah sebuah cara atau metode untuk menyampaikan informasi yang sudah disesuaikan dengan audiens tertentu. Sebelum hasil data dipresentasikan, data harus diterjemahkan terlebih dahulu menjadi bahasa yang umum. Kemampuan data story telling terletak pada cara menjelaskan data dengan narasi dan cerita yang menarik.
Cara menyampaikan data yang unik dan simpel akan dirasa lebih mudah untuk diterima dan dimengerti oleh orang lain dari berbagai kalangan. Story telling juga menjadi cara menyampaikan informasi yang terbukti keberhasilannya.
Baca Juga : Mengenal Profesi Data Scientist: Pengertian, Tugas, dan Skill Wajib
Di mana Bisa Belajar Data Science?
Data science dapat kita pelajari dari seminar, pelatihan, dan workshop. Bahkan sekarang banyak sekali Learning Management sistem (LMS) yang memberikan data science training. Untuk mengetahui lebih tentang LMS kamu bisa membaca artikel "Apa itu LMS (Learning Management System), Fitur Utama Belajar di Gamelab".
Untuk kamu yang belum memiliki latar belakang data science sama sekali jangan khawatir, karena untuk mempelajari data science kita harus belajar terlebih dahulu tentang pemrograman seperti dasar Python. Kamu bisa mempelajari ilmu pemrograman di kelas yang disediakan oleh Gamelab.id.
Materi di kelas Gamelab diberikan secara jelas, rinci, dan mudah dipahami untuk seseorang yang awam sekalipun. Di Gamelab kamu akan didampingi oleh trainer yang expert dibidangnya, jadi ketika kamu mengalami kesulitan kamu bisa menanyakan apapun kepada trainer. Kamu juga akan mendapatkan pengalaman belajar yang praktis dan fleksibel.
Dari peluang kerja dan kemudahan belajar tentang data science yang telah diberikan, apakah kamu masih ragu untuk belajar data science? Ayo belajar bersama Gamelab.id, klik di sini untuk memilih kelas.
Referensi
- IDC Prediksikan Jumlah Data Di Dunia Tahun Ini Bertumbuh Lebih Pesat[1]
- Introduction to Data Science [2]
- Apa Itu Data Science [3]
- Pengantar Data Science & Aplikasinya Bagi Pemula [4]
- Data Science: One of The Fastest Growing Occupations [5]
- Data Science What? [6]
- A Brief History of Data Science [7]
- Kenapa UMKM Kini Butuh Machine Learning? Ini Alasannya! [8]
- Linkedin 2020 Emerging Jobs Report [9]
- Statistika dan Teori Peluang [10]
- Apa itu Machine Learning? [11]