Ayo ketahui Perbedaan Data Analyst, Data Scientist, dan Data Engineer!

Data adalah sekumpulan keterangan ataupun fakta yang dibuat dengan kata-kata, kalimat, simbol, angka, dan lainnya, didapatkan melalui sebuah proses pencarian dan juga pengamatan yang tepat berdasarkan sumber-sumber tertentu. pengertian lain dari data adalah sebagai suatu kumpulan keterangan atau deskripsi dasar yang berasal dari obyek ataupun kejadian.

  1. Data Analyst

Seorang data analyst bertugas mengumpulkan, membersihkan, dan menafsirkan kumpulan data untuk menjawab pertanyaan atau memecahkan masalah sesuai dengan proyek yang sedang diamati.

Seorang Data Analyst dapat bekerja di banyak industri, termasuk bisnis, keuangan, sains, kedokteran, pemerintahan, dan masih banyak lagi.

Selama proses menganalisis data, seorang data analyst sering menggunakan berbagai macam tools (alat) yang membantu pekerjaan mereka lebih akurat dan efisien.

Beberapa tools tersebut seperti Microsoft Excel, Google Spreadsheet, SQL, Tableau, R atau Python, SAS, Microsoft Power BI, dan Jupyter Notebooks.

fyi, Sebagian besar profesional tingkat pemula yang tertarik untuk terjun ke dunia profesi terkait data dimulai sebagai data analyst.

  1. Data Scientist

Data scientist adalah pekerjaan yang tugasnya adalah untuk mengumpulkan, menafsirkan, dan menganalisis kumpulan data besar (big data), baik yang terstruktur maupun tidak terstruktur.

Pekerjaan data analyst dan data engineer memang dapat terlihat serupa. Keduanya bertugas menemukan trend atau pola dalam data untuk mengungkapkan cara baru bagi perusahaan untuk membuat keputusan bisnis yang lebih baik. Tetapi, data scientist cenderung memiliki tanggung jawab lebih 

Keterampilan yang umumnya harus dimiliki data scientist adalah keahlian di bidang matematika dan statistik, mahir menggunakan berbagai tools (seperti big data tools, machine learning, deep learning, dan lainnya), menguasai bahasa pemrograman (seperti SQL, Python, R, dan lainnya), komunikasi yang baik, dan lain sebagainya.

  1. Data Engineer

Data Engineer adalah pekerjaan bertugas untuk membangun dan memonitor sistem/arsitektur manajemen data yang ada di sebuah perusahaan.

Nantinya sistem akan dimanfaatkan untuk mengumpulkan, mengolah, dan mengubah data mentah yang berjumlah besar atau big data menjadi informasi yang dapat digunakan oleh data scientist dan data analyst.

Tujuan utama dari profesi ini adalah membuat data dapat dengan mudah diakses sehingga perusahaan dapat menggunakannya untuk mengevaluasi dan mengoptimalkan kinerja bisnis perusahaan.

Untuk menjadi data engineer, ada berbagai keterampilan yang harus dimiliki seperti menguasai bahasa pemrograman (Python, Java, R, Hadoop, NoSQL, dan lainnya), databases ETL tools, pipeline, shell script, machine learning, dan lainnya.

Itulah beberapa perbedaan dan penjelasan mengenai Data Scientist, Data Analyst, dan Data Engineer, Semoga bermanfaat !

Perkembangan Ilmu Statistika dan Kaitannya dengan Sains Data

Pembelajaran mengenai Sains Data tidak akan terlepas dari ilmu statistika yang
menjadi salah satu pegangan ilmu utama dalam penerapan sains data. Hampir segala bentuk
kegiatan yang dilakukan dalam bidang sains data akan melibatkan ilmu statistika. Statistika
sendiri memiliki sejarah panjang dalam peradaban manusia. Jauh pada jaman sebelum masehi,
statistika telah digunakan oleh bangsa-bangsa Mesopotamia,Cina, dan Mesir untuk
mengumpulkan data menganai besar pajak yang harus dibayar oleh penduduk, jumlah hasil
pertanian yang diproduksi, jumlah pendapatan hasil perdagangan, dan lain sebagainya. Adapun
di masa abad pertengahan, statistika digunakan oleh lembaga gereja untuk mencatat data
kelahiran, kematian, dan perkawinan, serta perceraian. Namun tahukah kamu bagaimana
sejarah perkembangan statistika di dunia ?
Statistika berasal dari kata “status” yang berarti negara. Pada awalnya statistika
berkaitan dengan ilmu mengenai angka-angka (keterangan) berdasarkan perintah raja atau
orang yang memimpin suatu wilayah untuk mengetahui kekayaan negara, jumlah penduduk,
hasil pertanian, modal, dan lain sebagainya. Dari hal tersebut, maka terciptalah Teknik
pencatatan angka-angka pengamatan dalam bentuk daftar dan grafik. Statistika yang
mempelajari cara mengumpulkan dan menyederhanakan data disebut dengan statistika
deskriptif. Statistika deskriptif bisa berkembang tanpa memerlukan dasar matematika yang
kuat, selain kecermatan dalam teknik berhitung. Analisis data pada tahun 1700-an dilakukan
secara deskriptif berdasarkan table frekuensi, rataan, dan ragam sampel. Di tahun 1800-an
menjadi masa awal penggunaan grafik untuk menyajikan data seperti histogram, yang sejalan
dengan penemuan sebaran (kurva) normal. Pada statistika deskriptif tidak ada perbedaan antara
data yang diperoleh dari sampel dengan populasinya dan apa yang dihitung dari sampel yang
digunakan untuk menandai populasi.Oleh karena itu orang-orang pada masa itu mulai mencari
metode lain untuk menyempurnakan kesimpulan dalam melakukan ramalan populasi
berdasarkan angka-angka statistik yang dikumpulkan. Pada akhirnya ilmu statistika semakin
berkembang dengan ditemukannya teori probabilitas dan teori pengambilan keputusan yang
digunakan pada semua bidan dalam kehidupan sehari-hari. Pada tahun 1950-an statistika mulai
digunakan untuk pengambilan keputusan melalui proses generalisasi dan peramalan dengan
memperhatikan factor risiko dan ketidakpastian.
Ilmu statsitika memiliki banyak kaitan dan manfaat dalam segala aspek di kehidupan
sehari-hari terutama di bidang sians data. Jadi apa arti dari statistika ? Perlu diketahui bahwa
statistika perlu dibedakan dengan statistik. Statistik adalah kumpulan angka yang tersusun dari
satu angka atau lebih. Sedangkan statistika adalah ilmu untuk mengumpulkan, Menyusun,
menganalisis, menyajikan, menginterpretasikan suatu data untuk menjadi informasi untuk
membantu pengambilan keputusan yang efektif. Definisi ini hampir sama dengan definisi
umum dari ilmu sains data.
Mengapa statistika penting dipelajari dalam ilmu sains data ? Pada dasarnya ilmu
mengenai statistika menjadi dasar penting bagi seorang data scientist untuk memiliki
pengetahuan dan kemampuan seseorang untuk melakukan evaluasi terhadap suatu data.

Penulis : Alifia Zahra Winesti (Divisi Kominfo)

Manfaat Artificial Intelligence(AI) dalam Kehidupan Manusia

Artificial Intelligence(AI) atau kecerdasan buatan dalam bahasa indonesia, adalah kecerdasan yang dimiliki oleh manusia yang dimodelkan di dalam mesin dan diprogram agar bisa berpikir seperti halnya manusia AI juga merupakan salah satu bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola. AI biasanya dikaitkan dengan hal hal futuristik dan robot.

Saat ini, teknologi AI sudah sering kita temui dalam kehidupan sehari hari, contohnya adalah google asisten, siri, dan alexa yang merupakan asisten virtual dan bekerja dengan menggunakan teknologi AI, sistem rekomendasi yang biasa kita temukan saat membuka aplikasi dan web e-commerce juga merupakan penerapan dari AI.

Berikut adalah beberapa manfaat Artificial intelligence dalam kehidupan manusia:

  1. Meningkatkan produktivitas 

  dengan adanya AI yang dapat bekerja secara efisien dan cepat, tentunya pekerjaan dapat dilakukan dengan lebih cepat dan menghasilkan lebih banyak dibandingkan manusia, sehingga dapat membantu manusia dalam mengerjakannya dan produktivitasnya akan meningkat.

  1. Cepat, dan efisien

AI yang bekerja secara otomatis dapat dengan cepat melakukan suatu pekerjaan contohnya fitur fitur dalam aplikasi pengedit foto, yang hanya dengan sekali klik dapat mengganti background, mengubah warnanya, bahkan menghilangkan objek tertentu dalam foto.

  1. Membantu meminimalkan kesalahan manusia

fitur fitur seperti autocorrect dalam keyboard, co-pilot di github dapat sangat membantu dalam pekerjaan manusia, sehingga pekerjaan dapat dilakukan lebih cepat dan tepat, contoh lainnya fitur AI di kendaraan roda empat, seperti mobil yang sudah dapat menggunakan sensor untuk menghindari hambatan di jalan raya, dan mengemudi sendiri, tentunya akan meminimalisir terjadinya kecelakaan lalu lintas.

  1. Otomatisasi

pekerjaan pekerjaan yang berkaitan dengan penyeleksian akan dapat dengan mudah dilakukan secara otomatis menggunakan AI, contohnya deteksi spam dalam email, dan bahkan dapat mendeteksi virus.

Itulah beberapa contoh manfaat AI dalam kehidupan manusia, karena teknologi apabila digunakan dengan benar maka akan membawa berbagai manfaat untuk kehidupan umat manusia.

Berkenalan dengan Machine Learning

Pengertian

Machine Learning adalah salah satu cabang dari ilmu data science dan merupakan komponen penting dari bidang ilmu tentang perkembangan data. Melalui penggunaan statistik, algoritma machine learning dilatih untuk membuat klasifikasi atau prediksi dalam pengembangan data. menurut IBM machine learning merupakan cabang dari kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan algoritma untuk meniru cara manusia belajar dan secara bertahap dapat meningkatkan akurasinya.

 Manfaat Machine Learning

manfaat machine learning sangat banyak dalam dunia industri, contohnya yaitu machine learning akan sangat membantu dalam proses analisis data besar dan kompleks, sehingga tugas bisa diselesaikan secara cepat dan akurat karena Machine Learning mampu membaca pola..  Kemampuan adaptasi mesin juga  akan mempermudah Anda yang bekerja di bidang industri, selain itu machine learning juga mampu membuat sebuah tugas yang manual menjadi otomatis yang bisa mempermudah manusia untuk melakukan tugas tersebut menjadi cepat dan tanpa perlu perintah manusia secara real-time.

Cara Kerja

Cara kerja dari machine learning yaitu pertama train dataset menggunakan contoh-contoh dan setelah itu barulah dapat menjawab suatu pertanyaan terkait. Berbeda dengan program statis, machine learning diciptakan untuk membentuk program yang dapat belajar sendiri.

Dari data tersebut, komputer akan melakukan proses training untuk menghasilkan suatu model. Proses belajar ini menggunakan algoritma machine learning sebagai penerapan teknik statistika. Model inilah yang menghasilkan informasi, kemudian dapat dijadikan pengetahuan untuk memecahkan suatu permasalahan sebagai proses input-output. Model yang dihasilkan dapat melakukan klasifikasi ataupun prediksi ke depan.

Untuk memastikan efisiensi model yang terbentuk, data akan dibagi menjadi data pembelajaran (train dataset) dan data pengujian (test dataset). Pembagian data yang digunakan bervariasi bergantung algoritma yang digunakan. Pada umumnya train dataset lebih banyak dari test dataset, misalnya dengan rasio 3:1. Test dataset digunakan untuk menghitung seberapa efisien model yang dihasilkan untuk melakukan klasifikasi atau prediksi kedepan yang disebut test score. Semakin banyak data yang digunakan, test score yang dihasilkan semakin baik. Nilai test score berada dalam rentang 0-1.

Mengenal Data Science

Di era teknologi saat ini, data menjadi salah satu elemen terpenting dalam industri di berbagai bidang yang digunakan sebagai alat untuk menganalisa dan mengambil keputusan dimasa depan. Seiring berjalannya waktu, kegiatan manusia semakin banyak serta beragam, hal ini menjadikan jumlah data menjadi semakin banyak dan besar. Hal tersebut akan menyulitkan pengelola data untuk mengelola data besar tersebut dengan cara manual. Diperlukan usaha yang ekstra untuk mengumpulkan, merapikan, serta menganalisa data yang terus berkembang. Inilah yang menjadi alasan mengapa data science sangat dibutuhkan untuk mengatur kebijakan pengolahan data yang cepat, tepat serta akurat.

Data Science merupakan bidang ilmu multidisipliner yang mempelajari ilmu komputer, pemrograman, teknologi, serta matematika statistika yang akan menggunakan data sebagai alat penyelesaian masalah untuk mencari tau hal apa yang terjadi saat ini, penyebab hal tersebut terjadi, langkah apa yang harus diambil, serta apa antisipasi yang perlu dipersiapkan dimasa mendatang. Secara garis besar, data science merupakan ilmu yang mengekstrak informasi atau pengetahuan dari data. Data science tidak terlepas dari algoritma machine learning atau pembelajaran mesin, dimana segala bentuk data baik teks, gambar, video, audio, dan lain-lain akan diolah untuk menghasilkan kecerdasan buatan yang akan dirancang untuk melakukan berbagai tugas yang dapat meringankan pekerjaan manusia. Namun perlu diketahui bahwa ilmu data dan ilmu komputer merupakan dua bidang ilmu yang berbeda. Ilmu komputer berkaitan dengan pembuatan algoritma dan program yang akan merekam dan memproses data, sedangkan ilmu data mencakup segala jenis analisis dan pengolahan data yang dilakukan menggunakan atau tidak menggunakan komputer dengan meliputi pengetahuan ilmu statistika matematika.

 Berbicara mengenai Data Science, istilah Data Science pertama kali dipopulerkan oleh seorang data scientist bernama DJ Patil dan Jeff Hammerbacher. Bermula dari John Turkey yang menulis tentang pergeseran dan perkembangan statistic pada tahun 1962, dimana ia menjelaskan bahwa gabungan dari ilmu statistika dan ilmu komputer dapat meringkas waktu penyajian hasil analisis yang dapat menyelesaikan proses pengolahan data hanya dalam hitungan jam, berbada dengan cara manual yang akan menghabiskan waktu hingga berhari-hari bahkan berminggu-minggu. Di tahun 1974, Peter Naur menulis sebuah survey singkat terkait metode komputer dan menggunakan istilah data science pada survey tersebut. Pada tahun 1977 terbentuk sebuah asosiasi internasional untuk perhitungan statistic yang dikenal dengan nama International Association for Statistical Computing atau IASC. Dimana asosiasi ini memiliki misi untuk menghubungkan metodologi statistik tradisional, teknologi komputer, serta pengetahuan para ahli untuk mengubah data menjadi sebuah pengetahuan atau informasi. Di tahun yang sama, Turkey menulis makalah keduanya dengan judul Exploratory Data Analysis. Dalam makalah ini, Turkey menjelaskan pentingnya penggunaan data dalam memilih hipotesis yang akan diuji dan menjelaskan bahwa perlunya kerjasama antara analisis konfirmatori dan analisis data eksplorasi. Pada tahun 1994, data science mulai masuk ke dunia marketing. Sekitar tahun 2011, daftar pekerjaan untuk data scientist meningkat hingga sebesar 15% seiring dengan perkembangan teknologi Artificial Intelligence pada saat itu.

Selama beberapa tahun terakhir hingga saat ini, data science terus berkembang dan mendapat sorotan di seluruh bidang industri. Saat ini, seorang data scientist menjadi sangat berharga bagi sebuah perusahaan. Mereka rela membayar mahal seorang data scientist untuk membantu meningkatkan kinerja perusahaannya. Data science menjadi bagian penting dalam dunia bisnis dan penelitian akademis. Penerapan ilmu data science berguna untuk mempermudah segala rencana dan kegiatan di berbagai bidang. Semakin maju sebuah peradaban, semakin banyak data yang akan dihasilkan, maka semakin penting peran seorang ahli data science dalam kehidupan.

Penulis : Alifia Zahra Winesti (Divisi Kominfo)