Apa itu Data Understanding? - Artificial Intelligence (AI)

apa-itu-data-understanding.jpg

Data Understanding adalah sebuah tahapan di dalam metodologi sains data dan pengembangan Artificial Intelligence (AI) yang bertujuan untuk mendapatkan pemahaman awal mengenai data yang dibutuhkan untuk memecahkan permasalahan bisnis yang diberikan. Permasalahan bisnis yang terdefinisi dengan baik berperan sebagai dasar untuk menentukan data apa saja yang dibutuhkan. Apabila solusi AI dikembangkan demi memecahkan permasalahan bisnis tersebut, maka data dapat dianalogikan sebagai bahan mentah yang diperlukan untuk membangun solusi AI tersebut.

Data biasanya tersedia dalam bentuk kumpulan-kumpulan data yang dapat berada dalam keadaan terpisah-pisah, ataupun terintegrasi secara ketat dan rumit. Masing-masing kumpulan data tersebut pada awalnya dibuat dengan maksud dan tujuan tertentu yang tidak hanya berbeda satu sama lainnya, namun juga dapat berbeda dengan tujuan pengembangan yang tersirat dari definisi permasalahan bisnis yang dihadapi. Oleh sebab itu, setiap kumpulan data tersebut memiliki kekuatan dan batasannya masing-masing serta tingkat kesesuaian yang berbeda-beda dengan permasalahan bisnis yang akan dipecahkan. Akibatnya, pengembangan solusi AI untuk permasalahan bisnis tersebut mungkin saja membutuhkan perpaduan beberapa kumpulan data dari sumber-sumber yang berbeda.

Sebagai contoh, data yang berada di dalam basis data pelanggan, basis data transaksi, dan basis data pemasaran dari sebuah perusahaan yang sama akan mencakup aspek informasi yang berbeda atas sebuah populasi pelanggan yang sama. Tidak hanya itu, masing-masing sumber data tersebut akan memiliki tingkat kekayaan (richness) data serta keandalan (reliability) data yang berbeda-beda pula. Di sini, tahapan data understanding dimaksudkan untuk memberikan gambaran awal tentang kekuatan dan batasan data serta tingkat kesesuaiannya dengan permasalahan bisnis sebelum langkah-langkah pengembangan solusi AI yang lebih lanjut dapat dilakukan dengan baik.

Di samping untuk mendapatkan gambaran awal mengenai data, tahapan data understanding juga berguna untuk mengetahui ketersediaan data. Ada data yang tersedia secara terbuka dan bebas. Ada pula data yang untuk mendapatkannya membutuhkan biaya (uang) atau penyiapan sumber daya dan usaha tersendiri. Bahkan, ada data yang justru belum tersedia pada saat dibutuhkan untuk pengembangan solusi AI sehingga perlu diselenggarakan suatu proyek pembuatan atau pengumpulan data tersendiri untuk mendapatkannya.

Secara umum, tahapan data understanding dimulai dengan masukan berupa definisi permasalahan bisnis yang jelas beserta deskripsi proses bisnis yang relevan dengan permasalahan bisnis tersebut. Dari masukan ini, beberapa langkah berikut dapat dilakukan secara paralel jika memungkinkan.

  1. Langkah Pertama adalah identifikasi bagian-bagian di dalam proses bisnis yang mana data (yang sudah ada ataupun belum) dapat berpengaruh terhadap jalannya proses bisnis tersebut. Di samping itu, pengetahuan di dalam organisasi (baik dari individu-individu yang menguasai maupun dari suatu sistem manajemen pengetahuan) yang relevan terhadap bagian-bagian proses bisnis tersebut juga diidentifikasi. Hal ini akan membantu penentuan ruang lingkup pengembangan solusi AI dan sains data yang dilakukan.
  2. Langkah Kedua adalah menentukan sumber-sumber data internal dan eksternal organisasi, mekanisme aksesnya, beserta hal-hal lain yang dapat membantu atau justru menghalangi diperolehnya data tersebut. Hal ini dilakukan pada setiap bagian dalam proses bisnis yang mana data mutlak dibutuhkan. Di samping itu, perlu ditentukan pula apakah data yang dibutuhkan tidak dapat diperoleh atau tidak tersedia di sumber manapun.
  3. Langkah Ketiga adalah berupa asesmen (assessment) pada setiap kumpulan data yang ditentukan di atas untuk menentukan nilai tambah bisnis yang dapat diraih apabila solusi AI dan sains data dapat direalisasikan dengan data tersebut. Pada langkah ini, perlu diputuskan untuk data yang tidak tersedia atau tidak dapat diperoleh dari sumber manapun apakah usaha pengumpulan data yang terpisah perlu dilakukan, misalnya survei lapangan atau simulasi tambahan.
  4. Langkah Keempat adalah mengidentifikasi data lain baik dari sumber internal maupun eksternal organisasi yang dapat membawa perbaikan pada proses bisnis melalui solusi AI yang dibangun. Data lain yang dimaksud di sini merupakan data tambahan di luar data yang mutlak dibutuhkan untuk mendapatkan solusi AI untuk permasalahan bisnis di atas. Data-data tambahan ini kemudian dapat pula dikumpulkan dan dijadikan bahan pengembangan solusi AI tersebut apabila manfaat penggunaannya melebihi biaya dan usaha yang harus dikeluarkan untuk mendapatkannya.

Realisasi keempat langkah di atas membutuhkan penguasaan teknik-teknik pengambilan data serta telaah data. Langkah pertama, kedua, dan keempat banyak melibatkan teknik-teknik pengambilan data, sementara langkah ketiga dapat direalisasikan dengan bantuan teknik-teknik telaah data. Teknik-teknik telaah data menggunakan metode-metode statistika serta visualisasi.

Itulah artikel Apa itu Data Understanding? - Artificial Intelligence (AI) kali ini, semoga bermanfaat.

Posting Komentar untuk "Apa itu Data Understanding? - Artificial Intelligence (AI)"