Strategi Atasi Tantangan Data Tak Terstruktur

Berdasarkan evolusi keamanan yang terjadi di Asia, kawasan bertumbuh ini belum menjadi “ladang” yang kondusif untuk menyemai kesadaran tentang keamanan informasi.

Info Komputer - - Expert Says - MATTHEW HARDMAN DIRECTOR TECHNICAL EXPERTS, DATA INTELLIGENCE, HITACHI VANTARA

KETIKA kami memperkenalkan konsep Software Defined Data Center (SDDC) beberapa tahun lalu, hanya sedikit yang memahami bahwa dampaknya akan sejauh ini terhadap industri. SDDC adalah

game changer bagi profesional TI, terlebih bagi para pelanggan.

Sungguh luar biasa lompatan teknologi ini dalam membentuk bisnis modern, tapi pendorong sesungguhnya di balik kebutuhan akan virtual SAN atau virtual switch adalah bisnis mendambakan insight (wawasan)— insight mengenai kinerjan, pelanggan, kompetisi, penawaran dan lain-lain. Dan

insight tersebut bisa didapat hanya dengan data.

Jika Anda sudah menerima fakta bahwa data akan menjadi inti dari investasi organisasi, berarti Anda harus mulai memikirkan teknologi apa yang akan memampukan cara terbaik dalam penyerapan ( ingestion), penyimpanan, dan kemampuan akses data. Dan sangat penting untuk memahami bahwa tidak semua data sama. Data Terstruktur vs Tak Terstruktur Pada akhirnya, semua data akan terurai menjadi angka 1 and 0 saja, tapi data dalam format

binary tersebut tidak sepenuhnya bermanfaat. Ada dua jenis data yang kita kenal saat ini dan nanti. Data terstruktur, yakni data yang terdapat dalam struktur, seperti tabel di database, dengan format yang formal dan wajib, diletakkan dalam kolom dan baris, seperti spreadsheet di Excel. Yang kedua adalah data tidak terstruktur, yakni data yang tidak memiliki struktur formal, sehingga tidak bisa diuraikan ke dalam kolom dan baris. Contohnya, gambar,

call log, video, hasil pemindaian, dan lain-lain.

Ironisnya, rasio di antara keduanya sangat tidak imbang. Pertama, data bertambah secara eksponensial dalam hal kecepatan, bahkan lebih cepat dari yang kita bayangkan. Hal Varian, Chief Economist Google, mengatakan bahwa mulai dari saat peradaban dimulai hingga tahun 2003, kita menciptakan hanya 5 e abyte data dan sekarang, kita menciptakan data sebesar itu setiap dua hari. Jangan lupakan perangkat

mobile dan perangkat pintar yang kita gunakan saat ini dan apa yang kita lakukan dengan alat tersebut—foto, chat, video,

emoticon— setiap interaksi tersebut menghasilkan data. Apalagi dengan bertambahnya jumlah mesin-mesin komersial yang menghasilkan ribuan

data point setiap detiknya. Dan faktanya adalah, semua itu merupakan data tak terstruktur.

Ketika organisasi sibuk membangun sistem pengelolaan data terstruktur seharga jutaan dolar, pertumbuhan data tak terstruktur juga terus terjadi. Salah pendorong utamaya adalah perangkat-perangkat Internet of Things (IoT) yang bervolume tinggi dan berbiaya rendah.

Menurut Gartner, bisnis akan menghabiskan lebih banyak biaya untuk IoT yang akan mencapai US$ 3 triliun di tahun 2020. Dengan perangkat-perangkat yang menghasilkan data dalam interval lebih pendek ini, bisnis akan

menghadapi kesulitan yang lebih besar ketika meng- capture datadata dari perangkat tersebut dan memanfaatkannya untuk analisis serta memperoleh insight, dalam rangka mengoptimalisasi proses yang ada dan memanfaatkan peluang-peluang baru. Oleh karena itu, data

center masa depan harus mampu menangani data yang telah kita kelola sejak dulu (data terstruktur) dan siap menghadapi ledakan data yang akan kita ungkap di masa depan (data tak terstruktur).

Metadata, Jawaban untuk Data Tak Terstruktur

Kita mungkin cukup akrab dengan data terstruktur—data yang kita simpan di database, di dalam baris dan kolom pada tabel, yang dapat kita panggil dengan mudah melalui Structured Query Language (SQL). Sebaliknya, untuk satu data tak terstruktur, misalnya gambar, Anda tidak dapat menjalankan uery seperti pada tabel, misalnya nama orang di gambar tersebut. Namun inilah jenis data yang kini berkembang secara eksponensial dan mewakili nilai yang sangat besar tapi belum terungkap.

Agar data itu menjadi bermanfaat, dibutuhkan

metadata. etadata adalah data yang dapat dicari atau ditemukan yang mendeskripsikan sebuah data sehingga memampukan Anda menggunakan uery untuk membantu mengidentifikasi data dan mengubahnya menjadi bernilai. etadata merupakan kunci untuk menemukan insight yang bernilai, tapi karena ini jenis data yang berbeda, Anda membutuhkan cara yang berbeda pula untuk menanganinya.

Strategi Storage Ungkap Potensi Data Tak Terstruktur

ata center dirancang berdasarkan arsitektur data yang tersimpan di dalamnya dan saat ini kebanyakan dari data itu datang dari sistem terstruktur. Sistem utama di balik data dan sistem terstruktur adalah block storage yang telah melayani

enterprise dengan sangat baik melalui kinerja dan resiliensinya yang makin tinggi. Namun dengan pertumbuhan cepat data tak terstruktur, organisasi melihat adanya tantangan pada upaya-upaya meletakkan data tak terstruktur di sistem terstruktur, atau tepatnya di block storage.

Contoh yang tepat untuk ini adalah platform kolaboratif berbasis web. Setiap file, yang kebanyakan adalah data tak terstruktur dan diunggah ke

library disimpan sebagai Binary Large Object (BLOB) dalam

database. Ketika semakin banyak user yang mengunggah, database dengan sangat cepat menjadi penuh yang akhirnya menurunkan kinerja dan perusahaan harus membeli lisensi database lagi untuk menangani muatan file.

Platform ob ect storage menawarkan solusi yang lebih baik. File diletakkan pada struktur

flat, tanpa hierarki file atau blok untuk mendefinisikanya sebagai

sistem storage lain. b ect storage juga dapat mengelola

metadata yang terkait dengan setiap ob ect, di mana ini menjadi kunci untuk mencari data asli dan insight. Akses menuju semua

ob ect ini dapat dilakukan melalui protokol berstandar industri.

Contoh perusahaan yang bergantung pada ob ect storage dan metadata adalah Spotify. Perusahaan ini mengelola jutaan lagu yang tidak dapat dilakukan melalu hierarki file padahal setiap lagu harus bisa dicari dan dipanggil dengan cepat.

Ada banyak jenis data lainnya dalam organisasi kita yang dapat menuai manfaat dari teknologi

ob ect storage, misalnya file user, log, gambar, call log, dan lainlain. Ketika kita perkaya ob ect

ob ect itu dengan metadata, data-data itu menjadi mudah diidentifikasi dan bernilai tinggi

Langkah Memulai

Salah satu contoh platform ob ect

storage yang memampukan perusahaan mengelola data tak terstruktur adalah Hitachi Content Platform yang dibekali dengan kemampuan data intelligence. Platform ini memampukan penyimpanan ob ect dan pengelolaan metadata, ditambah dengan kemampuan pengelolaan

compliance dari ob ect untuk kebutuhan legal dan lain-lain. Seiring upaya memodernisasi

data center, perusahaan harus memahami jenis-jenis data yang akan dikelola saat ini dan nanti. Pengelolaan data tak terstruktur adalah sesuatu yang harus Anda pertimbangkan, karena volume jenis data ini dengan cepat melampaui jumlah data yang kita simpan dalam sistem data terstruktur. Dan data tak terstruktur menawarkan potensi yang tak terhingga nilainya. IK

Newspapers in Indonesian

Newspapers from Indonesia

© PressReader. All rights reserved.