Video: Crystal Widjaja - Pemanfaatan Big Data di dalam Bisnis GO-JEK | BukaTalks 2024
Gudang data, lapisan 4 daripada timbunan data besar, dan rakannya data mart, telah lama menjadi teknik utama yang digunakan organisasi untuk mengoptimumkan data untuk membantu pembuat keputusan. Kebiasaannya, gudang data dan tong mengandung data yang dinormalkan yang dikumpulkan dari pelbagai sumber dan dipasang untuk memudahkan analisa perniagaan.
Gudang data dan kent memudahkan penyediaan laporan dan visualisasi item data yang berbeza. Mereka biasanya dicipta dari pangkalan data hubungan, pangkalan data multidimensional, fail rata, dan pangkalan objek - pada dasarnya apa-apa seni bina simpanan. Dalam persekitaran tradisional, di mana prestasi mungkin tidak menjadi keutamaan yang paling tinggi, pilihan teknologi yang didasarkan didorong oleh keperluan untuk analisis, pelaporan, dan visualisasi data syarikat.
Oleh kerana organisasi data dan kesediaannya untuk analisis adalah kunci, kebanyakan pelaksanaan gudang data disimpan semasa melalui pemprosesan batch. Masalahnya adalah bahawa gudang data yang dimuatkan oleh batch dan data marts mungkin tidak mencukupi untuk banyak aplikasi data besar. Tegasan yang dikenakan oleh aliran data halaju tinggi mungkin memerlukan pendekatan yang lebih tepat masa untuk gudang data besar.
Ini tidak bermakna bahawa anda tidak akan membuat dan memberi makan data analitik gudang atau data mart dengan proses batch. Sebaliknya, anda mungkin mempunyai gudang data berganda atau data data, dan prestasi dan skala akan mencerminkan keperluan masa para penganalisis dan pembuat keputusan.
Oleh kerana banyak gudang data dan data data terdiri daripada data yang dikumpulkan dari pelbagai sumber dalam syarikat, kos yang berkaitan dengan pembersihan dan penormalkan data juga harus ditangani. Dengan data besar, anda dapati beberapa perbezaan utama:
-
Aliran data tradisional (dari transaksi, aplikasi, dan sebagainya) boleh menghasilkan banyak data yang berbeza.
-
Puluhan sumber data baru juga wujud, masing-masing memerlukan beberapa tahap manipulasi sebelum ia dapat tepat pada masanya dan berguna untuk perniagaan.
-
Sumber kandungan juga perlu dibersihkan, dan ini mungkin memerlukan teknik yang berbeza daripada yang mungkin anda gunakan dengan data berstruktur.
Secara sejarah, kandungan gudang data dan data data telah dianjurkan dan dihantar kepada pemimpin perniagaan yang bertanggungjawab terhadap strategi dan perancangan. Dengan data besar, satu set pasukan baru memanfaatkan data untuk membuat keputusan.
Banyak pelaksanaan data yang besar menyediakan keupayaan masa nyata, jadi perniagaan harus dapat menyampaikan kandungan untuk membolehkan individu yang mempunyai peranan operasional untuk menangani isu-isu seperti sokongan pelanggan, peluang penjualan, dan gangguan perkhidmatan dalam waktu dekat.Dengan cara ini, data besar membantu memindahkan tindakan dari pejabat belakang ke pejabat depan.
Alat dan teknik analisis sedia ada akan sangat membantu dalam memahami data besar. Walau bagaimanapun, terdapat tangkapan. Algoritma yang merupakan sebahagian daripada alat ini harus dapat berfungsi dengan banyak data berpotensi yang nyata dan berbeza. Infrastruktur perlu ada untuk menyokongnya.
Dan, vendor yang menyediakan alat analisis juga perlu memastikan bahawa algoritma mereka berfungsi di seluruh pelaksanaan yang diedarkan. Oleh kerana kerumitan ini, mengharapkan kelas alat baru untuk membantu memahami data besar.
Terdapat tiga kelas alat dalam lapisan seni bina rujukan ini. Mereka boleh digunakan secara bebas atau secara kolektif oleh pembuat keputusan untuk membantu memimpin perniagaan. Tiga kelas alat adalah seperti berikut:
-
Pelaporan dan papan pemuka: Alat ini menyediakan & ldquo; mesra pengguna & rdquo; perwakilan maklumat dari pelbagai sumber. Walaupun menjadi teras dalam dunia data tradisional, kawasan ini masih berkembang untuk data besar. Beberapa alat yang digunakan adalah yang tradisional yang kini boleh mengakses jenis pangkalan data baru yang dinamakan NoSQL (Bukan Hanya SQL).
-
Visualisasi: Alat ini adalah langkah seterusnya dalam evolusi pelaporan. Output cenderung sangat interaktif dan dinamik. Satu lagi perbezaan penting antara laporan dan output visual adalah animasi. Pengguna perniagaan boleh melihat perubahan dalam data yang menggunakan pelbagai teknik visualisasi yang berbeza, termasuk peta minda, peta haba, maklumat grafik, dan gambarajah sambungan. Pelaporan dan visualisasi berlaku pada akhir aktiviti perniagaan.
-
Analytics dan analisis lanjutan: Alat ini menjangkau gudang data dan memproses data untuk penggunaan manusia. Analisis lanjutan hendaklah menerangkan trend atau peristiwa yang berubah, unik, atau revolusioner terhadap amalan perniagaan yang sedia ada. Analisa ramalan dan analitik sentimen adalah contoh yang baik dalam sains ini.