Video: MYGDX – LANCAR PERKONGSIAN MAKLUMAT AGENSI KERAJAAN [15 JAN 2018] 2024
Gudang data kini berada di bawah tekanan, cuba mengatasi peningkatan tuntutan ke atas sumber terhad mereka. Hadoop dapat memberikan kelegaan yang signifikan dalam situasi gudang data ini.
Peningkatan pesat dalam jumlah data yang dijana di dunia juga telah mempengaruhi gudang data kerana jumlah data yang mereka uruskan semakin meningkat - sebahagiannya kerana lebih banyak data berstruktur , jenis data yang sangat ditaip dan diletakkan ke dalam baris dan lajur - dihasilkan tetapi juga kerana anda sering perlu menangani keperluan pengawalseliaan yang direka untuk mengekalkan akses kepada data sejarah.
Di samping itu, kuasa pemprosesan dalam gudang data sering digunakan untuk melakukan transformasi data hubungan kerana ia sama ada memasuki gudang itu sendiri atau dimuatkan ke anak data mart (subset berasingan bagi gudang data) untuk aplikasi analitik tertentu.
Selain itu, keperluan semakin meningkat bagi penganalisis untuk mengeluarkan pertanyaan baru terhadap data tersusun yang disimpan di gudang, dan pertanyaan ad hoc ini sering boleh menggunakan sumber-sumber pemprosesan data yang penting. Kadang kala laporan satu kali cukup memadai, dan kadang-kadang analisis penerokaan diperlukan untuk mencari pertanyaan yang belum diminta namun dapat menghasilkan nilai bisnis yang signifikan.
Intinya ialah gudang data sering digunakan untuk tujuan melebihi reka bentuk asalnya.
Angka itu menunjukkan, menggunakan seni bina peringkat tinggi, bagaimana Hadoop boleh hidup bersama dengan gudang data dan memenuhi beberapa tujuan yang mereka tidak direka untuk.
Hadoop adalah gudang pembantu, bukan pengganti gudang. Hadoop boleh memodenkan ekosistem pergudangan data dalam empat cara; di sini mereka adalah ringkasan:
-
Sediakan zon mendarat untuk semua data.
-
Tekan data untuk menyediakan arkib data sejuk yang dapat dicari.
-
Memanfaatkan kecekapan pemprosesan batch berskala besar Hadoop untuk memproses dan mengubah data untuk gudang.
-
Membolehkan persekitaran untuk penemuan data ad hoc.