Video: Moving Data to the Cloud - Data Warehouse vs Data Lake. What is Best? 2024
Gudang data zaman sekarang ini kelihatan seperti gudang data rumit yang mewah. Gudang data esok, walaupun - data warehouse tertinggi - akan kelihatan agak berbeza. Terdapat beberapa perusahaan yang telah meneroka ke arah ini, walaupun disebabkan oleh kos dan keupayaan keseluruhan, masih jarang mencari banyak suplemen gudang data.
Bilangan subjek dalam gudang data tertinggi tidak terhad kerana gudang data maya; ia tidak semua terkandung dalam satu pangkalan data atau bahkan dalam pelbagai pangkalan data yang anda sendiri beban dan mengekalkan.
Sebaliknya, hanya sebahagian daripada gudang anda (mungkin sebahagian kecil) terletak secara fizikal di beberapa pelayan gudang data; selebihnya ada di ruang siber di suatu tempat, diakses melalui keupayaan rangkaian seolah-olah semuanya merupakan sebahagian daripada beberapa gudang data yang berpusatkan secara fizikal. Dengan gudang data yang tertinggi, pengguna gudang anda mempunyai bilangan subjek yang tidak terbatas - apa-apa yang mungkin menarik minat mereka.
Fikirkan bagaimana anda menggunakan Internet hari ini untuk mengakses laman web di seluruh dunia - tapak yang dicipta dan dikekalkan orang lain. Sekarang, bayangkan setiap laman web ini mengandungi maklumat tentang beberapa kawasan khusus yang menarik bagi anda - daripada iklan, iklan kerja, kedai elektronik, dan apa sahaja yang anda habiskan waktu melayari Internet yang cuba dicari.
Bayangkan juga bahawa anda boleh membuat pertanyaan dan menjalankan laporan dengan menggunakan kandungan satu atau lebih laman web ini sebagai input anda. Itulah model gudang data tertinggi: membuka kemungkinan yang tidak terhad kepada pengguna.
Syarikat-syarikat terkemuka mula mengejar dan menyampaikan penumpuan lancar pelbagai jenis data: dokumen naratif, video, imej, dan data biasa (seperti maklumat nombor dan karakter). Satu gudang data yang tertinggi mempunyai semua ini - semua jenis data yang anda perlukan untuk menyokong pengambilan keputusan perniagaan yang lebih baik.
Dari segi jumlah kapasiti, gudang data tertinggi adalah besar; ia melebihi had hari ini. Pengedaran maklumat di banyak platform yang berbeza, infrastruktur rangkaian yang lebih pantas dan lebih tinggi, dan semakin banyak sistem pengurusan pangkalan data yang "lebih bijak" - sebagai tambahan, sememangnya, meningkatkan kapasiti penyimpanan cakera yang mantap -meningkatkan pengembangan kapasiti ini.