Video: Langit Merah Jambi #AlamSemenit 2024
RegionServers adalah satu perkara, tetapi anda juga perlu melihat bagaimana wilayah masing-masing berfungsi. Di HBase, jadual kedua-duanya tersebar di beberapa WilayahServers dan terdiri daripada kawasan masing-masing. Oleh kerana jadual dipisahkan, pecahan menjadi wilayah. Kawasan menyimpan pelbagai pasangan nilai utama, dan setiap RegionServer menguruskan bilangan kawasan yang boleh dikonfigurasikan.
Tapi apa rupa rantau masing-masing? HBase adalah kedai data berorientasikan lajur, jadi bagaimana kawasan individu menyimpan pasangan nilai utama berdasarkan keluarga lajur yang mereka milik? Angka berikut bermula untuk menjawab soalan-soalan ini dan membantu anda mencerna lebih banyak maklumat penting mengenai seni bina HBase.
HBase ditulis di Jawa - seperti kebanyakan teknologi Hadoop. Java adalah bahasa pengaturcaraan berorientasikan objek dan teknologi yang elegan untuk pengkomputeran yang diedarkan. Oleh itu, apabila anda terus mengetahui lebih lanjut mengenai HBase, ingatlah bahawa semua komponen dalam seni bina adalah objek Java akhirnya.
Mula-mula, angka sebelum ini memberikan idea yang cukup baik tentang objek rantau yang sebenarnya kelihatan, secara amnya. Ia juga membuat jelas bahawa kawasan memisahkan data ke dalam keluarga lajur dan menyimpan data dalam HDFS menggunakan objek HFile.
Apabila pelanggan meletakkan pasangan nilai utama ke dalam sistem, kunci diproses supaya data disimpan berdasarkan keluarga lajur pasangan itu. Seperti yang ditunjukkan dalam gambar, setiap objek stor keluarga lajur mempunyai cache bacaan yang disebut BlockCache dan cache menulis dipanggil MemStore. BlockCache membantu dengan prestasi baca rawak.
Data dibaca dalam blok dari HDFS dan disimpan di BlockCache. Bacaan seterusnya untuk data - atau data yang disimpan dalam jarak dekat - akan dibaca dari RAM bukan cakera, meningkatkan prestasi keseluruhan. The Write Ahead Log (WAL, untuk pendek) memastikan bahawa menulis HBase anda boleh dipercayai. Terdapat satu WAL per RantauServer.
Sentiasa perhatikan Undang-undang Besi Pengkomputeran yang Diedarkan: Kegagalan bukanlah pengecualian - ia adalah kebiasaan, terutamanya apabila mengumpul ratusan atau bahkan ribuan pelayan. Google mengikuti Undang-undang Besi dalam merekabentuk BigTable dan HBase mengikutinya.
Apabila anda menulis atau mengubah suai data dalam HBase, data mula-mula diteruskan ke WAL, yang disimpan dalam HDFS, dan kemudian data ditulis ke cache MemStore. Pada selang yang boleh dikonfigurasikan, pasangan kunci utama yang disimpan di MemStore ditulis kepada HFiles dalam HDFS dan selepas itu entri HTML akan dipadamkan.
Sekiranya berlaku kegagalan selepas WAL awal tetapi sebelum MemStore terakhir tulis ke cakera, WAL boleh diulang untuk mengelakkan kehilangan data.
Tiga objek HFile berada dalam satu keluarga lajur dan dua di sebelah yang lain. Reka bentuk HBase adalah untuk memadamkan data keluarga lajur yang disimpan di MemStore kepada satu HFile setiap flush. Kemudian pada HFiles selang dikonfigurasikan digabungkan menjadi HFiles yang lebih besar. Strategi ini mengatasi operasi pemadatan kritikal di HBase.