Video: HBase Tutorial for Beginners | What is HBase in Hadoop | HBase Shell Commands 2024
Memulakan perbincangan mengenai arsitektur HBase (Hadoop Database) dengan menerangkan RegionServers dan bukannya MasterServer boleh mengejutkan anda. Istilah RegionServer nampaknya menyiratkan bahawa ia bergantung pada (dan menengah ke) MasterServer dan oleh itu anda harus membincangkan MasterServer terlebih dahulu. Bagaimanapun, lagu lama itu berlaku, "tidak semestinya begitu. "
RegionServers bergantung kepada MasterServer untuk fungsi tertentu, tetapi bukan dalam hubungan hubungan master-hamba untuk penyimpanan data dan pengambilan semula. Di sudut kiri atas angka, perhatikan bahawa pelanggan tidak menunjuk kepada MasterServer, tetapi sebaliknya ke kluster Zookeeper dan RegionServers.
MasterServer tidak berada dalam laluan untuk penyimpanan data dan akses - itulah tugas kumpulan Zookeeper dan RegionServers. Lihatlah fungsi utama MasterServer, yang juga merupakan proses perisian (atau daemon) seperti RegionServers. MasterServer berada di sana untuk
-
Memantau RegionServers dalam cluster HBase: MasterServer mengekalkan senarai AreaServers aktif dalam cluster HBase.
-
Mengendalikan operasi metadata: Apabila jadual dibuat atau atributnya diubah (tetapan mampatan, tetapan cache, versi, dan banyak lagi) MasterServer mengendalikan operasi dan menyimpan metadata yang diperlukan.
-
Berikan kawasan: MasterServer menyerahkan wilayah kepada RegionServers.
-
Kelola FailServer failover: Seperti mana-mana kluster teragih, anda berharap kegagalan nod tidak berlaku dan anda merancang untuk mereka juga. Apabila pelayan rantau gagal, Zookeeper memberitahu MasterServer supaya failover dan operasi pemulihan boleh dimulakan.
-
Mengawasi keseimbangan beban kawasan merentasi semua AreaServers yang tersedia: Anda mungkin ingat bahawa jadual terdiri daripada rantau yang sama rata di seluruh WilayahServers yang tersedia. Inilah kerja thread balancer (atau tugas , jika anda suka) yang MasterServer secara berkala mengaktifkan.
-
Mengurus (dan membersihkan) jadual katalog: Dua jadual katalog utama digunakan oleh sistem HBase untuk membantu pelanggan mencari pasangan nilai utama tertentu dalam sistem.
MasterServer menyediakan pengurusan jadual kritikal ini bagi pihak keseluruhan sistem HBase.
-
Kosongkan WAL: MasterServer berinteraksi dengan WAL semasa Failoverer Failover dan secara berkala membersihkan log.
-
Sediakan rangka kerja coprocessor untuk mengamati operasi induk: Berikut adalah satu lagi istilah baru untuk glosari HBase yang semakin berkembang. Coprocessors dijalankan dalam konteks MasterServer atau RegionServers. Sebagai contoh, penyemak imbas pengesan MasterServer membolehkan anda mengubah atau memanjangkan fungsi normal pelayan apabila operasi seperti penciptaan meja atau penghapusan meja berlaku. Seringkali, coprocessors digunakan untuk menguruskan indeks jadual untuk aplikasi HBase maju.
Coprocessor, yang dijalankan dalam konteks MasterServer dan atau RegionServer (atau kedua-duanya) boleh digunakan untuk meningkatkan keselamatan, membuat indeks sekunder, dan banyak lagi. Anda boleh mendapatkan lebih banyak maklumat mengenai coprocessors di blog komuniti HBase.
Seperti semua teknologi open source Hadoop, operasi MasterServer kemungkinan akan berubah dari masa ke masa apabila komuniti jurutera bekerja pada inovasi yang direka untuk meningkatkan HBase. Walau bagaimanapun, sejak penulisan ini, anda kini mempunyai senarai yang agak teliti yang berfungsi sebagai rujukan peringkat tinggi untuk MasterServer.
Akhirnya, satu lagi perkara penting yang perlu dijelaskan mengenai HBase MasterServer: Boleh ada dan harus menjadi MasterServer sandaran dalam mana-mana cluster HBase. Terdapat hanya satu MasterServer yang aktif pada bila-bila masa, jadi MasterServer sandaran adalah untuk kegagalan failover.
Anda mungkin ingat bahawa MasterServer tidak berada di laluan akses data untuk pelanggan HBase. Walau bagaimanapun, anda juga boleh mengingati bahawa MasterServer bertanggungjawab untuk tindakan seperti Failover RegionServer dan pengimbangan beban. Berita baiknya adalah bahawa pelanggan boleh terus menanyakan klas HBase jika tuannya turun tetapi untuk operasi kluster biasa, tuan tidak boleh teruskan untuk jangka waktu yang lama.