Video: Hadoop Processing Frameworks 2024
Seringkali dalam permulaan Hadoop, perbincangan yang banyak dipusatkan pada perwakilan NameNode dari titik kegagalan tunggal. Hadoop, secara keseluruhan, sentiasa mempunyai seni bina yang teguh dan tahan lama, dengan pengecualian kawasan utama ini. Tanpa NameNode, tidak ada cluster Hadoop.
Menggunakan Hadoop 2, anda boleh mengkonfigurasi HDFS supaya ada ActiveNode Aktif dan NameNode Standby. NameNode Standby perlu berada di nod induk khusus yang dikonfigurasi secara identik dengan nod induk yang digunakan oleh ActiveNode Aktif.
NameNode Standby tidak duduk dengan idly sementara NameNode mengendalikan semua permintaan alamat blok. NameNode Standby, dipertanggungjawabkan dengan menjaga keadaan lokasi blok dan menyekat metadata dalam ingatan, mengendalikan tanggungjawab pemeriksaan HDFS.
NameNode Aktif menulis entri jurnal pada perubahan fail kepada majoriti perkhidmatan JournalNode, yang dijalankan pada nod induk. ( Nota: Penyelesaian ketersediaan HDFS yang tinggi memerlukan sekurang-kurangnya tiga nod induk, dan jika terdapat lebih banyak, hanya terdapat nombor ganjil.)
Jika kegagalan berlaku, Standby Node pertama kali membaca semua entri jurnal yang lengkap (di mana majoriti Jurnal Nod mempunyai entri, dengan kata lain), untuk memastikan bahawa ActiveNode Aktif baru sepenuhnya konsisten dengan keadaan kluster.
Zookeeper digunakan untuk memantau NameNode Aktif dan mengendalikan logistik failover jika ActiveNode Aktif menjadi tidak tersedia. Kedua-dua NamaNode Aktif dan Berdiri telah mendedikasikan Pengawal Failover Zookeeper (ZFC) yang melakukan tugas pemantauan dan failover. Sekiranya berlaku kegagalan, ZFC memberitahu contoh Zookeeper pada kluster, yang kemudian memilih NameNode Aktif yang baru.
Apache Zookeeper menyediakan perkhidmatan penyelarasan dan konfigurasi untuk sistem yang diedarkan, jadi tidak hairanlah kami melihatnya digunakan di seluruh tempat di Hadoop.