Hamba Node dan Gagal Disk dalam HDFS - dummies

Video: How to Build and Install Hadoop on Windows 2024

Seperti kematian dan cukai, kegagalan cakera (dan memberi masa yang cukup, bahkan nod atau kegagalan rak), tidak dapat dielakkan dalam Sistem Fail Teragih Hadoop (HDFS). Dalam contoh yang ditunjukkan, walaupun satu rak gagal, kumpulan itu dapat terus berfungsi. Prestasi akan menderita kerana anda telah kehilangan separuh sumber pemprosesan anda, tetapi sistem masih dalam talian dan semua data masih tersedia.

Dalam senario di mana pemacu cakera atau nod hamba gagal, pelayan metadata pusat untuk HDFS (dipanggil NameNode) akhirnya mendapati blok fail yang disimpan pada sumber gagal tidak lagi tersedia. Contohnya, jika Slave Node 3 gagal, ia bermakna Blok A, C, dan D kurang terikat .

Dengan kata lain, terlalu sedikit salinan blok ini boleh didapati di HDFS. Apabila HDFS merasakan bahawa satu blok kurang mendapat perhatian, ia memerintahkan salinan baru.

Untuk meneruskan contohnya, katakan bahawa Slave Node 3 kembali dalam talian selepas beberapa jam. Sementara itu, HDFS telah memastikan bahawa terdapat tiga salinan semua blok fail. Jadi sekarang, Blok A, C, dan D mempunyai empat salinan masing-masing dan overreplicated . Seperti halnya blok kurang difahami, pelayan metadata pusat HDFS akan mengetahui tentang ini juga, dan akan memesan satu salinan setiap fail yang akan dipadamkan.

Salah satu hasil yang baik dari ketersediaan data ialah apabila kegagalan cakera berlaku, tidak perlu segera menggantikan pemacu keras yang gagal. Ini boleh dilakukan dengan lebih berkesan pada selang masa yang dijadualkan.