Video: MongoDB Sharding Tutorial | What is Sharding | MongoDB Tutorial for Beginners | Simplilearn 2024
Pangkalan data NoSQL sangat sesuai untuk dataset yang sangat besar. Klon besar seperti HBase tidak terkecuali. Anda mungkin ingin menggunakan beberapa pelayan komoditi yang murah dalam kelompok tunggal dan bukan satu mesin yang sangat kuat. Ini kerana anda boleh mendapatkan prestasi yang lebih baik secara keseluruhan setiap dolar dengan menggunakan banyak pelayan komoditi, dan bukan satu-satunya pelayan yang kuat dan mahal.
Sebagai tambahan untuk dapat meningkatkan dengan cepat, pelayan komoditi yang murah juga boleh membuat perkhidmatan pangkalan data anda lebih berdaya tahan dan dengan itu membantu mengelakkan kegagalan perkakasan. Ini kerana anda mempunyai pelayan lain untuk mengambil alih perkhidmatan itu jika motherboard pelayan tunggal gagal. Ini tidak berlaku dengan satu pelayan besar sahaja.
Angka menunjukkan konfigurasi HBase yang sangat tersedia dengan contoh pemisahan data di kalangan pelayan.
Rajah menunjukkan dua nod (HRegionServers) dalam persediaan yang sangat tersedia, masing-masing bertindak sebagai sandaran untuk yang lain.
Dalam banyak persediaan pengeluaran, anda mungkin mahu sekurang-kurangnya tiga nod untuk ketersediaan yang tinggi untuk memastikan dua kegagalan pelayan yang rapat dalam masa satu sama lain dapat dikendalikan. Ini tidak seperti yang jarang anda fikirkan! Nasihat berbeza mengikut Bigtable; sebagai contoh, HBase mengesyorkan lima nod sebagai minimum untuk kluster:
-
Setiap pelayan rantau mengurus set kuncinya sendiri.
Merancang strategi peruntukan kunci baris adalah penting kerana ia menentukan bagaimana beban tersebar di seluruh kelompok.
-
| Setiap wilayah mengekalkan log tulis dan kedai dalam memori.
Dalam HBase, semua data ditulis ke dalam kedai memori, dan kemudian kedai ini dibuang ke cakera. Pada cakera, kedai-kedai ini dipanggil menyimpan fail .
HBase menafsirkan menyimpan fail sebagai fail tunggal, tetapi pada hakikatnya, mereka diedarkan dalam ketulan di seluruh Sistem Fail Teragih Hadoop (HDFS). Ini menyediakan kelajuan ingest dan retrieval yang tinggi kerana semua operasi I / O besar tersebar di banyak mesin.
Untuk memaksimumkan ketersediaan data, secara lalai, Hadoop mengekalkan tiga salinan setiap fail data. Pemasangan besar mempunyai
-
Salinan utama
-
Replikasi dalam rak yang sama
-
Satu lagi replika dalam rak yang berbeza
Sebelum Hadoop 2 0, Namenodes tidak boleh dibuat sangat tinggi. Ini mengekalkan senarai semua pelayan aktif dalam kelompok. Oleh itu, mereka adalah satu titik kegagalan. Sejak Hadoop 2 0, had ini tidak lagi wujud.