Store Big Data dengan HBase - dummies - Kewangan Peribadi 2024

Video: Query dengan BigQuery 2024

HBase adalah pangkalan data diedarkan, tidak berkaitan (kolumnar) yang menggunakan HDFS sebagai kedai ketahanannya untuk projek data besar. Ia dimodelkan selepas Google BigTable dan mampu menganjurkan meja yang sangat besar (berbilion tiang / baris) kerana ia berlapis pada cluster Hadoop perkakasan komoditi.

HBase menyediakan akses baca / tulis secara rawak, masa nyata kepada data besar. HBase sangat boleh dikonfigurasikan, memberikan banyak kelonggaran untuk menangani sejumlah besar data dengan cekap. Sekarang lihatlah bagaimana HBase boleh membantu menangani cabaran data besar anda.

HBase adalah pangkalan data kolumnar, jadi semua data disimpan dalam jadual dengan baris dan lajur yang sama dengan sistem pengurusan pangkalan data relasional (RDBMSs). Persimpangan baris dan lajur dipanggil sel. Satu perbezaan penting antara jadual HBase dan jadual RDBMS adalah versi.

Setiap nilai sel termasuk atribut "versi", yang tidak lebih daripada satu cap waktu yang unik mengenal pasti sel. Versi trek perubahan dalam sel dan memungkinkan untuk mengambil sebarang versi kandungan sekiranya perlu. HBase menyimpan data dalam sel dalam mengurangkan pesanan (menggunakan timestamp), jadi bacaan akan selalu mencari nilai yang paling baru terlebih dahulu.

Lajur dalam HBase tergolong dalam keluarga lajur. Nama keluarga lajur digunakan sebagai awalan untuk mengenal pasti ahli keluarganya. Sebagai contoh, buah-buahan: epal dan buah-buahan: pisang adalah ahli keluarga kolum buah. Pelaksanaan HBase ditalaikan di peringkat keluarga ruang, jadi penting untuk berhati-hati bagaimana Anda akan mengakses data dan seberapa besar anda mengharapkan lajur itu.

Baris dalam jadual HBase juga mempunyai kunci yang berkaitan dengan mereka. Struktur kekuncinya sangat fleksibel. Ia boleh menjadi nilai dikira, rentetan, atau bahkan struktur data lain. Kuncinya digunakan untuk mengawal akses kepada sel-sel di baris, dan ia disimpan dalam perintah dari nilai rendah kepada nilai tinggi.

Semua ciri-ciri ini bersama-sama membentuk skema. Skema ditakrifkan dan dibuat sebelum sebarang data boleh disimpan. Walaupun begitu, jadual boleh diubah dan keluarga lajur baru boleh ditambah selepas pangkalan data selesai dan berjalan. Kelanjutan ini sangat berguna apabila berurusan dengan data besar kerana anda tidak selalu mengetahui tentang pelbagai aliran data anda.