Video: Building Hadoop Pipelines using Apache Crunch 2024
Untuk membantu anda memulakan Hadoop, berikut adalah arahan tentang bagaimana untuk memuat turun dan menetapkan Hadoop dengan cepat pada komputer riba anda sendiri. Kelompok anda akan berjalan dalam mod pseudo-diedarkan pada mesin maya, jadi anda tidak memerlukan perkakasan khas.
A mesin maya (VM) adalah komputer simulasi yang boleh dijalankan di komputer sebenar. Sebagai contoh, anda boleh menjalankan program pada komputer riba anda yang "memainkan" VM, yang membuka tetingkap yang kelihatan seperti ia menjalankan komputer lain. Sebenarnya, komputer berpura-pura sedang berjalan di dalam komputer sebenar anda.
Anda akan memuat turun VM, dan semasa menjalankannya, anda akan memasang Hadoop.
Apache Bigtop adalah alternatif hebat jika anda ingin memasang komponen Hadoop anda sendiri. Bigtop mengumpulkan komponen teras Hadoop untuk anda dan memastikan bahawa konfigurasi anda berfungsi. Apache Bigtop adalah pengedaran sumber terbuka 100 peratus.
Matlamat utama Bigtop - sendiri projek Apache, seperti Hadoop - adalah untuk membina komuniti di sekitar pembungkusan, penempatan, dan integrasi projek dalam ekosistem Apache Hadoop. Tumpuan adalah pada sistem secara keseluruhan dan bukan pada projek individu.
Menggunakan Bigtop, anda boleh memasang dan menggunakan komponen Hadoop dengan mudah tanpa perlu mengesannya dalam pengedaran tertentu dan memadankannya dengan versi Hadoop tertentu. Sebagai versi baru komponen Hadoop dibebaskan, mereka kadang-kadang tidak berfungsi dengan siaran terbaru projek-projek lain. Jika anda sendiri, ujian penting diperlukan.
Dengan Bigtop (atau pelepasan Hadoop komersial) anda boleh mempercayai bahawa pakar Hadoop telah melakukan ujian ini untuk anda. Untuk memberikan idea tentang betapa luasnya Bigtop yang telah diperoleh, lihat senarai berikut semua komponen termasuk dalam Bigtop:
-
Apache Crunch
-
Apache Flume
-
Apache Giraph
-
Apache HBase
-
Apache HCatalog
-
Apache Hive
-
Apache Mahout
-
Apache Oozie
-
Apache Pig
-
Apache Solr
-
Apache Sqoop
-
Apache Whirr
-
Apache Zookeeper
-
Cloudera Hue
-
DataFu
projek utama dan kecil dimasukkan. Apache Bigtop terus berkembang.