Video: Our Miss Brooks: Exchanging Gifts / Halloween Party / Elephant Mascot / The Party Line 2024
Sebelum anda dapat menjalankan skrip Babi pertama anda di Hadoop, anda perlu mengendalikan bagaimana program Babi boleh dibungkus dengan pelayan Babi.
Babi mempunyai dua mod untuk menjalankan skrip:
-
Mod Tempatan: Semua skrip dijalankan pada mesin tunggal tanpa memerlukan Hadoop MapReduce dan HDFS. Ini berguna untuk membangun dan menguji logik babi. Sekiranya anda menggunakan set data kecil kepada pemaju atau menguji kod anda, maka mod tempatan mungkin lebih cepat daripada melalui infrastruktur MapReduce.
Mod tempatan tidak memerlukan Hadoop. Apabila anda menjalankan dalam mod Templat, program Babi berjalan dalam konteks mesin Java Virtual Java, dan akses data adalah melalui sistem fail setempat mesin tunggal. Mod tempatan sebenarnya merupakan simulasi tempatan MapReduce dalam kelas LocalJobRunner Hadoop.
-
MapReduce mode (juga dikenali sebagai mod Hadoop): Babi dilaksanakan di cluster Hadoop. Dalam kes ini, Skrip Pig akan ditukar menjadi satu siri pekerjaan MapReduce yang kemudiannya dijalankan pada cluster Hadoop.
Jika anda mempunyai terabyte data yang anda mahu lakukan operasi dan anda ingin membangunkan program secara interaktif, anda mungkin akan menemui perkara yang perlahan dan anda akan mula mengembangkan simpanan anda. Mod tempatan membolehkan anda bekerja dengan subset data anda dengan cara yang lebih interaktif supaya anda dapat memikirkan logik (dan mengatasi pepijat) program Babi anda.
Selepas anda menetapkan sesuatu yang anda mahu dan operasi anda berjalan dengan lancar, anda boleh menjalankan skrip dengan set data penuh menggunakan mod MapReduce.