Rumah Kewangan Peribadi Peta Fasa peta HadoopMemurun Aplikasi - dummies

Peta Fasa peta HadoopMemurun Aplikasi - dummies

Video: Tutorial MapInfo (Tahap Perisapan) - Pembuatan Peta 2024

Video: Tutorial MapInfo (Tahap Perisapan) - Pembuatan Peta 2024
Anonim

Aplikasi MapReduce memproses data dalam pemisah input pada dasar rekod demi rekod dan setiap rekod dipahami oleh MapReduce menjadi kunci / nilai Pasangan . Selepas pemisahan input dikira, tugas pemetaan boleh mula memprosesnya - iaitu, selepas kemudahan penjadualan Pengurus Sumber memberikan mereka sumber pemprosesan. (Dalam Hadoop 1, JobTracker memberikan tugasan mapper ke slot pemprosesan khusus.)

Tugas pemetaan itu sendiri memproses inputnya berpecah satu rekod pada satu masa - dalam angka, rekod tunggal ini diwakili oleh pasangan kunci / nilai. Dalam kes data penerbangan kami, apabila pecahan input dikira (menggunakan kaedah pemprosesan fail lalai untuk fail teks), andaian adalah bahawa setiap baris dalam fail teks adalah satu rekod tunggal.

Bagi setiap rekod, teks baris itu sendiri mewakili nilai, dan offset byte setiap baris dari permulaan perpecahan dianggap sebagai kunci.

Anda mungkin tertanya-tanya mengapa nombor baris tidak digunakan dan bukannya offset byte. Apabila anda menganggap bahawa fail teks yang sangat besar dipecah menjadi banyak blok data individu, dan diproses sebagai banyak pecahan, nombor baris adalah konsep yang berisiko.

Bilangan baris dalam setiap perpecahan berbeza-beza, oleh itu adalah mustahil untuk mengira bilangan baris sebelum yang diproses. Walau bagaimanapun, dengan offset byte, anda boleh menjadi tepat, kerana setiap blok mempunyai bilangan bait tetap.

Seperti tugas pemetaan memproses setiap rekod, ia menghasilkan pasangan kunci / nilai baru: Kunci dan nilai di sini boleh sama sekali berbeza dari pasangan input. Output tugas mapper adalah koleksi penuh semua pasangan kunci / nilai ini.

Sebelum fail output akhir untuk setiap tugas mapper ditulis, output dibahagikan berdasarkan kunci dan disusun. Pembahagian ini bermaksud bahawa semua nilai bagi setiap kunci dikumpulkan bersama.

Dalam kes aplikasi sampel yang agak asas, hanya terdapat pengurang tunggal, jadi semua output tugas mapper dituliskan kepada satu fail. Tetapi dalam kes-kes dengan banyak reducers, setiap tugas mapper boleh menghasilkan banyak fail output juga.

Pecahan fail output ini berdasarkan pada kunci partitioning. Sebagai contoh, jika terdapat hanya tiga output kekunci partition yang berbeza untuk tugas-tugas pemetaan dan anda telah mengkonfigurasi tiga pengurangan untuk kerja, akan ada tiga fail output pemetaan. Dalam contoh ini, jika tugas pemetaan tertentu memproses pemisahan masukan dan menghasilkan output dengan dua daripada tiga kunci, hanya terdapat dua fail output.

Sentiasa mampatkan fail output tugas pemetaan anda. Manfaat terbesar di sini adalah dalam prestasi prestasi, kerana penulisan fail output yang lebih kecil meminimumkan kos yang tidak dapat dielakkan untuk memindahkan output mapper ke node di mana pengurangannya berjalan.

Pemisah lalai adalah lebih daripada mencukupi dalam kebanyakan situasi, tetapi kadang-kadang anda mungkin mahu menyesuaikan bagaimana data dibahagikan sebelum diproses oleh reducers. Sebagai contoh, anda mungkin mahu data dalam keputusan anda ditetapkan disusun oleh kunci dan nilai mereka - dikenali sebagai jenis menengah .

Untuk melakukan ini, anda boleh menggantikan partition lalai dan melaksanakan sendiri. Proses ini memerlukan sedikit perhatian, bagaimanapun, kerana anda ingin memastikan bahawa jumlah rekod dalam setiap partition adalah seragam. (Jika pengurangan perlu memproses lebih banyak data daripada pengurangan yang lain, anda akan menunggu kerja MapReduce anda selesai manakala pengurang kerja yang satu lagi menyumbat melalui set data yang tidak seimbang.)

Menggunakan fail perantaraan bersaiz seragam, anda boleh memanfaatkan lebih paralelisme yang terdapat dalam pemprosesan MapReduce.

Peta Fasa peta HadoopMemurun Aplikasi - dummies

Pilihan Editor

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Jika anda telah memulakan jejak sosial metrik media dan menikmati kurniaan data yang kini dapat dilihat, dihidupkan, dan digunakan, anda mungkin tertanya-tanya apa yang mungkin menyebabkan kemurungan! Mudah: kehilangan data. Katakanlah bahawa anda mempunyai masalah tapak atau entah bagaimana kehilangan akses ke tapak atau data anda. Adakah anda mempunyai sandaran anda ...

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Mana-mana kempen baru, laman web, akaun Twitter, halaman Facebook, atau item lain yang anda ingin ukur dengan metrik media sosial bermula pada sifar. Nombor ini boleh membuat anda merasa seperti anda bercakap dengan tidak sah, bercakap dengan diri anda atau anda tersembunyi dari pandangan. Perasaan ini boleh membawa kepada pengasingan secara keseluruhan ...

Meracuni Google Spider - dummies

Meracuni Google Spider - dummies

Anda sentiasa dapat mencari orang yang ingin menyimpang dari lurus dan sempit. Ya, mereka adalah orang bodoh yang terlibat dalam taktik pengoptimuman berisiko yang bertujuan untuk menggerakkan PageRank secara artifisial, memanipulasi pesanan halaman hasil carian di Google, dan mendapatkan kelebihan yang tidak adil dalam indeks. Google, dengan reputasi yang luar biasa untuk melindungi, ...

Pilihan Editor

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Di laman web anda memberikan wawasan yang penting. Anda boleh memikirkan sama ada pengunjung sedang melihat cepat, kemudian pergi, atau sama ada mereka bertahan lebih lama dan sebenarnya membaca bahan dalam talian anda dengan tujuan untuk mengambil tindakan. Jika majoriti pelawat laman web anda tidak ...

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Laman web perniagaan sangat mirip dengan merancang kedai dengan pemasaran produk dalam fikiran. Malah, laman web anda benar-benar adalah kedai - kedai maya di Internet. Rangkaian kedai runcit telah menghabiskan berjuta-juta dolar dalam penyelidikan pasaran, menonton dan mendokumentasikan bagaimana pembeli memasuki kedai, belok kanan atau kiri, dan ...

Analitik web Untuk Menipu Cheat Sheet - dummies

Analitik web Untuk Menipu Cheat Sheet - dummies

Melakukan analisis laman web tidak perlu meletihkan dan intensif masa. Anda boleh meringkaskan prestasi keseluruhan laman web anda dengan cepat - jika anda tahu apa yang perlu dicari. Alat analisis web percuma dan kos rendah boleh membantu anda mengukur kejayaan laman web anda, dan anda boleh menjana perujuk tapak dengan pelbagai cara yang tidak mungkin ...

Pilihan Editor

Cara Memaksimumkan Ruang pada Laman Web - dummies

Cara Memaksimumkan Ruang pada Laman Web - dummies

Terlalu terhad, anda boleh membuat penggunaan kreatif beberapa teknologi di luar sana untuk memaksimumkan antara muka anda. Untuk setiap teknik berikut yang diterangkan, terdapat banyak laman web yang menawarkan sampel kod, forum, dan sumber untuk membantu anda memulakan. Accordions. Antara muka akordion membolehkan ...

Cara Mendapatkan Corak CSS3 Online - dummies

Cara Mendapatkan Corak CSS3 Online - dummies

Mencipta kesan mudah untuk laman CSS3 menggunakan gradien mudah . Walau bagaimanapun, mewujudkan sesuatu yang benar-benar hebat memerlukan masa dan keupayaan artistik. Kebanyakan pemaju benar-benar tidak mempunyai masa atau kemahiran yang diperlukan untuk mencipta sesuatu yang mempesonakan menggunakan CSS3 sahaja (atau CSS3 digabungkan dengan grafik) - di sinilah pereka bermain. Ramai pereka yang membolehkan anda ...

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Terdapat banyak pelayar dan versi pelayar yang berbeza gunakan hari ini. Tidak semua daripada mereka adalah optimum untuk CSS3. Inilah tempat Modernizr dimainkan. Pemajunya menyebutnya "perpustakaan JavaScript yang mengesan ciri HTML5 dan CSS3 dalam pelayar pengguna. "Anda menggunakan Modernizr untuk melaksanakan tugas secara pilihan dan memasukkan ciri aplikasi berdasarkan ...