Rumah Kewangan Peribadi Babi Latin dalam Program Babi Hadoop - babi

Babi Latin dalam Program Babi Hadoop - babi

Video: 02 - Apache Pig Tutorial For Beginners With Examples - Pig Latin Commands 2024

Video: 02 - Apache Pig Tutorial For Beginners With Examples - Pig Latin Commands 2024
Anonim

Babi Latin adalah bahasa untuk program Babi. Babi menerjemahkan skrip Latin Pig ke MapReduce pekerjaan yang boleh dilaksanakan dalam cluster Hadoop. Apabila datang dengan Pig Latin, pasukan pembangunan mengikuti tiga prinsip reka bentuk utama:

  • Tetap mudah . Pig Latin menyediakan kaedah yang diperkemas untuk berinteraksi dengan Java MapReduce. Ini merupakan abstraksi, dengan kata lain, yang memudahkan penciptaan program selari pada cluster Hadoop untuk mengalir dan analisis data. Tugasan kompleks mungkin memerlukan siri transformasi data yang saling berkaitan - siri sedemikian dikodkan sebagai urutan data .

    Menulis transformasi data dan mengalir sebagai skrip Latin Pig dan bukan program Java MapReduce menjadikan program-program ini lebih mudah untuk menulis, memahami, dan mengekalkan kerana a) anda tidak perlu menulis tugas di Java, b) anda tidak perlu berfikir dari segi MapReduce, dan c) anda tidak perlu membuat kod tersuai untuk menyokong jenis data yang kaya.

    Babi Latin menyediakan bahasa yang lebih mudah untuk mengeksploitasi kluster Hadoop anda, sehingga memudahkan lebih banyak orang memanfaatkan kekuatan Hadoop dan menjadi produktif lebih cepat.

  • Jadikannya pintar. Anda mungkin ingat bahawa Pig Latin Compiler berfungsi untuk mengubah program Latin Pig ke dalam satu siri kerja Java MapReduce. Silap mata ini adalah untuk memastikan bahawa pengkompil dapat mengoptimumkan pelaksanaan kerja-kerja Jawa MapReduce secara automatik, yang membolehkan pengguna memberi tumpuan kepada semantik dan bukannya bagaimana untuk mengoptimumkan dan mengakses data.

    Untuk anda jenis SQL di luar sana, perbincangan ini akan terdengar akrab. SQL didirikan sebagai pertanyaan perihal yang anda gunakan untuk mengakses data berstruktur yang disimpan dalam RDBMS. Enjin RDBMS pertama menerjemahkan pertanyaan kepada kaedah akses data dan kemudian melihat statistik dan menghasilkan satu siri pendekatan akses data. Pengoptimasi berasaskan kos memilih pendekatan yang paling berkesan untuk pelaksanaan.

  • Jangan batasi pembangunan. Buat Babi extensible supaya pemaju dapat menambah fungsi untuk menangani masalah perniagaan mereka.

Gudang data tradisional RDBMS menggunakan corak pemprosesan data ETL, di mana anda e mengeluarkan data dari sumber luar, t memperkenalkannya agar sesuai dengan keperluan operasi anda, dan kemudian > l yang memasuki sasaran akhir, sama ada ia merupakan kedai data operasi, gudang data, atau lain-lain varian pangkalan data. Walau bagaimanapun, dengan data besar, anda biasanya ingin mengurangkan jumlah data yang telah anda usahakan, sehingga anda akhirnya membawa pemprosesan ke data itu sendiri.

Bahasa untuk aliran data Babi, oleh itu, mengambil laluan pada pendekatan ETL lama, dan pergi dengan ELT sebagai gantinya:

E xtract data dari pelbagai sumber anda, l oad ia menjadi HDFS, dan kemudian t memperkenalkannya sebagai perlu untuk menyediakan data untuk analisis selanjutnya.

Babi Latin dalam Program Babi Hadoop - babi

Pilihan Editor

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Jika anda telah memulakan jejak sosial metrik media dan menikmati kurniaan data yang kini dapat dilihat, dihidupkan, dan digunakan, anda mungkin tertanya-tanya apa yang mungkin menyebabkan kemurungan! Mudah: kehilangan data. Katakanlah bahawa anda mempunyai masalah tapak atau entah bagaimana kehilangan akses ke tapak atau data anda. Adakah anda mempunyai sandaran anda ...

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Mana-mana kempen baru, laman web, akaun Twitter, halaman Facebook, atau item lain yang anda ingin ukur dengan metrik media sosial bermula pada sifar. Nombor ini boleh membuat anda merasa seperti anda bercakap dengan tidak sah, bercakap dengan diri anda atau anda tersembunyi dari pandangan. Perasaan ini boleh membawa kepada pengasingan secara keseluruhan ...

Meracuni Google Spider - dummies

Meracuni Google Spider - dummies

Anda sentiasa dapat mencari orang yang ingin menyimpang dari lurus dan sempit. Ya, mereka adalah orang bodoh yang terlibat dalam taktik pengoptimuman berisiko yang bertujuan untuk menggerakkan PageRank secara artifisial, memanipulasi pesanan halaman hasil carian di Google, dan mendapatkan kelebihan yang tidak adil dalam indeks. Google, dengan reputasi yang luar biasa untuk melindungi, ...

Pilihan Editor

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Di laman web anda memberikan wawasan yang penting. Anda boleh memikirkan sama ada pengunjung sedang melihat cepat, kemudian pergi, atau sama ada mereka bertahan lebih lama dan sebenarnya membaca bahan dalam talian anda dengan tujuan untuk mengambil tindakan. Jika majoriti pelawat laman web anda tidak ...

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Laman web perniagaan sangat mirip dengan merancang kedai dengan pemasaran produk dalam fikiran. Malah, laman web anda benar-benar adalah kedai - kedai maya di Internet. Rangkaian kedai runcit telah menghabiskan berjuta-juta dolar dalam penyelidikan pasaran, menonton dan mendokumentasikan bagaimana pembeli memasuki kedai, belok kanan atau kiri, dan ...

Analitik web Untuk Menipu Cheat Sheet - dummies

Analitik web Untuk Menipu Cheat Sheet - dummies

Melakukan analisis laman web tidak perlu meletihkan dan intensif masa. Anda boleh meringkaskan prestasi keseluruhan laman web anda dengan cepat - jika anda tahu apa yang perlu dicari. Alat analisis web percuma dan kos rendah boleh membantu anda mengukur kejayaan laman web anda, dan anda boleh menjana perujuk tapak dengan pelbagai cara yang tidak mungkin ...

Pilihan Editor

Cara Memaksimumkan Ruang pada Laman Web - dummies

Cara Memaksimumkan Ruang pada Laman Web - dummies

Terlalu terhad, anda boleh membuat penggunaan kreatif beberapa teknologi di luar sana untuk memaksimumkan antara muka anda. Untuk setiap teknik berikut yang diterangkan, terdapat banyak laman web yang menawarkan sampel kod, forum, dan sumber untuk membantu anda memulakan. Accordions. Antara muka akordion membolehkan ...

Cara Mendapatkan Corak CSS3 Online - dummies

Cara Mendapatkan Corak CSS3 Online - dummies

Mencipta kesan mudah untuk laman CSS3 menggunakan gradien mudah . Walau bagaimanapun, mewujudkan sesuatu yang benar-benar hebat memerlukan masa dan keupayaan artistik. Kebanyakan pemaju benar-benar tidak mempunyai masa atau kemahiran yang diperlukan untuk mencipta sesuatu yang mempesonakan menggunakan CSS3 sahaja (atau CSS3 digabungkan dengan grafik) - di sinilah pereka bermain. Ramai pereka yang membolehkan anda ...

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Terdapat banyak pelayar dan versi pelayar yang berbeza gunakan hari ini. Tidak semua daripada mereka adalah optimum untuk CSS3. Inilah tempat Modernizr dimainkan. Pemajunya menyebutnya "perpustakaan JavaScript yang mengesan ciri HTML5 dan CSS3 dalam pelayar pengguna. "Anda menggunakan Modernizr untuk melaksanakan tugas secara pilihan dan memasukkan ciri aplikasi berdasarkan ...