Rumah Kewangan Peribadi Membandingkan Hadoop Distributions - dummies

Membandingkan Hadoop Distributions - dummies

Video: Hp Samsung Kamu Asli Atau Palsu ? Ini Cara Mengetahuinya 2024

Video: Hp Samsung Kamu Asli Atau Palsu ? Ini Cara Mengetahuinya 2024
Anonim

Anda akan mendapati bahawa ekosistem Hadoop mempunyai banyak bahagian komponen, semuanya wujud sebagai projek Apache mereka sendiri. Kerana Hadoop telah berkembang dengan pesat, dan menghadapi beberapa perubahan penting, versi berbeza dari komponen komuniti sumber terbuka mungkin tidak sepenuhnya kompatibel dengan komponen lain. Ini menimbulkan kesukaran yang besar bagi orang yang ingin mendapatkan permulaan bebas dengan Hadoop dengan memuat turun dan menyusun projek secara langsung dari Apache.

Red Hat adalah, untuk ramai orang, model bagaimana untuk berjaya menghasilkan wang dalam pasaran perisian sumber terbuka. Apa yang dilakukan oleh Red Hat adalah dengan mengambil Linux (sistem operasi sumber terbuka), mengikat semua komponen yang diperlukan, membina pemasang mudah, dan memberi sokongan berbayar kepada mana-mana pelanggan.

Dengan cara yang sama Red Hat telah menyediakan pembungkusan yang berguna untuk Linux, beberapa syarikat telah menggabungkan Hadoop dan beberapa teknologi berkaitan ke dalam distribusi Hadoop mereka sendiri. Senarai ini menerangkan yang lebih penting:

  • Cloudera : Mungkin pemain terkenal di lapangan, Cloudera dapat menuntut Doug Cutting, pengasas bersama Hadoop, sebagai ketua arkiteknya. Cloudera dilihat oleh ramai orang sebagai peneraju pasaran di ruang Hadoop kerana ia mengeluarkan distribusi Hadoop komersil pertama dan merupakan penyumbang kod yang sangat aktif terhadap ekosistem Hadoop.

    Cloudera Enterprise, sebuah produk yang diposisikan oleh Cloudera di tengah-tengah apa yang dikenali sebagai "Hub Data Perusahaan", termasuk Pengedaran Cloudera untuk Hadoop (CDH), pengedaran berasaskan sumber Hadoop dan projek-projek yang berkaitan juga sebagai Pengurus Cloudera miliknya. Juga termasuk adalah langganan sokongan teknikal bagi komponen teras CDH.

    Model perniagaan utama Cloudera telah lama didasarkan pada keupayaannya untuk memanfaatkan pengedaran CDH yang popular dan menyediakan perkhidmatan dan sokongan berbayar. Pada musim gugur 2013, Cloudera secara rasmi mengumumkan bahawa ia memberi tumpuan kepada menambah komponen tambah nilai proprietari di atas sumber terbuka Hadoop untuk bertindak sebagai pembeda.

    Juga, Cloudera telah menjadikannya satu amalan biasa untuk mempercepatkan penggunaan kod sumber terbuka alpha dan beta untuk siaran Hadoop yang lebih baru. Pendekatannya adalah untuk mengambil komponen yang dianggap matang dan mengubahnya ke dalam perpustakaan sumber terbuka siap sedia yang dimasukkan dalam pengedarannya.

  • EMC : HD yang sangat penting, iaitu distribusi Apache Hadoop dari EMC, menggabungkan teknologi pangkalan data pemprosesan besar-besaran EMC (MPP) pangkalan data EMC (dahulu dikenali sebagai Greenplum, dan kini dikenali sebagai HAWQ) dengan Apache Hadoop.Hasilnya adalah taburan Hadoop berprestasi tinggi dengan pemprosesan SQL yang benar untuk Hadoop. Pertanyaan berasaskan SQL dan alat perisikan perniagaan lain boleh digunakan untuk menganalisis data yang disimpan dalam HDFS.

  • Hortonworks : Pemain utama lain dalam pasaran Hadoop, Hortonworks mempunyai jumlah terbesar penyumbang dan penyumbang kod bagi komponen ekosistem Hadoop. (Pemimpin adalah pengawal projek Apache dan mempunyai kuasa untuk meluluskan perubahan kod.)

    Hortonworks adalah spin-off dari Yahoo!, yang merupakan pemacu korporat asal projek Hadoop kerana ia memerlukan platform berskala besar untuk menyokong perniagaan enjin cariannya. Dari semua vendor pengedaran Hadoop, Hortonworks adalah yang paling komited terhadap pergerakan sumber terbuka, berdasarkan jumlah semangat kerja pembangunan yang menyumbang kepada masyarakat, dan kerana semua usaha pembangunannya (akhirnya) dilipat ke dalam kod sumber terbuka.

    Model perniagaan Hortonworks didasarkan pada keupayaannya untuk memanfaatkan pengedaran HDPnya yang popular dan menyediakan perkhidmatan dan sokongan berbayar. Walau bagaimanapun, ia tidak menjual perisian proprietari. Sebaliknya, syarikat dengan penuh semangat menyokong idea bekerja dalam komuniti sumber terbuka untuk membangunkan penyelesaian yang memenuhi keperluan ciri perusahaan (contohnya, pemprosesan pertanyaan yang lebih cepat dengan Hive).

    Hortonworks telah mencipta beberapa hubungan dengan syarikat-syarikat yang ditubuhkan dalam industri pengurusan data: Teradata, Microsoft, Informatica, dan SAS, sebagai contoh. Walaupun syarikat-syarikat ini tidak mempunyai tawaran sendiri, dalam rumah Hadoop, mereka bekerjasama dengan Hortonworks untuk menyediakan penyelesaian Hadoop bersepadu dengan set produk mereka sendiri.

    Hortonworks menawarkan Hadoop adalah Platform Data Hortonworks (HDP), yang termasuk Hadoop serta perkakas dan projek berkaitan. Juga tidak seperti Cloudera, Hortonworks hanya mengeluarkan versi HDP dengan kod peringkat produksi dari komuniti sumber terbuka.

  • IBM : Big Blue menawarkan pelbagai tawaran Hadoop, dengan tumpuan sekitar nilai tambah di atas sumber terbuka Hadoop stack.

  • Intel: Pengedaran Intel untuk Apache Hadoop (Intel Distribution) menyediakan pemprosesan dan pengurusan data yang diedarkan untuk aplikasi perusahaan yang menganalisis data besar.

    Ciri-ciri utama termasuk prestasi yang sangat baik dengan pengoptimuman untuk pemproses Intel Xeon, penyimpanan SSD Intel, dan rangkaian Intel 10GbE; keselamatan data melalui penyulitan dan penyahsulitan dalam HDFS, dan kawalan akses berasaskan peranan dengan granulariti peringkat sel dalam HBase; Prestasi permintaan sarang bertambah baik; sokongan untuk analisis statistik dengan penyambung untuk R, pakej statistik sumber terbuka yang popular; dan grafik analisis melalui Intel Graph Builder.

  • MapR : Untuk pengedaran lengkap untuk Apache Hadoop dan projek-projek yang berkaitan yang bebas dari Apache Software Foundation, lihat tidak lebih daripada MapR. Memandangkan tiada ketergantungan Java atau pergantungan pada sistem fail Linux, MapR sedang dipromosikan sebagai satu-satunya distribusi Hadoop yang menyediakan perlindungan data penuh, tiada titik kegagalan tunggal, dan kelebihan kemudahan yang mudah digunakan.

    Tiga edisi MapR boleh didapati: M3, M5, dan M7. Edisi M3 adalah percuma dan tersedia untuk kegunaan pengeluaran tanpa had; MapR M5 adalah tawaran perisian perantara peringkat pertengahan; dan MapR M7 adalah pengedaran lengkap untuk Apache Hadoop dan HBase yang termasuk Pig, Hive, Sqoop, dan banyak lagi.

Membandingkan Hadoop Distributions - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...