Rumah Kewangan Peribadi Solusi Big Data alternatif - dummies

Solusi Big Data alternatif - dummies

Isi kandungan:

Video: Big Data - "Dangerous (feat. Joywave)" [Official Music Video] 2024

Video: Big Data - "Dangerous (feat. Joywave)" [Official Music Video] 2024
Anonim

Melihat masa lampau Hadoop, anda dapat melihat penyelesaian data besar alternatif pada ufuk. Penyelesaian ini memungkinkan untuk bekerja dengan data besar secara tepat masa atau menggunakan teknologi pangkalan data alternatif untuk mengendalikan dan memprosesnya. Di sini, anda diperkenalkan kepada rangka kerja pemprosesan masa nyata, kemudian platform Pemprosesan Seluruh Massal (MPP), dan akhirnya pangkalan data NoSQL yang membolehkan anda bekerja dengan data besar di luar persekitaran Hadoop.

Anda harus sedar tentang sesuatu yang disebut sebagai pematuhan ACID, pendek untuk A tomisiti, C dan D pematuhan kelalaian. Pematuhan ACID adalah standard yang mana transaksi pangkalan data yang tepat dan boleh dipercayai dijamin. Dalam penyelesaian data besar, kebanyakan sistem pangkalan data tidak mematuhi ACID, tetapi ini tidak semestinya menimbulkan masalah besar. Itu kerana kebanyakan sistem data yang besar menggunakan Sistem Sokongan Keputusan (DSS) yang data proses kelompok sebelum data dibaca. DSS

adalah sistem maklumat yang digunakan untuk sokongan keputusan organisasi. DSS tidak transactional menunjukkan tiada keperluan pematuhan ACID yang sebenar.

Rangka pemprosesan masa nyata

Kadangkala anda mungkin perlu menanyakan aliran data besar secara real-time … dan anda tidak boleh melakukan hal semacam ini menggunakan Hadoop. Dalam kes ini, gunakan rangka kerja pemprosesan masa nyata sebaliknya. Rangka kerja pemprosesan masa nyata

adalah - seperti namanya - rangka kerja yang dapat memproses data secara real-time (atau berhampiran real-time) sebagai aliran data dan mengalir ke dalam sistem. Pada dasarnya, rangka kerja pemprosesan masa nyata adalah antitesis dari kerangka pemprosesan batch yang anda lihat digunakan di Hadoop.

Rangka pemprosesan masa nyata boleh diklasifikasikan ke dalam dua kategori berikut: Rangka kerja yang menurunkan overhead dari tugas-tugas MapReduce untuk meningkatkan kecekapan masa keseluruhan sistem:

Solutions in kategori ini termasuk Apache Storm dan Apache Spark untuk memproses aliran masa nyata.

Rangka kerja yang menggunakan kaedah pertanyaan yang inovatif untuk memudahkan pencarian data secara besar-besaran:

  • Beberapa penyelesaian dalam kategori ini termasuk Dremel Google, Drill Apache, Hiu untuk Apache Hive, dan Impala Cloudera.

  • Rangka kerja pemprosesan masa nyata, aliran sangat berguna dalam pelbagai industri - dari analisis saham dan pasaran kewangan kepada pengoptimuman e-dagang, dan dari pengesanan penipuan masa nyata kepada logistik pesanan yang dioptimumkan. Terlepas dari industri di mana anda bekerja, jika perniagaan anda dipengaruhi oleh arus data masa nyata yang dihasilkan oleh manusia, mesin, atau sensor, maka rangka kerja pemprosesan masa nyata akan membantu anda dalam mengoptimalkan dan menjana nilai untuk anda organisasi.

    Platform Pemprosesan Paralel Massal (MPP)

Platform Pemprosesan Paralel Massal (MPP) boleh digunakan bukan MapReduce sebagai pendekatan alternatif untuk pemprosesan data yang diedarkan. Jika matlamat anda adalah untuk menggunakan pemprosesan selari pada gudang data tradisional, maka MPP mungkin penyelesaian yang sempurna.

Untuk memahami bagaimana MPP membandingkan dengan rangka kerja pemprosesan selari MapReduce standard, pertimbangkan perkara berikut. MPP menjalankan tugas-tugas pengkomputeran selari dengan perkakasan khusus mahal, sedangkan MapReduce menjalankannya pada pelayan komoditi murah. Oleh itu, keupayaan pemprosesan MPP adalah terhad. Ini berkata, MPP lebih pantas dan lebih mudah digunakan daripada pekerjaan MapReduce standard. Itu kerana MPP boleh dipertimbangkan menggunakan Bahasa Kuasa Terstruktur (SQL), tetapi pekerjaan MapReduce asli dikawal oleh bahasa pengaturcaraan Java yang lebih rumit.

Para vendor dan produk MPP terkenal termasuk platform Teradata lama sekolah, termasuk penyelesaian yang lebih baru seperti Greenplum DCA EMC

2, HP Vertica, Netezza HP, dan Exadata Oracle.

Memperkenalkan pangkalan data NoSQL Tradisional sistem pengurusan pangkalan data relasi

(RDBMS) tidak dilengkapi untuk menangani permintaan data besar. Ini kerana pangkalan data hubungan tradisional direka untuk mengendalikan hanya kumpulan data relasional yang dibina untuk data yang disimpan dalam baris dan lajur yang bersih dan dengan itu dapat dipertanyakan melalui Bahasa Kuasa Struktur (SQL Query).

Sistem RDBM tidak dapat mengendalikan data tidak berstruktur dan separuh berstruktur. Selain itu, sistem RDBM hanya tidak mempunyai keupayaan pemprosesan dan pengendalian yang diperlukan untuk memenuhi kelantangan dan keperluan halaju data yang besar. Ini adalah di mana NoSQL masuk. Pangkalan data NoSQL, seperti MongoDB, adalah sistem pangkalan data diedarkan yang tidak berkaitan, yang direka untuk menimbulkan cabaran data besar. Pangkalan data NoSQL melangkaui arsitektur pangkalan data tradisional dan menawarkan penyelesaian yang lebih berskala, cekap. Sistem NoSQL memudahkan pencarian data bukan SQL data tidak relational atau skema, semi-terstruktur dan tidak berstruktur. Dengan cara ini, pangkalan data NoSQL dapat mengendalikan sumber data berstruktur, semi struktur, dan tidak berstruktur yang biasa dalam sistem data besar.

NoSQL menawarkan empat kategori pangkalan data bukan hubungan - pangkalan data grafik, pangkalan data dokumen, kedai nilai utama, dan kedai keluarga lajur. Oleh kerana NoSQL menawarkan fungsi asli untuk setiap jenis struktur data yang berasingan, ia menawarkan fungsi penyimpanan dan pengambilan semula yang sangat efisien untuk kebanyakan jenis data bukan hubungan. Kesesuaian dan kecekapan ini menjadikan NoSQL sebagai pilihan yang semakin popular untuk mengendalikan data besar dan untuk mengatasi cabaran pemprosesan yang disertai dengannya.

Terdapat perdebatan mengenai kepentingan nama NoSQL. Ada yang berpendapat bahawa NoSQL bermaksud

Bukan Hanya SQL, sementara yang lain berpendapat bahawa akronim mewakili

pangkalan data Bukan-SQL . Hujah agak rumit dan tidak ada jawapan yang benar-benar kering.Untuk memastikan perkara mudah, cuma berfikir NoSQL sebagai kelas sistem pengurusan pangkalan data bukan relasi yang tidak termasuk dalam sistem spektrum RDBM yang dipertanyakan menggunakan SQL.

Solusi Big Data alternatif - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...