Rumah Kewangan Peribadi Solusi Big Data alternatif - dummies

Solusi Big Data alternatif - dummies

Isi kandungan:

Video: Big Data - "Dangerous (feat. Joywave)" [Official Music Video] 2024

Video: Big Data - "Dangerous (feat. Joywave)" [Official Music Video] 2024
Anonim

Melihat masa lampau Hadoop, anda dapat melihat penyelesaian data besar alternatif pada ufuk. Penyelesaian ini memungkinkan untuk bekerja dengan data besar secara tepat masa atau menggunakan teknologi pangkalan data alternatif untuk mengendalikan dan memprosesnya. Di sini, anda diperkenalkan kepada rangka kerja pemprosesan masa nyata, kemudian platform Pemprosesan Seluruh Massal (MPP), dan akhirnya pangkalan data NoSQL yang membolehkan anda bekerja dengan data besar di luar persekitaran Hadoop.

Anda harus sedar tentang sesuatu yang disebut sebagai pematuhan ACID, pendek untuk A tomisiti, C dan D pematuhan kelalaian. Pematuhan ACID adalah standard yang mana transaksi pangkalan data yang tepat dan boleh dipercayai dijamin. Dalam penyelesaian data besar, kebanyakan sistem pangkalan data tidak mematuhi ACID, tetapi ini tidak semestinya menimbulkan masalah besar. Itu kerana kebanyakan sistem data yang besar menggunakan Sistem Sokongan Keputusan (DSS) yang data proses kelompok sebelum data dibaca. DSS

adalah sistem maklumat yang digunakan untuk sokongan keputusan organisasi. DSS tidak transactional menunjukkan tiada keperluan pematuhan ACID yang sebenar.

Rangka pemprosesan masa nyata

Kadangkala anda mungkin perlu menanyakan aliran data besar secara real-time … dan anda tidak boleh melakukan hal semacam ini menggunakan Hadoop. Dalam kes ini, gunakan rangka kerja pemprosesan masa nyata sebaliknya. Rangka kerja pemprosesan masa nyata

adalah - seperti namanya - rangka kerja yang dapat memproses data secara real-time (atau berhampiran real-time) sebagai aliran data dan mengalir ke dalam sistem. Pada dasarnya, rangka kerja pemprosesan masa nyata adalah antitesis dari kerangka pemprosesan batch yang anda lihat digunakan di Hadoop.

Rangka pemprosesan masa nyata boleh diklasifikasikan ke dalam dua kategori berikut: Rangka kerja yang menurunkan overhead dari tugas-tugas MapReduce untuk meningkatkan kecekapan masa keseluruhan sistem:

Solutions in kategori ini termasuk Apache Storm dan Apache Spark untuk memproses aliran masa nyata.

Rangka kerja yang menggunakan kaedah pertanyaan yang inovatif untuk memudahkan pencarian data secara besar-besaran:

  • Beberapa penyelesaian dalam kategori ini termasuk Dremel Google, Drill Apache, Hiu untuk Apache Hive, dan Impala Cloudera.

  • Rangka kerja pemprosesan masa nyata, aliran sangat berguna dalam pelbagai industri - dari analisis saham dan pasaran kewangan kepada pengoptimuman e-dagang, dan dari pengesanan penipuan masa nyata kepada logistik pesanan yang dioptimumkan. Terlepas dari industri di mana anda bekerja, jika perniagaan anda dipengaruhi oleh arus data masa nyata yang dihasilkan oleh manusia, mesin, atau sensor, maka rangka kerja pemprosesan masa nyata akan membantu anda dalam mengoptimalkan dan menjana nilai untuk anda organisasi.

    Platform Pemprosesan Paralel Massal (MPP)

Platform Pemprosesan Paralel Massal (MPP) boleh digunakan bukan MapReduce sebagai pendekatan alternatif untuk pemprosesan data yang diedarkan. Jika matlamat anda adalah untuk menggunakan pemprosesan selari pada gudang data tradisional, maka MPP mungkin penyelesaian yang sempurna.

Untuk memahami bagaimana MPP membandingkan dengan rangka kerja pemprosesan selari MapReduce standard, pertimbangkan perkara berikut. MPP menjalankan tugas-tugas pengkomputeran selari dengan perkakasan khusus mahal, sedangkan MapReduce menjalankannya pada pelayan komoditi murah. Oleh itu, keupayaan pemprosesan MPP adalah terhad. Ini berkata, MPP lebih pantas dan lebih mudah digunakan daripada pekerjaan MapReduce standard. Itu kerana MPP boleh dipertimbangkan menggunakan Bahasa Kuasa Terstruktur (SQL), tetapi pekerjaan MapReduce asli dikawal oleh bahasa pengaturcaraan Java yang lebih rumit.

Para vendor dan produk MPP terkenal termasuk platform Teradata lama sekolah, termasuk penyelesaian yang lebih baru seperti Greenplum DCA EMC

2, HP Vertica, Netezza HP, dan Exadata Oracle.

Memperkenalkan pangkalan data NoSQL Tradisional sistem pengurusan pangkalan data relasi

(RDBMS) tidak dilengkapi untuk menangani permintaan data besar. Ini kerana pangkalan data hubungan tradisional direka untuk mengendalikan hanya kumpulan data relasional yang dibina untuk data yang disimpan dalam baris dan lajur yang bersih dan dengan itu dapat dipertanyakan melalui Bahasa Kuasa Struktur (SQL Query).

Sistem RDBM tidak dapat mengendalikan data tidak berstruktur dan separuh berstruktur. Selain itu, sistem RDBM hanya tidak mempunyai keupayaan pemprosesan dan pengendalian yang diperlukan untuk memenuhi kelantangan dan keperluan halaju data yang besar. Ini adalah di mana NoSQL masuk. Pangkalan data NoSQL, seperti MongoDB, adalah sistem pangkalan data diedarkan yang tidak berkaitan, yang direka untuk menimbulkan cabaran data besar. Pangkalan data NoSQL melangkaui arsitektur pangkalan data tradisional dan menawarkan penyelesaian yang lebih berskala, cekap. Sistem NoSQL memudahkan pencarian data bukan SQL data tidak relational atau skema, semi-terstruktur dan tidak berstruktur. Dengan cara ini, pangkalan data NoSQL dapat mengendalikan sumber data berstruktur, semi struktur, dan tidak berstruktur yang biasa dalam sistem data besar.

NoSQL menawarkan empat kategori pangkalan data bukan hubungan - pangkalan data grafik, pangkalan data dokumen, kedai nilai utama, dan kedai keluarga lajur. Oleh kerana NoSQL menawarkan fungsi asli untuk setiap jenis struktur data yang berasingan, ia menawarkan fungsi penyimpanan dan pengambilan semula yang sangat efisien untuk kebanyakan jenis data bukan hubungan. Kesesuaian dan kecekapan ini menjadikan NoSQL sebagai pilihan yang semakin popular untuk mengendalikan data besar dan untuk mengatasi cabaran pemprosesan yang disertai dengannya.

Terdapat perdebatan mengenai kepentingan nama NoSQL. Ada yang berpendapat bahawa NoSQL bermaksud

Bukan Hanya SQL, sementara yang lain berpendapat bahawa akronim mewakili

pangkalan data Bukan-SQL . Hujah agak rumit dan tidak ada jawapan yang benar-benar kering.Untuk memastikan perkara mudah, cuma berfikir NoSQL sebagai kelas sistem pengurusan pangkalan data bukan relasi yang tidak termasuk dalam sistem spektrum RDBM yang dipertanyakan menggunakan SQL.

Solusi Big Data alternatif - dummies

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...