Rumah Kewangan Peribadi Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Video: How to install Cloudera QuickStart VM on VMware 2024

Video: How to install Cloudera QuickStart VM on VMware 2024
Anonim

Banyak kajian menunjukkan bahawa kebanyakan data dalam gudang data perusahaan jarang ditanyakan.

< kadang-kadang dipanggil

aktif data) sering digunakan, data hangat digunakan dari semasa ke semasa dan data sejuk jarang digunakan. untuk menyimpan data sejuk pada cakera yang lebih perlahan dalam kandang gudang data atau untuk membuat strategi caching yang pandai untuk menyimpan data yang panas dalam memori, antara lain.

Masalah dengan pendekatan ini adalah bahawa walaupun storan yang lebih perlahan digunakan, ia masih mahal untuk menyimpan data sejuk, jarang digunakan di gudang. Kos di sini berasal dari kedua-duanya perlesenan perkakasan dan perisian. Pada masa yang sama, data yang sejuk dan tidak aktif sering diarkibkan ke pita. Model pengarkiban tradisional ini rosak apabila anda ingin menanyakan semua data sejuk dengan cara yang kos efektif dan cekap - tanpa perlu meminta pita lama, dengan kata lain.

Jika anda melihat ciri-ciri kos dan operasi Hadoop, sesungguhnya ia seolah-olah telah ditetapkan untuk menjadi pita sandaran baru. Hadoop tidak mahal kerana sistem Hadoop direka bentuk untuk menggunakan gred rendah perkakasan daripada apa yang biasanya digunakan dalam sistem gudang data. Satu lagi penjimatan kos yang signifikan ialah pelesenan perisian.

Lesen pengedaran Hadoop komersial memerlukan sebahagian kecil daripada kos lesen perisian gudang data perhubungan, yang terkenal kerana mahal. Dari perspektif operasi, Hadoop direka untuk memudahkan skala hanya dengan menambahkan nod budak tambahan ke kumpulan yang ada. Dan sebagai nod hamba ditambahkan dan set data tumbuh dalam jumlah, rangka kerja pemprosesan data Hadoop membolehkan aplikasi anda mengatasi beban kerja yang meningkat dengan lancar.

Hadoop mewakili cara mudah, fleksibel, dan murah untuk mendorong pemprosesan merentasi beribu-ribu pelayan.

Dengan seni bina yang berskala dan murah, Hadoop nampaknya menjadi pilihan yang sempurna untuk mengarkibkan data gudang … kecuali satu perkara kecil: Kebanyakan dunia IT berjalan di SQL, dan SQL sendiri tidak bermain dengan baik dengan Hadoop.

Sememangnya, pergerakan NoSQL yang lebih mesra Hadoop masih hidup dan baik, tetapi kebanyakan pengguna kuasa kini menggunakan SQL dengan cara yang biasa, alat-alat yang luar biasa yang menghasilkan pertanyaan SQL di bawah produk hud seperti Tableau, Microsoft Excel, dan IBM Cognos BI.

Memang benar bahawa ekosistem Hadoop termasuk Hive, tetapi Hive menyokong hanya subset SQL, dan walaupun prestasi sedang meningkat (bersama dengan sokongan SQL), ia tidak hampir secepatnya menjawab pertanyaan yang lebih kecil seperti sistem relasi. Baru-baru ini, terdapat kemajuan besar di sekitar akses SQL ke Hadoop, yang telah membuka jalan bagi Hadoop menjadi destinasi baru untuk arkib gudang data dalam talian.

Bergantung pada vendor Hadoop, API (seperti SQL) akan menjadi tersedia supaya alat pelaporan dan analisis analisis yang lebih umum dapat mengeluarkan SQL yang lancar mengeluarkan data yang disimpan dalam Hadoop. Sebagai contoh, IBM mempunyai API SQL Big, Cloudera mempunyai Impala, dan Hive sendiri, melalui inisiatif Hortonworks Stinger, menjadi semakin mematuhi SQL.

Walaupun pelbagai sudut pandangan wujud (sesetengah bertujuan untuk meningkatkan Sarang; beberapa, untuk melanjutkan Hive dan lain-lain, untuk menyediakan alternatif), semua penyelesaian ini cuba untuk menangani dua isu: MapReduce adalah penyelesaian yang buruk untuk melaksanakan pertanyaan yang lebih kecil, dan akses SQL adalah - untuk saat ini - kunci untuk membolehkan pekerja IT menggunakan kemahiran SQL sedia ada untuk mendapatkan nilai dari data yang disimpan dalam Hadoop.

Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...