Rumah Kewangan Peribadi Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Video: How to install Cloudera QuickStart VM on VMware 2024

Video: How to install Cloudera QuickStart VM on VMware 2024
Anonim

Banyak kajian menunjukkan bahawa kebanyakan data dalam gudang data perusahaan jarang ditanyakan.

< kadang-kadang dipanggil

aktif data) sering digunakan, data hangat digunakan dari semasa ke semasa dan data sejuk jarang digunakan. untuk menyimpan data sejuk pada cakera yang lebih perlahan dalam kandang gudang data atau untuk membuat strategi caching yang pandai untuk menyimpan data yang panas dalam memori, antara lain.

Masalah dengan pendekatan ini adalah bahawa walaupun storan yang lebih perlahan digunakan, ia masih mahal untuk menyimpan data sejuk, jarang digunakan di gudang. Kos di sini berasal dari kedua-duanya perlesenan perkakasan dan perisian. Pada masa yang sama, data yang sejuk dan tidak aktif sering diarkibkan ke pita. Model pengarkiban tradisional ini rosak apabila anda ingin menanyakan semua data sejuk dengan cara yang kos efektif dan cekap - tanpa perlu meminta pita lama, dengan kata lain.

Jika anda melihat ciri-ciri kos dan operasi Hadoop, sesungguhnya ia seolah-olah telah ditetapkan untuk menjadi pita sandaran baru. Hadoop tidak mahal kerana sistem Hadoop direka bentuk untuk menggunakan gred rendah perkakasan daripada apa yang biasanya digunakan dalam sistem gudang data. Satu lagi penjimatan kos yang signifikan ialah pelesenan perisian.

Lesen pengedaran Hadoop komersial memerlukan sebahagian kecil daripada kos lesen perisian gudang data perhubungan, yang terkenal kerana mahal. Dari perspektif operasi, Hadoop direka untuk memudahkan skala hanya dengan menambahkan nod budak tambahan ke kumpulan yang ada. Dan sebagai nod hamba ditambahkan dan set data tumbuh dalam jumlah, rangka kerja pemprosesan data Hadoop membolehkan aplikasi anda mengatasi beban kerja yang meningkat dengan lancar.

Hadoop mewakili cara mudah, fleksibel, dan murah untuk mendorong pemprosesan merentasi beribu-ribu pelayan.

Dengan seni bina yang berskala dan murah, Hadoop nampaknya menjadi pilihan yang sempurna untuk mengarkibkan data gudang … kecuali satu perkara kecil: Kebanyakan dunia IT berjalan di SQL, dan SQL sendiri tidak bermain dengan baik dengan Hadoop.

Sememangnya, pergerakan NoSQL yang lebih mesra Hadoop masih hidup dan baik, tetapi kebanyakan pengguna kuasa kini menggunakan SQL dengan cara yang biasa, alat-alat yang luar biasa yang menghasilkan pertanyaan SQL di bawah produk hud seperti Tableau, Microsoft Excel, dan IBM Cognos BI.

Memang benar bahawa ekosistem Hadoop termasuk Hive, tetapi Hive menyokong hanya subset SQL, dan walaupun prestasi sedang meningkat (bersama dengan sokongan SQL), ia tidak hampir secepatnya menjawab pertanyaan yang lebih kecil seperti sistem relasi. Baru-baru ini, terdapat kemajuan besar di sekitar akses SQL ke Hadoop, yang telah membuka jalan bagi Hadoop menjadi destinasi baru untuk arkib gudang data dalam talian.

Bergantung pada vendor Hadoop, API (seperti SQL) akan menjadi tersedia supaya alat pelaporan dan analisis analisis yang lebih umum dapat mengeluarkan SQL yang lancar mengeluarkan data yang disimpan dalam Hadoop. Sebagai contoh, IBM mempunyai API SQL Big, Cloudera mempunyai Impala, dan Hive sendiri, melalui inisiatif Hortonworks Stinger, menjadi semakin mematuhi SQL.

Walaupun pelbagai sudut pandangan wujud (sesetengah bertujuan untuk meningkatkan Sarang; beberapa, untuk melanjutkan Hive dan lain-lain, untuk menyediakan alternatif), semua penyelesaian ini cuba untuk menangani dua isu: MapReduce adalah penyelesaian yang buruk untuk melaksanakan pertanyaan yang lebih kecil, dan akses SQL adalah - untuk saat ini - kunci untuk membolehkan pekerja IT menggunakan kemahiran SQL sedia ada untuk mendapatkan nilai dari data yang disimpan dalam Hadoop.

Hadoop sebagai Archive Queryable Data Warehouse Cold - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...