Rumah Kewangan Peribadi Analisis Data yang besar dan Gudang Data - dummies

Analisis Data yang besar dan Gudang Data - dummies

Isi kandungan:

Video: MEMBUAT REKAPITULASI DATA SECARA DINAMIS | LAPORAN PENJUALAN | EXCEL 2016 2024

Video: MEMBUAT REKAPITULASI DATA SECARA DINAMIS | LAPORAN PENJUALAN | EXCEL 2016 2024
Anonim

Anda akan mendapati nilai dalam membawa keupayaan gudang data dan persekitaran data yang besar bersama-sama. Anda perlu membuat persekitaran hibrid di mana data besar boleh berfungsi dengan tangan dengan gudang data.

Pertama, penting untuk mengetahui bahawa gudang data seperti yang dirancang hari ini tidak akan berubah dalam jangka pendek.

Oleh itu, lebih pragmatik untuk menggunakan gudang data untuk apa yang telah dirancang untuk dilakukan - menyediakan versi kebenaran yang betul mengenai topik yang ingin di analisis oleh perniagaan. Gudang itu mungkin termasuk maklumat mengenai barisan produk syarikat tertentu, pelanggannya, pembekalnya, dan butiran urus niaga setahun.

Maklumat yang diurus dalam gudang data atau data mart jabatan telah dibina dengan teliti supaya metadata adalah tepat. Dengan pertumbuhan maklumat berasaskan web baru, praktikal dan sering diperlukan untuk menganalisis jumlah besar data ini dalam konteks dengan data sejarah. Di sinilah model hibrid masuk

Aspek-aspek tertentu untuk berkahwin dengan gudang data dengan data besar boleh menjadi lebih mudah. Sebagai contoh, banyak sumber data besar datang dari sumber yang termasuk metadata mereka yang direka dengan baik. Tapak e-dagang yang komplek termasuk elemen data yang jelas. Oleh itu, apabila menjalankan analisis antara gudang dan sumber data besar, organisasi pengurusan maklumat bekerja dengan dua set data dengan model metadata yang direka dengan teliti yang perlu dirasionalisasi.

Sudah tentu, dalam beberapa situasi, sumber maklumat tidak mempunyai metadata yang jelas. Sebelum seorang penganalisis dapat menggabungkan data transaksi bersejarah dengan data besar yang kurang berstruktur, kerja perlu dilakukan. Biasanya, analisis awal petabytes data akan mendedahkan corak menarik yang dapat membantu meramalkan perubahan halus dalam perniagaan atau penyelesaian yang berpotensi untuk diagnosis pesakit.

Analisis awal boleh disempurnakan menggunakan alat seperti MapReduce dengan rangka kerja sistem fail Hadoop yang diedarkan. Pada ketika ini, anda boleh mula memahami sama ada ia dapat membantu menilai masalah yang ditangani.

Dalam proses analisis, ia sama pentingnya untuk menghapuskan data yang tidak perlu kerana ia mengenal pasti data yang berkaitan dengan konteks perniagaan. Apabila fasa ini selesai, baki data perlu diubah supaya definisi metadata adalah tepat. Dengan cara ini, apabila data besar digabungkan dengan data sejarah tradisional dari gudang, hasilnya akan tepat dan bermakna.

Integrasi data besar lynchpin

Proses ini memerlukan strategi integrasi data yang jelas. Walaupun integrasi data adalah unsur penting dalam menguruskan data besar, sama pentingnya apabila mencipta analisis hibrid dengan gudang data. Malah, proses mengekstrak data dan mengubahnya dalam persekitaran hibrid sangat mirip dengan bagaimana proses ini dijalankan dalam gudang data tradisional.

Dalam gudang data, data diekstrak daripada sistem sumber tradisional seperti sistem CRM atau ERP. Adalah penting bahawa unsur-unsur dari pelbagai sistem ini dipadankan dengan betul.

Pengekstrakan, transformasi, dan beban untuk mengumpul data gudang data

Dalam gudang data, anda sering mendapati gabungan jadual pangkalan data hubungan, fail rata, dan sumber tidak berkaitan. Gudang data yang dibina dengan baik akan diwarisi supaya data ditukar menjadi format umum, yang membolehkan pertanyaan diproses dengan tepat dan konsisten. Fail-fail yang diekstrak mesti diubah agar sesuai dengan peraturan perniagaan dan proses subjek bahawa gudang data direka untuk menganalisis.

Dengan kata lain, data harus diekstrak dari sumber data besar supaya sumber-sumber ini dapat berfungsi dengan selamat dan menghasilkan hasil yang bermakna. Di samping itu, sumber perlu diubah supaya mereka membantu dalam menganalisis hubungan antara data sejarah dan data yang lebih dinamik dan masa sebenar yang datang dari sumber data besar.

Memuatkan maklumat dalam model data besar akan berbeza daripada yang anda harapkan dalam gudang data tradisional. Dengan gudang data, selepas data telah dikodifikasikan, ia tidak pernah berubah. Gudang data tipikal akan menyediakan perniagaan dengan gambaran data berdasarkan keperluan untuk menganalisis isu perniagaan tertentu yang memerlukan pemantauan, seperti inventori atau penjualan.

Struktur teragih data besar sering akan memimpin organisasi untuk memuatkan data pertama ke dalam siri nod dan kemudian melaksanakan pengekstrakan dan transformasi. Apabila mencipta hibrida gudang data tradisional dan persekitaran data yang lebih besar, persekitaran data besar yang diedarkan secara mendadak dapat mengubah keupayaan organisasi untuk menganalisis jumlah data yang besar dalam konteks dengan perniagaan.

Analisis Data yang besar dan Gudang Data - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...