Rumah Kewangan Peribadi Analisis Data yang besar dan Gudang Data - dummies

Analisis Data yang besar dan Gudang Data - dummies

Isi kandungan:

Video: MEMBUAT REKAPITULASI DATA SECARA DINAMIS | LAPORAN PENJUALAN | EXCEL 2016 2024

Video: MEMBUAT REKAPITULASI DATA SECARA DINAMIS | LAPORAN PENJUALAN | EXCEL 2016 2024
Anonim

Anda akan mendapati nilai dalam membawa keupayaan gudang data dan persekitaran data yang besar bersama-sama. Anda perlu membuat persekitaran hibrid di mana data besar boleh berfungsi dengan tangan dengan gudang data.

Pertama, penting untuk mengetahui bahawa gudang data seperti yang dirancang hari ini tidak akan berubah dalam jangka pendek.

Oleh itu, lebih pragmatik untuk menggunakan gudang data untuk apa yang telah dirancang untuk dilakukan - menyediakan versi kebenaran yang betul mengenai topik yang ingin di analisis oleh perniagaan. Gudang itu mungkin termasuk maklumat mengenai barisan produk syarikat tertentu, pelanggannya, pembekalnya, dan butiran urus niaga setahun.

Maklumat yang diurus dalam gudang data atau data mart jabatan telah dibina dengan teliti supaya metadata adalah tepat. Dengan pertumbuhan maklumat berasaskan web baru, praktikal dan sering diperlukan untuk menganalisis jumlah besar data ini dalam konteks dengan data sejarah. Di sinilah model hibrid masuk

Aspek-aspek tertentu untuk berkahwin dengan gudang data dengan data besar boleh menjadi lebih mudah. Sebagai contoh, banyak sumber data besar datang dari sumber yang termasuk metadata mereka yang direka dengan baik. Tapak e-dagang yang komplek termasuk elemen data yang jelas. Oleh itu, apabila menjalankan analisis antara gudang dan sumber data besar, organisasi pengurusan maklumat bekerja dengan dua set data dengan model metadata yang direka dengan teliti yang perlu dirasionalisasi.

Sudah tentu, dalam beberapa situasi, sumber maklumat tidak mempunyai metadata yang jelas. Sebelum seorang penganalisis dapat menggabungkan data transaksi bersejarah dengan data besar yang kurang berstruktur, kerja perlu dilakukan. Biasanya, analisis awal petabytes data akan mendedahkan corak menarik yang dapat membantu meramalkan perubahan halus dalam perniagaan atau penyelesaian yang berpotensi untuk diagnosis pesakit.

Analisis awal boleh disempurnakan menggunakan alat seperti MapReduce dengan rangka kerja sistem fail Hadoop yang diedarkan. Pada ketika ini, anda boleh mula memahami sama ada ia dapat membantu menilai masalah yang ditangani.

Dalam proses analisis, ia sama pentingnya untuk menghapuskan data yang tidak perlu kerana ia mengenal pasti data yang berkaitan dengan konteks perniagaan. Apabila fasa ini selesai, baki data perlu diubah supaya definisi metadata adalah tepat. Dengan cara ini, apabila data besar digabungkan dengan data sejarah tradisional dari gudang, hasilnya akan tepat dan bermakna.

Integrasi data besar lynchpin

Proses ini memerlukan strategi integrasi data yang jelas. Walaupun integrasi data adalah unsur penting dalam menguruskan data besar, sama pentingnya apabila mencipta analisis hibrid dengan gudang data. Malah, proses mengekstrak data dan mengubahnya dalam persekitaran hibrid sangat mirip dengan bagaimana proses ini dijalankan dalam gudang data tradisional.

Dalam gudang data, data diekstrak daripada sistem sumber tradisional seperti sistem CRM atau ERP. Adalah penting bahawa unsur-unsur dari pelbagai sistem ini dipadankan dengan betul.

Pengekstrakan, transformasi, dan beban untuk mengumpul data gudang data

Dalam gudang data, anda sering mendapati gabungan jadual pangkalan data hubungan, fail rata, dan sumber tidak berkaitan. Gudang data yang dibina dengan baik akan diwarisi supaya data ditukar menjadi format umum, yang membolehkan pertanyaan diproses dengan tepat dan konsisten. Fail-fail yang diekstrak mesti diubah agar sesuai dengan peraturan perniagaan dan proses subjek bahawa gudang data direka untuk menganalisis.

Dengan kata lain, data harus diekstrak dari sumber data besar supaya sumber-sumber ini dapat berfungsi dengan selamat dan menghasilkan hasil yang bermakna. Di samping itu, sumber perlu diubah supaya mereka membantu dalam menganalisis hubungan antara data sejarah dan data yang lebih dinamik dan masa sebenar yang datang dari sumber data besar.

Memuatkan maklumat dalam model data besar akan berbeza daripada yang anda harapkan dalam gudang data tradisional. Dengan gudang data, selepas data telah dikodifikasikan, ia tidak pernah berubah. Gudang data tipikal akan menyediakan perniagaan dengan gambaran data berdasarkan keperluan untuk menganalisis isu perniagaan tertentu yang memerlukan pemantauan, seperti inventori atau penjualan.

Struktur teragih data besar sering akan memimpin organisasi untuk memuatkan data pertama ke dalam siri nod dan kemudian melaksanakan pengekstrakan dan transformasi. Apabila mencipta hibrida gudang data tradisional dan persekitaran data yang lebih besar, persekitaran data besar yang diedarkan secara mendadak dapat mengubah keupayaan organisasi untuk menganalisis jumlah data yang besar dalam konteks dengan perniagaan.

Analisis Data yang besar dan Gudang Data - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...