Rumah Kewangan Peribadi Asas Integrasi Data Big - dummies

Asas Integrasi Data Big - dummies

Video: Webinar: Manajemen Kota di Masa Depan dengan Strategi Geospasial 2024

Video: Webinar: Manajemen Kota di Masa Depan dengan Strategi Geospasial 2024
Anonim

Unsur asas platform data besar mengurus data dengan cara baru berbanding dengan pangkalan data relasional tradisional. Ini adalah kerana keperluan untuk mempunyai skalabiliti dan prestasi tinggi yang diperlukan untuk menguruskan data berstruktur dan tidak berstruktur.

Komponen ekosistem data yang besar dari Hadoop hingga NoSQL DB, MongoDB, Cassandra, dan HBase semuanya mempunyai pendekatan sendiri untuk mengekstrak dan memuatkan data. Akibatnya, pasukan anda mungkin perlu mengembangkan kemahiran baru untuk menguruskan proses integrasi merentasi platform ini. Walau bagaimanapun, banyak amalan terbaik pengurusan data syarikat anda akan menjadi lebih penting apabila anda beralih ke dunia data besar.

Walaupun data besar memperkenalkan tahap kerumitan integrasi yang baru, asas asas asas masih berlaku. Objektif perniagaan anda perlu difokuskan untuk menyampaikan data yang berkualiti dan dipercayai kepada organisasi pada masa yang tepat dan dalam konteks yang betul.

Untuk memastikan kepercayaan ini, anda perlu menetapkan peraturan umum untuk kualiti data dengan penekanan terhadap ketepatan dan kesempurnaan data. Di samping itu, anda memerlukan pendekatan yang komprehensif untuk membangunkan metadata perusahaan, menjejaki keturunan data dan tadbir urus untuk menyokong integrasi data anda.

Pada masa yang sama, alat tradisional untuk penyepaduan data berkembang untuk menangani pelbagai peningkatan data tak berstruktur dan peningkatan jumlah dan halaju data besar. Walaupun bentuk integrasi tradisional mengambil makna baru dalam dunia data yang besar, teknologi integrasi anda memerlukan platform yang sama yang menyokong kualiti data dan profil.

Untuk membuat keputusan perniagaan yang baik berdasarkan analisis data yang besar, maklumat ini perlu dipercayai dan difahami di semua peringkat organisasi. Walaupun mungkin tidak akan menjadi kos atau masa yang berkesan untuk terlalu peduli dengan kualiti data dalam tahap penerokaan analisis data yang besar, akhirnya kualiti dan kepercayaan harus memainkan peranan jika hasilnya dimasukkan ke dalam proses bisnis.

Maklumat perlu dihantar kepada perniagaan dengan cara yang dipercayai, terkawal, konsisten, dan fleksibel di seluruh perusahaan, tanpa mengira keperluan khusus untuk sistem atau aplikasi individu. Untuk mencapai matlamat ini, tiga prinsip asas berlaku:

  • Anda mesti membuat pemahaman umum tentang definisi data. Pada peringkat awal analisis data besar anda, anda tidak mungkin mempunyai tahap kawalan yang sama terhadap definisi data seperti yang anda lakukan dengan data operasi anda.Walau bagaimanapun, sebaik sahaja anda mengenal pasti corak yang paling relevan dengan perniagaan anda, anda memerlukan keupayaan untuk memetakan elemen data kepada definisi yang sama.

  • Anda mesti membangunkan satu set perkhidmatan data untuk memenuhi syarat data dan menjadikannya konsisten dan akhirnya boleh dipercayai. Apabila sumber data tidak terstruktur dan besar anda disepadukan dengan data operasi berstruktur, anda perlu yakin bahawa hasilnya akan bermakna.

  • Anda memerlukan cara yang diperkemas untuk mengintegrasikan sumber data besar dan sistem rekod anda. Untuk membuat keputusan yang baik berdasarkan keputusan analisa data besar anda, anda perlu menyampaikan maklumat pada masa yang tepat dan dengan konteks yang betul. Proses integrasi data besar anda harus memastikan konsistensi dan kebolehpercayaan.

Untuk menyatukan data dalam persekitaran aplikasi bercampur, dapatkan data dari satu persekitaran data (sumber) ke persekitaran data lain (target). Ekstrak, transformasi, dan beban (ETL) teknologi telah digunakan untuk menyelesaikannya dalam persekitaran gudang data tradisi. Peranan ETL berkembang untuk mengendalikan persekitaran pengurusan data yang lebih baru seperti Hadoop.

Dalam persekitaran data yang besar, anda mungkin perlu menggabungkan alat yang menyokong proses integrasi kumpulan (menggunakan ETL) dengan integrasi dan persekutuan masa nyata di beberapa sumber. Sebagai contoh, syarikat farmaseutikal mungkin perlu menggabungkan data yang disimpan dalam sistem Pengurusan Data Master (MDM) dengan sumber data besar mengenai hasil perubatan penggunaan ubat pelanggan.

Syarikat menggunakan MDM untuk memudahkan pengumpulan, pengagregatan, penyatuan, dan penyampaian data yang konsisten dan boleh dipercayai dengan cara yang terkawal di seluruh perusahaan. Di samping itu, alat baru seperti Sqoop dan Scribe digunakan untuk menyokong integrasi persekitaran data besar. Anda juga mendapati penekanan yang lebih tinggi untuk menggunakan teknologi ekstrak, beban, dan transform (ELT). Teknologi-teknologi ini dijelaskan seterusnya.

Asas Integrasi Data Big - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...