Rumah Kewangan Peribadi Mengenal pasti Data yang Anda perlukan untuk Data Big Anda - dummies

Mengenal pasti Data yang Anda perlukan untuk Data Big Anda - dummies

Isi kandungan:

Video: Lebih Penting Mana, Chipset Canggih atau RAM Besar? 2024

Video: Lebih Penting Mana, Chipset Canggih atau RAM Besar? 2024
Anonim

Mengambil stok jenis data yang anda hadapi dalam projek data besar anda. Banyak organisasi mengakui bahawa banyak data yang dihasilkan secara dalaman tidak digunakan untuk potensi penuhnya pada masa lalu.

Dengan memanfaatkan alat baru, organisasi mendapat wawasan baru dari sumber data yang tidak diterokai sebelum ini dalam e-mel, rekod perkhidmatan pelanggan, data sensor, dan log keselamatan. Di samping itu, terdapat banyak minat dalam mencari wawasan baru berdasarkan analisis data yang terutamanya luar organisasi, seperti media sosial, lokasi telefon bimbit, lalu lintas dan cuaca.

Tahap penerokaan untuk data besar

Pada peringkat awal analisis anda, anda akan ingin mencari pola dalam data. Ia hanya dengan mengkaji jumlah data yang sangat besar yang hubungan baru dan tidak dijangka dan korelasi antara unsur-unsur mungkin menjadi nyata. Corak ini boleh memberikan pandangan tentang keutamaan pelanggan untuk produk baru, contohnya. Anda memerlukan platform untuk mengatur data besar anda untuk mencari pola ini.

Hadoop digunakan secara meluas sebagai blok bangunan asas untuk menangkap dan memproses data besar. Hadoop direka dengan keupayaan yang mempercepat pemprosesan data besar dan memungkinkan untuk mengenal pasti corak dalam jumlah besar data dalam masa yang agak singkat. Dua komponen utama Hadoop - Hadoop Sistem Fail Teragih (HDFS) dan MapReduce - digunakan untuk mengurus dan memproses data besar anda.

FlumeNG untuk penyepaduan data besar

Sering diperlukan untuk mengumpul, mengagregat, dan memindahkan jumlah data streaming yang sangat besar untuk mencari pola tersembunyi dalam data besar. Alat penyepaduan tradisional seperti ETL tidak akan cukup cepat untuk memindahkan aliran data besar dalam waktu untuk menyampaikan hasil analisis seperti pengesanan penipuan masa nyata. FlumeNG memuatkan data dalam masa nyata dengan menghidupkan data anda ke Hadoop.

Biasanya, Flume digunakan untuk mengumpul sejumlah besar data log dari pelayan yang diedarkan. Ia menjejaki semua nod fizikal dan logik dalam pemasangan Flume. Node agen dipasang pada pelayan dan bertanggungjawab untuk menguruskan cara satu aliran data dipindahkan dan diproses dari titik permulaannya ke titik tujuannya.

Selain itu, pengumpul digunakan untuk menggabungkan aliran data ke dalam aliran yang lebih besar yang boleh ditulis ke sistem fail Hadoop atau bekas penyimpanan data besar lainnya. Flume direka untuk skalabiliti dan boleh terus menambah banyak sumber kepada sistem untuk mengendalikan jumlah data yang sangat besar dengan cara yang efisien.Output Flume dapat diintegrasikan dengan Hadoop dan Hive untuk analisis data.

Flume juga mempunyai elemen transformasi untuk digunakan pada data dan boleh menjadikan infrastruktur Hadoop anda menjadi sumber penstriman data tidak terstruktur.

Corak dalam data besar

Anda dapati banyak contoh syarikat yang mula menyedari kelebihan daya saing daripada analisis data besar. Bagi banyak syarikat, aliran data media sosial semakin menjadi komponen penting dalam strategi pemasaran digital. Di peringkat penerokaan, teknologi ini boleh digunakan untuk mencari dengan pantas melalui sejumlah besar data aliran dan menarik corak trend yang berkaitan dengan produk atau pelanggan tertentu.

Tahap pengkodan untuk data besar

Dengan beratus-ratus kedai dan beribu-ribu pelanggan, anda memerlukan proses berulang untuk membuat lompatan dari pengenalan corak untuk pelaksanaan pemilihan produk baru dan pemasaran yang lebih disasarkan. Selepas anda menemui sesuatu yang menarik dalam analisis data besar anda, katakan dan menjadikannya sebahagian daripada proses perniagaan anda.

Untuk memodifikasikan hubungan antara analitik data besar anda dan data operasi anda, anda perlu menyatukan data.

Penyepaduan data besar dan tahap penggabungan

Data besar mempunyai kesan besar pada banyak aspek pengurusan data, termasuk integrasi data. Secara tradisi, integrasi data telah memberi tumpuan kepada pergerakan data melalui middleware, termasuk spesifikasi pada lulus mesej dan keperluan untuk antara muka pengaturcaraan aplikasi (API). Konsep-konsep integrasi data ini adalah lebih sesuai untuk menguruskan data di sekeliling daripada data yang bergerak.

Pergerakan ke dunia baru data dan data streaming yang tidak tersusun mengubah tanggapan konvensional integrasi data. Sekiranya anda ingin menggabungkan analisis data aliran anda ke dalam proses perniagaan anda, anda memerlukan teknologi canggih yang cukup cepat untuk membolehkan anda membuat keputusan dalam masa nyata.

Selepas analisa data besar anda selesai, anda memerlukan pendekatan yang akan membolehkan anda mengintegrasikan atau memasukkan hasil analisa data besar anda ke dalam proses bisnis anda dan tindakan bisnis masa nyata.

Syarikat mempunyai jangkaan yang tinggi untuk mendapatkan nilai perniagaan yang sebenar dari analisis data yang besar. Sebenarnya, banyak syarikat ingin memulakan analisis yang lebih mendalam mengenai data besar yang dihasilkan secara dalaman, seperti data log keselamatan, yang tidak dapat dilakukan sebelum ini disebabkan oleh keterbatasan teknologi.

Teknologi untuk pengangkutan laju data yang sangat besar dan cepat adalah keperluan untuk mengintegrasikan sumber data besar yang diedarkan dan antara data besar dan data operasi. Sumber data yang tidak berstruktur sering perlu dipindahkan dengan cepat ke atas jarak geografi yang besar untuk perkongsian dan kerjasama.

Menghubungkan sumber-sumber tradisional dengan data besar adalah proses yang banyak sekali setelah anda melihat semua data dari streaming sumber data besar dan mengenal pasti pola yang relevan. Selepas menyempitkan jumlah data yang anda perlukan untuk mengurus dan menganalisis, kini anda perlu memikirkan integrasi.

Mengenal pasti Data yang Anda perlukan untuk Data Big Anda - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...