Rumah Kewangan Peribadi Cara Memastikan Kesahan, Keaslian, dan Keterpurukan Data Besar - patung

Cara Memastikan Kesahan, Keaslian, dan Keterpurukan Data Besar - patung

Isi kandungan:

Video: 서문강 목사의 로마서강해 16. 죄인을 의롭다 하시는 하나님의 정당성 (God’s Validity in Justifying the Sinners by Faith) 2024

Video: 서문강 목사의 로마서강해 16. 죄인을 의롭다 하시는 하나님의 정당성 (God’s Validity in Justifying the Sinners by Faith) 2024
Anonim

Kelantangan tinggi, kepelbagaian tinggi, dan halaju tinggi adalah ciri-ciri penting data besar. Tetapi ciri-ciri lain dari data besar sama pentingnya, terutamanya apabila anda menggunakan data besar untuk proses operasi. Set kedua ciri "V" yang penting untuk menjalankan data besar termasuk

  • Kesahan: Adakah data itu betul dan tepat untuk kegunaan yang dimaksudkan?

  • Kebenaran: Adakah hasilnya bermakna bagi ruang masalah yang diberikan?

  • Keterpuratan: Berapa lama anda perlu menyimpan data ini?

Kesahihan data yang besar

Anda mahu keputusan yang tepat. Tetapi pada peringkat awal menganalisis petabytes data, kemungkinan besar anda tidak akan risau tentang bagaimana setiap elemen data berlaku. Aliran awal data besar mungkin sebenarnya agak kotor. Pada peringkat awal, adalah lebih penting untuk melihat sama ada sebarang hubungan wujud di antara elemen dalam sumber data besar ini daripada memastikan semua elemen adalah sah.

Walau bagaimanapun, selepas organisasi menentukan bahagian-bahagian analisis data awal penting, subset data besar ini perlu disahkan kerana kini akan digunakan untuk keadaan operasi. Apabila data bergerak dari penjelajahan ke tindakan yang boleh dilakukan, data mesti disahkan. Kesahan sumber data besar dan analisa berikutnya mestilah tepat sekiranya anda menggunakan keputusan untuk membuat keputusan.

Data input yang sah diikuti dengan pemprosesan data yang betul harus menghasilkan hasil yang tepat. Dengan data yang besar, anda mesti berhati-hati dengan lebih lanjut mengenai kesahihannya. Sebagai contoh, dalam penjagaan kesihatan, anda mungkin mempunyai data dari percubaan klinikal yang mungkin berkaitan dengan gejala penyakit pesakit. Tetapi doktor yang merawat orang itu tidak boleh hanya mengambil keputusan percubaan klinikal tanpa mengesahkannya.

Bayangkan bahawa satelit cuaca menunjukkan bahawa badai bermula di satu bahagian dunia. Bagaimana ribut itu memberi kesan kepada individu? Dengan kira-kira setengah bilion pengguna, adalah mungkin untuk menganalisis aliran Twitter untuk menentukan kesan ribut pada populasi tempatan. Oleh itu, menggunakan Twitter dalam kombinasi dengan data dari satelit cuaca dapat membantu para penyelidik memahami kebenaran kebenaran ramalan cuaca.

Ketidakseimbangan data yang besar

Jika anda mempunyai data yang sah dan boleh membuktikan kesahihan keputusan, berapa lama data perlu "hidup" untuk memenuhi keperluan anda? Dalam tetapan data standard, anda boleh menyimpan data selama beberapa dekad kerana anda telah, dari masa ke masa, membina pemahaman tentang data yang penting untuk apa yang anda lakukan dengannya.Anda telah menetapkan peraturan untuk mata wang data dan ketersediaan peta untuk proses kerja anda.

Sebagai contoh, sesetengah organisasi mungkin hanya menyimpan data dan urus niaga pelanggan yang terkini dalam sistem perniagaan mereka. Ini akan memastikan pengambilan maklumat ini dengan pantas apabila diperlukan. Sekiranya mereka perlu melihat pada tahun sebelumnya, pasukan TI mungkin perlu memulihkan data dari storan luar talian untuk menghormati permintaan. Dengan data besar, masalah ini diperbesar.

Jika storan terhad, lihat sumber data besar untuk menentukan apa yang perlu anda kumpul dan berapa lama anda perlu menyimpannya. Dengan beberapa sumber data yang besar, anda mungkin perlu mengumpulkan data untuk analisis cepat.

Anda kemudiannya boleh menyimpan maklumat secara tempatan untuk diproses selanjutnya. Sekiranya anda tidak mempunyai simpanan yang mencukupi untuk semua data ini, anda boleh memproses data "on the fly" dan hanya menyimpan sekeping maklumat yang relevan di dalam negara. Berapa lama anda menyimpan data besar yang ada bergantung kepada beberapa faktor:

  • Berapa banyak data disimpan di sumbernya?

  • Adakah anda perlu memproses data berulang kali?

  • Adakah anda perlu memproses data, mengumpul data tambahan, dan melakukan lebih banyak pemprosesan?

  • Adakah anda mempunyai peraturan atau peraturan yang memerlukan storan data?

  • Adakah pelanggan anda bergantung pada data anda untuk kerja mereka?

  • Adakah data masih mempunyai nilai atau tidak lagi relevan?

Oleh kerana volum, kepelbagaian, dan halaju data besar, anda perlu memahami turun naik. Untuk beberapa sumber, data akan sentiasa berada di sana; untuk yang lain, ini tidak berlaku. Memahami apa data di luar sana dan untuk berapa lama dapat membantu anda menentukan keperluan dan dasar pengekalan untuk data besar.

Sebagai pengguna, data besar akan membantu untuk menentukan profil yang lebih baik untuk bagaimana dan bila anda membeli barangan dan perkhidmatan. Sebagai pesakit, data besar akan membantu untuk menentukan pendekatan yang lebih disesuaikan untuk rawatan dan penyelenggaraan kesihatan. Sebagai data yang profesional, besar akan membantu anda mengenal pasti cara yang lebih baik untuk mereka bentuk dan menyampaikan produk dan perkhidmatan anda.

Ini hanya akan berlaku apabila data besar diintegrasikan ke dalam proses operasi syarikat dan organisasi.

Cara Memastikan Kesahan, Keaslian, dan Keterpurukan Data Besar - patung

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...