Rumah Kewangan Peribadi Data berstruktur dalam Persekitaran Data Besar - dummies

Data berstruktur dalam Persekitaran Data Besar - dummies

Isi kandungan:

Video: Top 25 Excel 2016 Tips and Tricks 2024

Video: Top 25 Excel 2016 Tips and Tricks 2024
Anonim

Istilah data berstruktur secara umumnya merujuk kepada data yang mempunyai panjang dan format yang ditetapkan untuk data besar. Contoh data berstruktur termasuk nombor, tarikh, dan kumpulan perkataan dan nombor yang dipanggil rentetan . Kebanyakan pakar bersetuju bahawa data jenis ini menyumbang kira-kira 20 peratus daripada data yang ada di sini. Data berstruktur adalah data yang mungkin anda gunakan untuk berurusan. Ia biasanya disimpan dalam pangkalan data.

Sumber data besar berstruktur

Walaupun ini mungkin kelihatan seperti perniagaan seperti biasa, pada kenyataannya, data berstruktur mengambil peranan baru dalam dunia data besar. Evolusi teknologi menyediakan sumber-sumber baru yang berstruktur yang dihasilkan - seringkali dalam masa nyata dan dalam jumlah besar. Sumber data dibahagikan kepada dua kategori:

  • Komputer- atau mesin yang dihasilkan: Data yang dihasilkan oleh mesin umumnya merujuk kepada data yang dicipta oleh mesin tanpa intervensi manusia.

  • Manusia yang dihasilkan: Ini adalah data yang manusia, dalam interaksi dengan komputer, bekalan.

Sesetengah pakar berpendapat bahawa kategori ketiga wujud yang merupakan hibrid antara mesin dan manusia. Di sini, kami bimbang dengan dua kategori pertama.

Data berstruktur yang dihasilkan oleh mesin boleh termasuk yang berikut:

  • Data Sensor: Contohnya termasuk tag ID frekuensi radio, meter pintar, peranti perubatan dan data Sistem Kedudukan Global. Syarikat-syarikat berminat untuk pengurusan rantaian bekalan dan kawalan inventori.

  • data log web: Apabila pelayan, aplikasi, rangkaian, dan sebagainya beroperasi, mereka menangkap semua jenis data mengenai aktiviti mereka. Ini boleh mengandungi jumlah data yang besar yang boleh berguna, contohnya, untuk menangani perjanjian peringkat perkhidmatan atau untuk meramalkan pelanggaran keselamatan.

  • Data mata jualan: Apabila juruwang melelong kod bar sebarang produk yang anda beli, semua data yang dikaitkan dengan produk dihasilkan.

  • Data kewangan: Banyak sistem kewangan kini diprogramkan; mereka dikendalikan berdasarkan peraturan yang telah ditetapkan yang mengautomasikan proses. Data dagangan saham adalah contoh yang baik ini. Ia mengandungi data berstruktur seperti simbol syarikat dan nilai dolar. Beberapa data ini dihasilkan oleh mesin, dan ada yang dihasilkan oleh manusia.

Contoh data berstruktur manusia yang berstruktur mungkin termasuk berikut:

  • Data input: Ini adalah sekeping data yang mungkin dimasukkan oleh manusia ke komputer, seperti nama, umur, pendapatan, tidak bebas -balas jawapan tinjauan, dan sebagainya. Data ini berguna untuk memahami tingkah laku pelanggan asas.

  • Data strim Klik: Data dihasilkan setiap kali anda mengklik pautan di laman web. Data ini boleh dianalisis untuk menentukan tingkah laku pelanggan dan corak pembelian.

  • Data yang berkaitan dengan permainan: Setiap langkah yang anda buat dalam permainan boleh direkodkan. Ini berguna untuk memahami bagaimana pengguna akhir bergerak melalui portfolio permainan.

Apabila diambil bersama dengan berjuta-juta pengguna lain yang menghantar maklumat yang sama, saiznya adalah astronomi. Di samping itu, kebanyakan data ini mempunyai komponen masa nyata yang berguna untuk memahami pola yang mempunyai potensi meramalkan hasil.

Intinya adalah bahawa jenis maklumat ini boleh menjadi kuat dan boleh digunakan untuk banyak tujuan.

Peranan pangkalan data hubungan dalam data besar

Ketekalan data merujuk kepada bagaimana pangkalan data mengekalkan versi sendiri apabila diubahsuai. The granddaddy kedai data yang berterusan adalah sistem pengurusan pangkalan data relasi . Di peringkat awal, industri pengkomputeran menggunakan apa yang sekarang dianggap sebagai teknik primitif untuk kegigihan data. Model perhubungan dicipta oleh Edgar Codd, seorang saintis IBM, pada tahun 1970-an dan telah digunakan oleh IBM, Oracle, Microsoft, dan lain-lain. Ia masih banyak digunakan hari ini dan memainkan peranan penting dalam evolusi data besar. Memahami pangkalan data relasi adalah penting kerana jenis pangkalan data lain digunakan dengan data besar.

Dalam model hubungan, data disimpan dalam jadual. Pangkalan data ini akan mengandungi

skema - iaitu, representasi struktur dari apa yang terdapat dalam pangkalan data. Sebagai contoh, dalam pangkalan data relasional, skema menentukan jadual, medan dalam jadual, dan hubungan antara keduanya. Data disimpan dalam lajur, satu untuk setiap atribut tertentu. Data juga disimpan di baris. Jadual pertama menyimpan maklumat produk; kedai kedua maklumat demografi. Setiap mempunyai pelbagai sifat. Setiap jadual boleh dikemas kini dengan data baru, dan data boleh dipadam, dibaca, dan dikemas kini. Ini sering dicapai dalam model hubungan menggunakan bahasa pertanyaan berstruktur (SQL).

Aspek lain dari model perhubungan menggunakan SQL adalah bahawa jadual boleh dipertimbangkan menggunakan kunci biasa. Kunci umum dalam jadual ialah CustomerID.

Anda boleh menyerahkan pertanyaan, sebagai contoh, untuk menentukan jantina pelanggan yang membeli produk tertentu. Ia mungkin kelihatan seperti ini:

Pilih Pelanggan ID, Negeri, Jantina, Produk dari "jadual demografi", "jadual produk" di mana Produk = XXYY

Data berstruktur dalam Persekitaran Data Besar - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...