Rumah Kewangan Peribadi Data berstruktur dalam Persekitaran Data Besar - dummies

Data berstruktur dalam Persekitaran Data Besar - dummies

Isi kandungan:

Video: Top 25 Excel 2016 Tips and Tricks 2024

Video: Top 25 Excel 2016 Tips and Tricks 2024
Anonim

Istilah data berstruktur secara umumnya merujuk kepada data yang mempunyai panjang dan format yang ditetapkan untuk data besar. Contoh data berstruktur termasuk nombor, tarikh, dan kumpulan perkataan dan nombor yang dipanggil rentetan . Kebanyakan pakar bersetuju bahawa data jenis ini menyumbang kira-kira 20 peratus daripada data yang ada di sini. Data berstruktur adalah data yang mungkin anda gunakan untuk berurusan. Ia biasanya disimpan dalam pangkalan data.

Sumber data besar berstruktur

Walaupun ini mungkin kelihatan seperti perniagaan seperti biasa, pada kenyataannya, data berstruktur mengambil peranan baru dalam dunia data besar. Evolusi teknologi menyediakan sumber-sumber baru yang berstruktur yang dihasilkan - seringkali dalam masa nyata dan dalam jumlah besar. Sumber data dibahagikan kepada dua kategori:

  • Komputer- atau mesin yang dihasilkan: Data yang dihasilkan oleh mesin umumnya merujuk kepada data yang dicipta oleh mesin tanpa intervensi manusia.

  • Manusia yang dihasilkan: Ini adalah data yang manusia, dalam interaksi dengan komputer, bekalan.

Sesetengah pakar berpendapat bahawa kategori ketiga wujud yang merupakan hibrid antara mesin dan manusia. Di sini, kami bimbang dengan dua kategori pertama.

Data berstruktur yang dihasilkan oleh mesin boleh termasuk yang berikut:

  • Data Sensor: Contohnya termasuk tag ID frekuensi radio, meter pintar, peranti perubatan dan data Sistem Kedudukan Global. Syarikat-syarikat berminat untuk pengurusan rantaian bekalan dan kawalan inventori.

  • data log web: Apabila pelayan, aplikasi, rangkaian, dan sebagainya beroperasi, mereka menangkap semua jenis data mengenai aktiviti mereka. Ini boleh mengandungi jumlah data yang besar yang boleh berguna, contohnya, untuk menangani perjanjian peringkat perkhidmatan atau untuk meramalkan pelanggaran keselamatan.

  • Data mata jualan: Apabila juruwang melelong kod bar sebarang produk yang anda beli, semua data yang dikaitkan dengan produk dihasilkan.

  • Data kewangan: Banyak sistem kewangan kini diprogramkan; mereka dikendalikan berdasarkan peraturan yang telah ditetapkan yang mengautomasikan proses. Data dagangan saham adalah contoh yang baik ini. Ia mengandungi data berstruktur seperti simbol syarikat dan nilai dolar. Beberapa data ini dihasilkan oleh mesin, dan ada yang dihasilkan oleh manusia.

Contoh data berstruktur manusia yang berstruktur mungkin termasuk berikut:

  • Data input: Ini adalah sekeping data yang mungkin dimasukkan oleh manusia ke komputer, seperti nama, umur, pendapatan, tidak bebas -balas jawapan tinjauan, dan sebagainya. Data ini berguna untuk memahami tingkah laku pelanggan asas.

  • Data strim Klik: Data dihasilkan setiap kali anda mengklik pautan di laman web. Data ini boleh dianalisis untuk menentukan tingkah laku pelanggan dan corak pembelian.

  • Data yang berkaitan dengan permainan: Setiap langkah yang anda buat dalam permainan boleh direkodkan. Ini berguna untuk memahami bagaimana pengguna akhir bergerak melalui portfolio permainan.

Apabila diambil bersama dengan berjuta-juta pengguna lain yang menghantar maklumat yang sama, saiznya adalah astronomi. Di samping itu, kebanyakan data ini mempunyai komponen masa nyata yang berguna untuk memahami pola yang mempunyai potensi meramalkan hasil.

Intinya adalah bahawa jenis maklumat ini boleh menjadi kuat dan boleh digunakan untuk banyak tujuan.

Peranan pangkalan data hubungan dalam data besar

Ketekalan data merujuk kepada bagaimana pangkalan data mengekalkan versi sendiri apabila diubahsuai. The granddaddy kedai data yang berterusan adalah sistem pengurusan pangkalan data relasi . Di peringkat awal, industri pengkomputeran menggunakan apa yang sekarang dianggap sebagai teknik primitif untuk kegigihan data. Model perhubungan dicipta oleh Edgar Codd, seorang saintis IBM, pada tahun 1970-an dan telah digunakan oleh IBM, Oracle, Microsoft, dan lain-lain. Ia masih banyak digunakan hari ini dan memainkan peranan penting dalam evolusi data besar. Memahami pangkalan data relasi adalah penting kerana jenis pangkalan data lain digunakan dengan data besar.

Dalam model hubungan, data disimpan dalam jadual. Pangkalan data ini akan mengandungi

skema - iaitu, representasi struktur dari apa yang terdapat dalam pangkalan data. Sebagai contoh, dalam pangkalan data relasional, skema menentukan jadual, medan dalam jadual, dan hubungan antara keduanya. Data disimpan dalam lajur, satu untuk setiap atribut tertentu. Data juga disimpan di baris. Jadual pertama menyimpan maklumat produk; kedai kedua maklumat demografi. Setiap mempunyai pelbagai sifat. Setiap jadual boleh dikemas kini dengan data baru, dan data boleh dipadam, dibaca, dan dikemas kini. Ini sering dicapai dalam model hubungan menggunakan bahasa pertanyaan berstruktur (SQL).

Aspek lain dari model perhubungan menggunakan SQL adalah bahawa jadual boleh dipertimbangkan menggunakan kunci biasa. Kunci umum dalam jadual ialah CustomerID.

Anda boleh menyerahkan pertanyaan, sebagai contoh, untuk menentukan jantina pelanggan yang membeli produk tertentu. Ia mungkin kelihatan seperti ini:

Pilih Pelanggan ID, Negeri, Jantina, Produk dari "jadual demografi", "jadual produk" di mana Produk = XXYY

Data berstruktur dalam Persekitaran Data Besar - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...