Video: Mayer Brown's Tech Talks, Episode 3: The Big Data Paradox 2024
Anda akan mendapati nuansa tentang analisis data besar. Ia benar-benar mengenai data kecil. Walaupun ini mungkin kelihatan mengelirukan dan bertentangan dengan keseluruhan premis, data kecil adalah hasil analisa data besar. Ini bukanlah satu konsep baru, ataupun ia tidak biasa kepada orang-orang yang telah melakukan analisis data untuk jangka masa yang lama. Ruang kerja keseluruhan lebih besar, tetapi jawapannya terletak di tempat "kecil. "
Analisis data tradisional bermula dengan pangkalan data penuh dengan maklumat pelanggan, informasi produk, transaksi, data telemetri, dan sebagainya. Walaupun begitu, terlalu banyak data tersedia untuk menganalisis dengan cekap. Sistem, rangkaian, dan perisian tidak mempunyai prestasi atau kemampuan untuk menangani skala tersebut. Sebagai industri, kelemahan ditangani dengan mewujudkan set data yang lebih kecil.
Ini set data yang lebih kecil masih cukup substantif, kekurangan lain telah ditemui dengan cepat; yang paling menonjol adalah ketidakcocokan antara data dan konteks kerja. Jika anda bekerja di Akaun yang Dibayar, anda perlu melihat sejumlah besar data yang tidak berkaitan untuk melakukan tugas anda. Sekali lagi, industri bertindak balas dengan mewujudkan set data yang lebih kecil dan konteks yang relevan - besar kepada kecil hingga lebih kecil lagi.
Anda boleh mengenali ini sebagai penghijrahan dari pangkalan data ke gudang data ke data marts. Selalunya tidak, data untuk gudang dan batu dipilih pada parameter sewenang-wenang atau eksperimen yang menghasilkan banyak percubaan dan kesilapan. Perniagaan tidak mendapat perspektif yang diperlukan atau mungkin kerana pengurangan kapasiti tidak berdasarkan fakta komputasi.
Masukkan data besar, dengan semua volum, halaju, dan jenisnya, dan masalahnya tetap atau mungkin bertambah buruk. Kekurangan infrastruktur telah ditangani dan boleh menyimpan dan memproses sejumlah besar data tambahan, tetapi teknologi baru diperlukan khusus untuk membantu menguruskan data besar.
Walaupun penampilan luar, ini adalah satu perkara yang menarik. Hari ini dan pada masa akan datang, syarikat akan mempunyai lebih banyak data daripada yang mereka bayangkan dan mereka akan mempunyai cara untuk menangkap dan menguruskannya. Apa yang lebih penting dari sebelumnya ialah keupayaan untuk menganalisis data hak dalam cara yang tepat pada masanya untuk membuat keputusan dan mengambil tindakan.
Perniagaan akan tetap menyusut set data ke dalam "melawan trim," tetapi mereka boleh berbuat demikian secara pengkomputeran. Mereka memproses data besar dan mengubahnya menjadi data kecil supaya mudah difahami. Ini lebih tepat dan, kerana ia berasal dari titik permulaan yang lebih besar, ia lebih relevan secara kontekstual.