Video: Big Data Week, pertaruhan segmen Big Data Analytics 2024
Adakah data besar benar-benar baru atau apakah evolusi dalam perjalanan pengurusan data? Ia sebenarnya keduanya. Seperti gelombang lain dalam pengurusan data, data besar dibina atas evolusi amalan pengurusan data sejak lima dekad yang lalu. Apa yang baru adalah untuk kali pertama, kos kitaran dan storan pengkomputeran telah mencapai titik tip. Kenapa ini penting?
Hanya beberapa tahun yang lalu, organisasi biasanya akan berkompromi dengan menyimpan gambar atau subset maklumat penting kerana kos penyimpanan dan batasan pemprosesan melarang mereka menyimpan semua yang mereka mahu analisa.
Dalam banyak situasi, kompromi ini berfungsi dengan baik. Sebagai contoh, sebuah syarikat perkilangan mungkin telah mengumpul data mesin setiap dua minit untuk menentukan kesihatan sistem. Walau bagaimanapun, mungkin terdapat situasi di mana snapshot tidak akan mengandungi maklumat tentang jenis kecacatan baru dan mungkin tidak diketahui selama berbulan-bulan.
Dengan data yang besar, kini mungkin untuk maya data supaya ia boleh disimpan dengan cekap dan, menggunakan storan berasaskan awan, lebih berkesan secara kos. Di samping itu, penambahbaikan dalam kelajuan dan kebolehpercayaan rangkaian telah menghapuskan batasan fizikal yang lain untuk dapat menguruskan sejumlah besar data pada kadar yang boleh diterima.
Tambah kesan perubahan dalam harga dan kecanggihan ingatan komputer. Dengan semua peralihan teknologi ini, kini mungkin untuk membayangkan cara syarikat boleh memanfaatkan data yang mungkin tidak dapat difahami hanya lima tahun yang lalu.
Tetapi tiada peralihan teknologi berlaku secara berasingan; ia berlaku apabila keperluan penting wujud yang boleh dipenuhi oleh ketersediaan dan pematangan teknologi. Kebanyakan teknologi di tengah-tengah data besar, seperti virtualisasi, pemprosesan selari, sistem fail diedarkan, dan pangkalan data dalam memori, telah wujud selama beberapa dekad.
Analisis lanjutan juga telah berlaku selama beberapa dekad, walaupun mereka tidak selalu praktikal. Teknologi lain seperti Hadoop dan MapReduce telah berada di tempat kejadian selama beberapa tahun sahaja. Gabungan kemajuan teknologi kini boleh menangani masalah perniagaan yang penting. Perniagaan ingin mendapatkan pandangan dan hasil yang boleh diambil dari pelbagai jenis data pada kelajuan yang betul.
Jika syarikat boleh menganalisis petabytes data (bersamaan dengan 20 juta kabinet fail empat laci yang diisi dengan fail teks atau 13. 3 tahun kandungan HDTV) dengan prestasi yang dapat diterima untuk membezakan corak dan anomali, perniagaan boleh mula memahami data dengan cara yang baru.Pindah ke data besar bukan hanya tentang perniagaan.
Sains, penyelidikan, dan aktiviti-aktiviti kerajaan juga telah membantu menggerakkannya ke hadapan. Cukup fikirkan tentang menganalisis genom manusia atau berurusan dengan semua data astronomi yang dikumpulkan di pemerhatian untuk memajukan pemahaman kita tentang dunia di sekeliling kita. Pertimbangkan jumlah data yang dikumpulkan oleh kerajaan dalam aktiviti antiterroristnya, dan anda mendapat idea bahawa data besar bukan hanya tentang perniagaan.
Pendekatan yang berbeza untuk mengendalikan data wujud. Pergerakan data akan digunakan jika syarikat dapat menganalisis kualiti produknya semasa proses pembuatan untuk mengelakkan kesilapan yang mahal. Data selebihnya akan digunakan oleh penganalisis perniagaan untuk lebih memahami pola pembelian semasa pelanggan berdasarkan semua aspek perhubungan pelanggan, termasuk jualan, data media sosial, dan interaksi perkhidmatan pelanggan.
Perlu diingat bahawa perniagaan masih pada peringkat awal memanfaatkan jumlah data yang besar untuk mendapatkan pandangan 360 darjah perniagaan dan menjangka pergeseran dan perubahan harapan pelanggan. Teknologi yang diperlukan untuk mendapatkan jawapan keperluan perniagaan masih terpencil dari satu sama lain.
Data besar bukan hanya tentang satu alat atau satu teknologi. Ini mengenai bagaimana semua teknologi ini datang bersama untuk memberikan wawasan yang tepat, pada masa yang tepat, berdasarkan data yang betul - sama ada ia dihasilkan oleh orang, mesin, atau web.