Video: Awas Terjebak, Ini Ciri-Ciri Fintech Ilegal 2024
Analisis data yang besar telah mendapat banyak gembar-gembur baru-baru ini, dan untuk alasan yang baik. Anda perlu mengetahui ciri-ciri analisis data besar jika anda ingin menjadi sebahagian daripada pergerakan ini. Syarikat tahu bahawa ada sesuatu di luar sana, tetapi sehingga baru-baru ini, tidak dapat melombongnya. Ini menolak sampul analisis adalah aspek yang menarik dalam pergerakan analisis data yang besar.
Syarikat teruja untuk dapat mengakses dan menganalisis data yang telah mereka kumpulkan atau ingin mendapatkan wawasan, tetapi tidak dapat mengurus atau menganalisis dengan berkesan. Ini mungkin melibatkan menggambarkan sejumlah besar data yang berlainan, atau mungkin melibatkan penstrimanan maju maju pada anda dalam masa nyata. Ia adalah evolusi dalam beberapa aspek dan revolusioner dalam yang lain.
Jadi, apa yang berbeza apabila syarikat anda menolak sampul dengan analisis data yang besar? Infrastruktur yang menyokong analisis data yang besar adalah berbeza dan algoritma telah diubah menjadi infrastruktur sedar.
Analisis data yang besar harus dilihat dari dua perspektif:
-
Berorientasikan Keputusan
-
Berorientasikan Tindakan
Analisis berorientasi keputusan lebih mirip dengan kecerdasan perniagaan tradisional. Lihat subset selektif dan perwakilan sumber data yang lebih besar dan cuba menerapkan hasilnya ke proses membuat keputusan perniagaan. Sudah tentu keputusan ini mungkin mengakibatkan beberapa tindakan atau perubahan proses, tetapi tujuan analisis adalah untuk menambah keputusan.
Analisis berorientasikan tindakan digunakan untuk sambutan cepat, apabila pola muncul atau jenis data tertentu dikesan dan tindakan diperlukan. Mengambil kesempatan daripada data besar melalui analisis dan menyebabkan perubahan tingkah laku yang proaktif atau reaktif menawarkan potensi yang besar untuk pengguna awal.
Mencari dan menggunakan data besar dengan membuat aplikasi analisis dapat memegang kunci untuk mengekstrak nilai lebih cepat daripada kemudian. Untuk melaksanakan tugas ini, lebih berkesan untuk membina aplikasi khusus ini dari awal atau dengan memanfaatkan platform dan / atau komponen.
Pertama, lihat beberapa ciri tambahan analisis data besar yang menjadikannya berbeza daripada jenis analisis tradisional selain dari tiga Vs volum, halaju, dan variasi:
-
programatik. Salah satu perubahan terbesar dalam analisis adalah bahawa pada masa lalu anda sedang berurusan dengan set data yang anda dapat memuatkan secara manual ke dalam aplikasi dan meneroka. Dengan analisis data yang besar, anda mungkin menghadapi situasi di mana anda boleh memulakan dengan data mentah yang sering perlu ditangani pemrograman untuk melakukan apa-apa jenis penerokaan kerana skala data.
-
Ia boleh didorong data. Walaupun banyak saintis data menggunakan pendekatan berasaskan hipotesis untuk analisis data (membangun premis dan mengumpul data untuk melihat sama ada premis itu betul), anda juga boleh menggunakan data untuk memacu analisis - terutama jika anda telah mengumpul besar jumlahnya. Sebagai contoh, anda boleh menggunakan algoritma mesin pembelajaran untuk melakukan analisis bebas hipotesis semacam ini.
-
Ia boleh menggunakan banyak atribut. Pada masa lalu, anda mungkin telah berurusan dengan beratus-ratus atribut atau ciri-ciri sumber data itu. Kini anda mungkin berurusan dengan beratus-ratus gigabait data yang terdiri daripada ribuan atribut dan berjuta-juta pemerhatian. Semuanya kini berlaku pada skala yang lebih besar.
-
Ia boleh berulang. Kuasa pengiraan yang lebih tinggi bermakna bahawa anda boleh melaraskan model anda sehingga anda mendapatkannya bagaimana anda menginginkannya. Berikut adalah contohnya. Anggapkan anda membina model yang cuba mencari prediktor untuk tingkah laku pelanggan tertentu yang berkaitan. Anda mungkin mula mengekstrak sampel data yang munasabah atau menyambung ke mana data berada. Anda mungkin membina model untuk menguji hipotesis.
Manakala pada masa lalu anda mungkin tidak mempunyai banyak ingatan untuk membuat model anda berfungsi dengan berkesan, anda memerlukan sejumlah besar memori fizikal untuk melewati lelaran yang diperlukan untuk melatih algoritma. Ia juga mungkin perlu menggunakan teknik pengkomputeran lanjutan seperti pemprosesan bahasa semulajadi atau rangkaian saraf yang secara automatik mengubah model berdasarkan pembelajaran kerana lebih banyak data ditambah.
-
Ia boleh menjadi pantas untuk mendapatkan kiraan yang anda perlukan dengan memanfaatkan Infrastruktur berasaskan awan sebagai Perkhidmatan. Dengan platform Infrastruktur sebagai Platform (IaaS) seperti Amazon Cloud Services (ACS), anda dapat dengan cepat menyediakan sekumpulan mesin untuk menumpuk set data besar dan menganalisisnya dengan cepat.