Video: Cara Mengingat Tanpa Menghafal - Tip Profesional 2024
Manusia kini berada di persimpangan luar biasa data volum yang belum pernah terjadi sebelumnya, yang dihasilkan oleh perkakasan yang semakin kecil dan berkuasa, dan dianalisis dengan algoritma yang sama proses membantu berkembang. Ia bukan sekadar soal kelantangan, yang dengan sendirinya adalah cabaran yang sukar.
Seperti yang diformalkan oleh syarikat penyelidikan Gartner pada tahun 2001 dan kemudian ditimbulkan dan diperluas oleh syarikat lain, seperti IBM, data besar dapat diringkaskan oleh empat V yang mewakili ciri-ciri utama:
pada masa itu, mengenai berapa banyak data dapat membantu penemuan saintifik di luar kaedah saintifik. Penulis bergantung kepada contoh Google dalam sektor perniagaan pengiklanan dan terjemahan, di mana syarikat dapat mencapai keunggulan tanpa menggunakan model atau teori tertentu, tetapi dengan menggunakan algoritma untuk belajar dari data. Seperti dalam pengiklanan, data sains (fizik, biologi) boleh menyokong inovasi yang membolehkan saintis mendekatkan masalah tanpa hipotesis tetapi dengan mempertimbangkan variasi yang terdapat dalam banyak data dan oleh algoritma penemuan.
Ciri kebenaran membantu pendemokrasian data itu sendiri. Pada masa lalu, organisasi mengumpulkan data kerana ia adalah berharga dan sukar diperoleh. Pada ketika ini, pelbagai sumber mencipta data dalam jumlah yang semakin meningkat sehingga penimbunan itu tidak bermakna (90 peratus daripada data dunia telah dibuat dalam dua tahun terakhir), jadi tidak ada alasan untuk menghadkan akses. Data berubah menjadi komoditi seperti itu bahawa terdapat banyak program data terbuka yang berlaku di seluruh dunia.(Amerika Syarikat mempunyai tradisi akses terbuka yang panjang; program data terbuka yang pertama bermula pada 1970-an ketika Pentadbiran Oseanik dan Atmosfera Kebangsaan, NOAA, mulai melepaskan data cuaca secara bebas kepada orang awam.) Namun, karena data telah menjadi komoditi, ketidakpastian data itu telah menjadi isu. Anda tidak lagi mengetahui sama ada data itu benar sepenuhnya kerana anda mungkin tidak tahu sumbernya.
Data telah menjadi begitu teruk bahawa nilainya tidak lagi dalam maklumat sebenar (seperti data yang disimpan dalam pangkalan data firma). Nilai data wujud dalam cara anda menggunakannya. Di sini algoritma datang bermain dan menukar permainan. Sebuah syarikat seperti Google memberi suapan dari data yang tersedia secara bebas, seperti kandungan tapak web atau teks yang terdapat dalam teks dan buku yang tersedia secara umum. Namun, nilai ekstrak Google dari data kebanyakannya berasal dari algoritmanya. Sebagai contoh, nilai data berada dalam algoritma PageRank (digambarkan dalam Bab 11), yang merupakan asas perniagaan Google. Nilai algoritma adalah benar untuk syarikat lain juga. Enjin cadangan Amazon menyumbang sebahagian besar daripada pendapatan syarikat. Kebanyakan firma kewangan menggunakan perdagangan algoritma dan nasihat robo, memanfaatkan data stok yang tersedia dan maklumat ekonomi untuk pelaburan.