Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024
Pada tahap tembaga, klasifikasi data analitik ramalan terdiri daripada dua peringkat: peringkat pembelajaran dan peringkat ramalan. Tahap pembelajaran memerlukan latihan model klasifikasi dengan menjalankan set data lepas yang ditetapkan melalui pengelas. Matlamatnya ialah untuk mengajar model anda untuk mengekstrak dan menemui hubungan dan peraturan tersembunyi - peraturan klasifikasi dari data sejarah (latihan). Model ini melakukannya dengan menggunakan algoritma klasifikasi.
Peringkat ramalan yang mengikuti peringkat pembelajaran terdiri daripada model yang diramalkan label kelas baru atau nilai berangka yang mengklasifikasikan data yang tidak pernah dilihat sebelumnya (iaitu, data ujian).
Untuk menggambarkan peringkat ini, katakan anda pemilik kedai dalam talian yang menjual jam tangan. Anda telah memiliki kedai dalam talian untuk seketika, dan telah mengumpulkan banyak data transaksional dan data peribadi mengenai pelanggan yang membeli jam tangan dari kedai anda. Katakan anda telah menangkap data tersebut melalui laman anda dengan menyediakan borang web, sebagai tambahan kepada data transaksional yang anda kumpulkan melalui operasi.
Anda juga boleh membeli data dari pihak ketiga yang menyediakan maklumat mengenai pelanggan anda di luar minat mereka terhadap jam tangan. Itu tidak sekeras bunyi; terdapat syarikat yang model perniagaannya adalah untuk mengesan pelanggan dalam talian dan mengumpul dan menjual maklumat berharga tentang mereka.
Kebanyakan syarikat pihak ketiga mengumpul data dari laman media sosial dan menggunakan kaedah penambangan data untuk mengetahui hubungan pengguna individu dengan produk. Dalam kes ini, sebagai pemilik kedai menonton, anda akan berminat dengan hubungan antara pelanggan dan minat mereka untuk membeli jam tangan.
Anda boleh menyimpulkan jenis maklumat ini daripada menganalisis, sebagai contoh, profil rangkaian sosial pelanggan, atau ulasan microblog jenis yang anda temukan di Twitter.
Untuk mengukur tahap kepentingan individu dalam jam tangan, anda boleh menggunakan mana-mana beberapa alat analisis teks yang dapat menemui korelasi tersebut dalam teks bertulis individu (status rangkaian sosial, tweet, penyiaran blog dan sebagainya) atau aktiviti dalam talian seperti interaksi sosial dalam talian, muat naik foto, dan carian).
Selepas anda mengumpul semua data mengenai transaksi lalu dan kepentingan pelanggan masa lalu anda - data latihan yang menunjukkan model anda untuk dicari - anda perlu menyusunnya menjadi struktur yang menjadikannya mudah diakses dan digunakan (seperti pangkalan data).
Pada ketika ini, anda telah mencapai tahap klasifikasi data kedua: peringkat ramalan, yang semuanya adalah tentang menguji model anda dan ketepatan peraturan klasifikasi yang dihasilkannya. Untuk tujuan itu, anda perlu data pelanggan bersejarah tambahan, dirujuk sebagai data ujian (yang berbeza daripada data latihan).
Anda memakan data ujian ini ke dalam model anda dan mengukur ketepatan ramalan yang dihasilkan. Anda mengira masa yang model itu diramalkan dengan betul akan tingkah laku masa depan pelanggan yang diwakili dalam data ujian anda. Anda juga mengira masa bahawa model membuat ramalan salah.
Pada ketika ini, anda hanya mempunyai dua kemungkinan hasil: Sama ada anda berpuas hati dengan ketepatan model atau anda tidak:
-
Jika anda berpuas hati, anda boleh mula membuat model anda bersedia untuk membuat ramalan sebagai sebahagian daripada sistem pengeluaran.
-
Jika anda tidak berpuas hati dengan ramalan, maka anda perlu melatih semula model anda dengan dataset latihan yang baru.
Jika data latihan asal anda tidak cukup mewakili kumpulan pelanggan anda - atau mengandungi data bising yang melenyapkan hasil model dengan memperkenalkan isyarat palsu - maka ada lebih banyak pekerjaan yang perlu dilakukan untuk mendapatkan model anda dan berjalan. Sama ada hasil berguna dalam perjalanannya.