Video: Essential Scale-Out Computing by James Cuff 2024
Pelbagai algoritma statistik, data perlombongan, dan mesin pembelajaran boleh didapati untuk digunakan dalam model analisis ramalan anda. Anda berada dalam kedudukan yang lebih baik untuk memilih algoritma selepas anda menentukan objektif model anda dan memilih data yang akan anda lakukan.
Sesetengah algoritma ini telah dibangunkan untuk menyelesaikan masalah perniagaan tertentu, meningkatkan algoritma sedia ada, atau memberikan keupayaan baru - yang mungkin membuat sesetengahnya lebih sesuai untuk tujuan anda daripada yang lain. Anda boleh memilih dari pelbagai algoritma untuk menangani kebimbangan perniagaan seperti berikut:
-
Untuk segmentasi pelanggan dan / atau pengesanan komuniti dalam lingkungan sosial, contohnya, anda memerlukan algoritma kluster.
-
Untuk pengekalan pelanggan atau untuk membangunkan sistem pengesyorkan, anda akan menggunakan algoritma klasifikasi.
-
Untuk pemarkahan kredit atau meramalkan hasil seterusnya yang didorong oleh masa, anda akan menggunakan algoritma regresi.
Seperti yang dibenarkan oleh masa dan sumber, anda harus menjalankan banyak algoritma jenis sesuai yang anda boleh. Membandingkan pelbagai algoritma yang berbeza boleh membawa penemuan yang mengejutkan mengenai data atau perisikan perniagaan yang tertanam dalam data. Melakukannya memberikan anda wawasan yang lebih terperinci mengenai masalah perniagaan, dan membantu anda mengenal pasti pembolehubah mana dalam data anda mempunyai kuasa ramalan.
Sesetengah projek analisis ramalan berjaya dengan baik dengan membina model ensemble , sekumpulan model yang beroperasi pada data yang sama. Model ensemble menggunakan mekanisme yang telah ditetapkan untuk mengumpulkan hasil dari semua model komponennya dan memberikan hasil akhir bagi pengguna.
Model boleh mengambil pelbagai bentuk - pertanyaan, koleksi senario, pokok keputusan, atau analisis matematik lanjutan. Di samping itu, model tertentu berfungsi dengan baik untuk data dan analisis tertentu. Anda boleh (contohnya) menggunakan algoritma klasifikasi yang menggunakan peraturan keputusan untuk menentukan hasil senario atau transaksi yang diberikan, menangani soalan seperti ini:
-
Adakah pelanggan ini mungkin bertindak balas terhadap kempen pemasaran kami?
-
Adakah pemindahan wang ini mungkin menjadi sebahagian daripada skim pencucian wang?
-
Adakah pemohon pinjaman ini mungkin gagal membuat pinjaman?
Anda boleh menggunakan algoritma pengelompokan yang tidak dikendalikan untuk mencari apa hubungan yang wujud dalam dataset anda. Anda boleh menggunakan algoritma ini untuk mencari pengelompokan yang berbeza di kalangan pelanggan anda, tentukan perkhidmatan apa yang boleh dikumpulkan bersama, atau tentukan contoh produk mana yang boleh dijadikan upsold.
Algoritma regresi boleh digunakan untuk meramalkan data berterusan, seperti meramal trend untuk pergerakan saham berdasarkan harga masa lalu.
Objektif data dan perniagaan bukanlah satu-satunya faktor yang perlu dipertimbangkan apabila anda memilih algoritma. Kepakaran saintis data anda adalah nilai yang luar biasa pada ketika ini; memilih algoritma yang akan mendapat pekerjaan yang dilakukan sering merupakan gabungan yang rumit daripada sains dan seni.
Bahagian seni berasal dari pengalaman dan kemahiran dalam domain perniagaan, yang juga memainkan peranan penting dalam mengenal pasti model yang dapat memberi tujuan perniagaan dengan tepat.