Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024
Sebahagian Pembelajaran Mesin Untuk Menipu Cheat Sheet < Pembelajaran mesin melibatkan penggunaan banyak algoritma yang berbeza. Jadual ini memberi anda ringkasan ringkas kekuatan dan kelemahan pelbagai algoritma.
Algoritma
Terbaik di | Kelebihan | Cons | Hutan Rawak |
Apt di hampir semua masalah pembelajaran mesin | Bioinformatics
Boleh bekerja secara selari |
> Secara automatik mengendalikan nilai-nilai yang hilang
Tidak perlu mengubah sebarang pembolehubah Tidak perlu tweak parameter Dapat digunakan oleh hampir semua orang dengan hasil yang sangat baik Sulit untuk menafsirkan Rusak pada regresi ketika memperkirakan nilai-nilai persamaan penyebaran nilai tindak balas |
Bias dalam masalah multiclass ke arah kelas yang lebih kerap
Gradient Boosting Apt di hampir mana-mana masalah pembelajaran mesin |
Enjin carian (menyelesaikan masalah pembelajaran berpangkat) > Ia boleh menganggar kebanyakan fungsi tidak linear | Terbaik dalam peramal kelas
Secara automatik menangani nilai yang hilang |
Tidak perlu mengubah mana-mana pembolehubah
Ia boleh overfit jika dijalankan terlalu banyak lelaran Sensitif kepada data bising dan outliers Tidak berfungsi dengan baik tanpa penalaan parameter |
Regresi linear
Prinsip asas tions ramalan Econometric |
Respons pemasaran pemasaran | Mudah difahami dan dijelaskan
Ia jarang overfits Menggunakan regularization L1 & L2 berkesan dalam pemilihan ciri |
Cepat untuk melatih
melatih pada data besar terima kasih kepada versi stokastik Anda perlu bekerja keras untuk menjadikannya sesuai dengan fungsi tidak linear Dapat menderita dari outliers Mesin Vektor Sokongan |
Pengenalan karakter
Pengenalan imej |
Teks klasifikasi | Penciptaan ciri nonlinear automatik
Boleh menghitung fungsi bukan linear yang kompleks Sulit untuk mentafsirkan apabila menggunakan kernel tidak linear |
Menghadapi terlalu banyak contoh, selepas 10, 000 contohnya bermula terlalu lama untuk melatih
K-berdekatan terdekat |
Penglihatan komputer
Penandaan multilabel |
Sistem penasihat | Masalah pemeriksaan ejaan
Latihan cepat dan malas Boleh secara semula jadi menangani masalah multiklass yang melampau (seperti teks penandaan) dan rumit dalam fasa memprediksi |
Boleh gagal untuk meramal kor ectly kerana kutukan dimensi
Adaboost |
Pengesanan muka
Secara automatik mengendalikan nilai-nilai yang hilang |
Tidak perlu mengubah sebarang pembolehubah | Ia tidak mudah dengan mudah | Beberapa parameter untuk tweak > Ia boleh memanfaatkan banyak pelajar yang lemah
Sensitif kepada data yang bising dan outliers Tidak pernah ramalan kelas terbaik Nave Bayes Pengenalan muka |
Analisis sentimen
Pengesanan spam |
Pengelasan teks | Mudah dan cepat untuk dilaksanakan, tidak memerlukan memori yang terlalu banyak dan boleh digunakan untuk pembelajaran dalam talian
Mudah difahami Mengambil kira pengetahuan terdahulu Andaian ciri kemerdekaan yang kuat dan tidak realistik > Gagal menganggarkan kejadian langka |
Menghadapi ciri tidak relevan
Rangkaian saraf Pengenalan imej |
Pengiktirafan dan terjemahan bahasa
Pengenalan pertuturan Pengiktirafan penglihatan |
Teguh untuk mengatasi | Bekerja hanya dengan sebahagian daripada contoh (vektor sokongan s)
Sangat sukar untuk menetapkan Sulit untuk menyesuaikan kerana terlalu banyak parameter dan anda juga perlu memutuskan seni bina rangkaian Sukar menafsirkan |
Mudah untuk overfit
Regresi logistik < Memesan keputusan dengan kebarangkalian Respons pemasaran pemasaran |
Mudah difahami dan dijelaskan
Ia jarang overfits Menggunakan regularization L1 & L2 berkesan dalam pemilihan ciri Algoritma terbaik untuk meramal kebarangkalian acara |
Cepat untuk melatih | Mudah melatih pada data besar terima kasih kepada versi stokastik
Anda perlu bekerja keras untuk menjadikannya sesuai dengan fungsi tidak linear |
Boleh menderita daripada penyokong
SVD sistem Boleh menyusun semula data dengan cara yang bermakna Sulit untuk memahami mengapa data telah disusun semula dengan cara tertentu PCA |
Mengeluarkan kolarisar
Mengurangkan dimensi dataset |
Mengandulkan andaian linear kuat (komponen adalah penjumlahan terperinci ciri) K-means | Segmentation | Fast in finding clusters | |
Dapat mengesan outliers dalam pelbagai dimensi | Berada dari multicollinearity
Clusters adalah bulat, tidak dapat mengesan kelompok bentuk lain |
penyelesaiannya, bergantung pada permulaan |
|