Video: The Internet of Things by James Whittaker of Microsoft 2024
Kedua-dua sistem purata dan mengundi juga boleh berfungsi dengan baik apabila anda menggunakan campuran pembelajaran mesin yang berbeza algoritma. Ini adalah pendekatan purata, dan ia digunakan secara meluas apabila anda tidak dapat mengurangkan varians anggaran.
Semasa anda cuba belajar daripada data, anda perlu mencuba penyelesaian yang berbeza, dengan itu memodelkan data anda menggunakan penyelesaian pembelajaran mesin yang berbeza. Adalah amalan yang baik untuk memeriksa sama ada anda boleh meletakkan beberapa daripada mereka berjaya ke ensembles menggunakan purata ramalan atau dengan mengira kelas yang diramalkan. Prinsipnya adalah sama dengan ramalan yang tidak dikecilkan, apabila model dicampur bersama dapat menghasilkan ramalan yang dipengaruhi oleh variasi. Untuk mencapai purata yang berkesan, anda perlu
- Bahagikan data anda ke dalam latihan dan set ujian.
- Gunakan data latihan dengan algoritma pembelajaran mesin yang berlainan.
- Rekod ramalan dari setiap algoritma dan menilai daya maju keputusan menggunakan set ujian.
- Hubungkan semua ramalan yang ada antara satu sama lain.
- Pilih ramalan yang kurang berkorelasi dan purata hasilnya. Atau, jika anda mengklasifikasikan, pilih sekumpulan ramalan berkorelasi paling kurang dan, untuk setiap contoh, pilih sebagai ramalan kelas baru kelas yang majoritinya diramalkan.
- Uji prediksi yang baru disusun purata atau mengundi mengikut majoriti data ujian. Jika berjaya, anda membuat model akhir anda dengan purata hasil bahagian-bahagian model ensemble yang berjaya.
Untuk memahami model mana yang paling berkaitan, ambil ramalan satu persatu, saling menghubungkannya dengan yang lain, dan purata korelasi untuk mendapatkan korelasi yang rata. Gunakan korelasi purata untuk menilai ramalan yang dipilih yang paling sesuai untuk purata.