Rumah Kewangan Peribadi Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Video: 700-an Pendekar SH Terate Bela 3 Guru Dituntut 14 Tahun Penjara 2024

Video: 700-an Pendekar SH Terate Bela 3 Guru Dituntut 14 Tahun Penjara 2024
Anonim

Di dunia yang sempurna, anda boleh melakukan ujian ke atas data yang tidak pernah dipelajari oleh algoritma mesin anda sebelum ini. Walau bagaimanapun, menunggu data segar tidak semestinya layak dari segi masa dan kos.

Sebagai ubat mudah pertama, anda boleh secara rawak memisahkan data anda ke dalam latihan dan set ujian. Perpecahan biasa adalah dari 25 hingga 30 peratus untuk ujian dan baki 75 hingga 70 peratus untuk latihan. Anda memecah data anda yang terdiri daripada respons dan ciri anda pada masa yang sama, menjaga korespondensi antara setiap tindak balas dan ciri-cirinya.

Ubat kedua berlaku apabila anda perlu menyesuaikan algoritma pembelajaran anda. Dalam kes ini, data perpecahan ujian bukan amalan yang baik kerana ia menyebabkan satu lagi jenis overfitting yang dipanggil pengintipan. Untuk mengatasi pengintipan, anda memerlukan pecahan ketiga, yang dipanggil set pengesahan. Pemisahan yang dicadangkan adalah untuk contoh anda dibahagikan kepada ketiga: 70 peratus untuk latihan, 20 peratus untuk pengesahan, dan 10 peratus untuk ujian.

Anda harus melakukan split secara rawak, iaitu tanpa mengira pesanan awal data. Jika tidak, ujian anda tidak boleh dipercayai, kerana pesanan boleh menyebabkan overestimation (apabila ada pesanan yang bermakna) atau meremehkan (apabila pengedaran berbeza terlalu banyak). Sebagai penyelesaian, anda mesti memastikan bahawa pengedaran set ujian tidak begitu berbeza dari pengedaran latihan, dan urutan berurutan berlaku dalam data perpecahan.

Sebagai contoh, periksa sama ada nombor pengenalan, apabila tersedia, berterusan dalam set anda. Kadang-kala, walaupun anda secara tegas mematuhi pensampelan rawak, anda tidak boleh selalu memperoleh pengedaran serupa di antara set, terutama apabila bilangan contoh anda kecil.

Apabila jumlah contoh n anda tinggi, seperti n> 10, 000, anda boleh dengan mudah yakin membuat kumpulan dataset secara rawak. Apabila dataset lebih kecil, membandingkan statistik asas seperti min, mod, median, dan varians merentas respon dan ciri dalam latihan dan set ujian akan membantu anda memahami sama ada set ujian tidak sesuai. Apabila anda tidak pasti perpecahan itu adalah betul, hanya mengira semula yang baru.

Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...