Rumah Kewangan Peribadi Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Video: 700-an Pendekar SH Terate Bela 3 Guru Dituntut 14 Tahun Penjara 2024

Video: 700-an Pendekar SH Terate Bela 3 Guru Dituntut 14 Tahun Penjara 2024
Anonim

Di dunia yang sempurna, anda boleh melakukan ujian ke atas data yang tidak pernah dipelajari oleh algoritma mesin anda sebelum ini. Walau bagaimanapun, menunggu data segar tidak semestinya layak dari segi masa dan kos.

Sebagai ubat mudah pertama, anda boleh secara rawak memisahkan data anda ke dalam latihan dan set ujian. Perpecahan biasa adalah dari 25 hingga 30 peratus untuk ujian dan baki 75 hingga 70 peratus untuk latihan. Anda memecah data anda yang terdiri daripada respons dan ciri anda pada masa yang sama, menjaga korespondensi antara setiap tindak balas dan ciri-cirinya.

Ubat kedua berlaku apabila anda perlu menyesuaikan algoritma pembelajaran anda. Dalam kes ini, data perpecahan ujian bukan amalan yang baik kerana ia menyebabkan satu lagi jenis overfitting yang dipanggil pengintipan. Untuk mengatasi pengintipan, anda memerlukan pecahan ketiga, yang dipanggil set pengesahan. Pemisahan yang dicadangkan adalah untuk contoh anda dibahagikan kepada ketiga: 70 peratus untuk latihan, 20 peratus untuk pengesahan, dan 10 peratus untuk ujian.

Anda harus melakukan split secara rawak, iaitu tanpa mengira pesanan awal data. Jika tidak, ujian anda tidak boleh dipercayai, kerana pesanan boleh menyebabkan overestimation (apabila ada pesanan yang bermakna) atau meremehkan (apabila pengedaran berbeza terlalu banyak). Sebagai penyelesaian, anda mesti memastikan bahawa pengedaran set ujian tidak begitu berbeza dari pengedaran latihan, dan urutan berurutan berlaku dalam data perpecahan.

Sebagai contoh, periksa sama ada nombor pengenalan, apabila tersedia, berterusan dalam set anda. Kadang-kala, walaupun anda secara tegas mematuhi pensampelan rawak, anda tidak boleh selalu memperoleh pengedaran serupa di antara set, terutama apabila bilangan contoh anda kecil.

Apabila jumlah contoh n anda tinggi, seperti n> 10, 000, anda boleh dengan mudah yakin membuat kumpulan dataset secara rawak. Apabila dataset lebih kecil, membandingkan statistik asas seperti min, mod, median, dan varians merentas respon dan ciri dalam latihan dan set ujian akan membantu anda memahami sama ada set ujian tidak sesuai. Apabila anda tidak pasti perpecahan itu adalah betul, hanya mengira semula yang baru.

Latihan, Pengesahan, dan Pengujian dalam Pembelajaran Mesin - monyet

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...