Rumah Kewangan Peribadi Cara menjalankan data latihan dalam model pembelajaran yang diselia SVM - dummies

Cara menjalankan data latihan dalam model pembelajaran yang diselia SVM - dummies

Video: Data Analysis in R by Dustin Tran 2024

Video: Data Analysis in R by Dustin Tran 2024
Anonim

Sebelum anda boleh memberi suapan pengeluar Mesin Vektor Sokongan (SVM) dengan data yang dimuatkan untuk analisis ramalan, anda mesti memisahkan dataset penuh ke dalam satu set latihan dan set ujian.

Untungnya, scikit-learning telah melaksanakan fungsi yang akan membantu anda dengan mudah memisahkan dataset penuh. Fungsi train_test_split mengambil sebagai input satu dataset dan nilai peratusan. Nilai peratusan digunakan untuk menentukan saiz set ujian. Fungsi ini mengembalikan dua dataset: dataset test (dengan saiz yang ditetapkan) dan dataset latihan (yang menggunakan data yang tersisa).

Biasanya, seseorang boleh mengambil sekitar 70-80 peratus daripada data untuk digunakan sebagai set latihan dan menggunakan baki data sebagai set ujian. Tetapi dataset Iris sangat kecil (hanya 150 contoh), jadi anda boleh mengambil 90 peratus untuk melatih model dan menggunakan 10 peratus lain sebagai data ujian untuk melihat bagaimana model ramalan anda akan tampil.

Ketik kod berikut untuk memisahkan dataset anda: >>>> dari sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (data iris, target iris, test_size = 0, 10, random_state = 111)

Baris pertama mengimport perpustakaan silang ke sesi anda. Baris kedua mencipta set ujian daripada 10 peratus sampel.

x_train akan mengandungi 135 pemerhatian dan ciri-cirinya.

y_train akan mengandungi 135 label dalam susunan yang sama dengan 135 pemerhatian.

x_test akan mengandungi 15 (atau 10 peratus) pemerhatian dan ciri-cirinya.

y_test akan mengandungi 15 label dalam susunan yang sama dengan 15 pemerhatian.

Kod berikut mengesahkan bahawa perpecahan adalah apa yang anda harapkan:

>>>> X_train. bentuk (135, 4) >>> y_train. bentuk (135,) >>> X_test. bentuk (15, 4) >>> y_test. bentuk (15,)

Anda dapat melihat dari output yang terdapat 135 pemerhatian dengan 4 ciri dan 135 label dalam set latihan. Set ujian mempunyai 15 pemerhatian dengan 4 ciri dan 15 label.
Banyak pemula dalam bidang analisis ramalan lupa untuk memecahkan dataset - yang memperkenalkan kecacatan reka bentuk yang serius ke dalam projek. Sekiranya 150 kes penuh dimuatkan ke dalam mesin sebagai data latihan, itu tidak akan meninggalkan data yang tidak kelihatan untuk menguji model. Kemudian anda perlu menggunakan semula beberapa contoh latihan untuk menguji model ramalan.

Anda akan melihat bahawa dalam keadaan sedemikian, model itu sentiasa meramalkan kelas yang betul - kerana anda menggunakan data tepat yang sama yang anda gunakan untuk melatih model.Model ini telah melihat corak ini sebelum ini; ia tidak akan mempunyai masalah hanya mengulangi apa yang dilihatnya. Model ramalan yang bekerja perlu membuat ramalan untuk data yang belum dilihat.

Apabila anda mempunyai contoh pengelas SVM, dataset latihan, dan dataset ujian, anda sudah bersedia untuk melatih model dengan data latihan. Menaipkan kod berikut ke dalam penterjemah akan melakukannya dengan tepat: >>>> svmClassifier. patut (X_train, y_train)

Barisan kod ini mewujudkan model kerja untuk membuat ramalan dari. Khususnya, model ramalan yang akan meramalkan apa kelas Iris kumpulan dataset yang tidak dilabel. Contoh svmClassifier akan mempunyai beberapa kaedah yang boleh anda panggil untuk melakukan pelbagai perkara.

Sebagai contoh, selepas memanggil kaedah yang sesuai, kaedah yang paling berguna untuk dipanggil adalah kaedah meramalkan. Itulah kaedah yang anda akan memberi data baru; Sebagai balasan, ia meramalkan hasilnya.

Cara menjalankan data latihan dalam model pembelajaran yang diselia SVM - dummies

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...