Rumah Kewangan Peribadi Cara Membuat Model Pembelajaran yang Diawasi dengan Hutan Rawak untuk Analisis Predictive - dummies

Cara Membuat Model Pembelajaran yang Diawasi dengan Hutan Rawak untuk Analisis Predictive - dummies

Isi kandungan:

Video: Dragnet: Big Escape / Big Man Part 1 / Big Man Part 2 2024

Video: Dragnet: Big Escape / Big Man Part 1 / Big Man Part 2 2024
Anonim

Model hutan secara rawak adalah model ensemble yang boleh digunakan dalam analisis ramalan; ia mengambil kumpulan (keputusan) pokok keputusan untuk membuat modelnya. Idea ini adalah untuk mengambil sampel rawak pelajar yang lemah (satu subset data latihan rawak) dan mereka mengundi untuk memilih model yang paling kuat dan terbaik. Model hutan rawak boleh digunakan sama ada klasifikasi atau regresi. Dalam contoh berikut, model hutan rawak digunakan untuk mengklasifikasikan spesies Iris.

Memuatkan data anda

Senarai kod ini akan memuat iris dataset ke sesi anda: >>>> dari sklearn. dataset import load_iris >>>> iris = load_iris ()

Membuat contoh klasifikasi

Dua baris baris berikut membuat contoh pengelas. Baris pertama mengimport perpustakaan hutan rawak. Baris kedua mencipta satu contoh algoritma hutan rawak:

>>>> dari sklearn. ensemble import RandomForestClassifier >>>> rf = RandomForestClassifier (n_estimators = 15,

random_state = 111)

Parameter

n_estimators

dalam pembina adalah parameter penalaan yang biasa digunakan untuk model hutan rawak. Nilai ini digunakan untuk membina bilangan pokok di dalam hutan. Ia umumnya antara 10 dan 100 peratus daripada dataset, tetapi ia bergantung kepada data yang anda gunakan. Di sini, nilai ditetapkan pada 15, iaitu 10 peratus daripada data. Kemudian, anda akan melihat bahawa mengubah nilai parameter kepada 150 (100 peratus) menghasilkan hasil yang sama.

N _estimators digunakan untuk menyesuaikan prestasi model dan overfitting. Semakin besar nilai, lebih baik prestasi tetapi pada kos yang terlalu banyak. Nilai yang lebih kecil, semakin tinggi kemungkinan tidak terlalu mahal tetapi pada kos prestasi yang lebih rendah. Selain itu, terdapat satu titik di mana peningkatan bilangannya akan secara amnya merendahkan peningkatan ketepatan dan secara mendadak boleh meningkatkan daya pengiraan yang diperlukan. Parameter itu mungkir kepada 10 jika ia diabaikan dalam pembina.

Menjalankan data latihan

Anda perlu memisahkan dataset ke dalam latihan dan set ujian sebelum anda boleh membuat contoh pengeluar hutan rawak. Kod berikut akan mencapainya: >>>> dari sklearn import cross_validation >>>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (data iris, target iris, test_size = 0, 10, random_state = 111) >>>> rf = rf. patut (X_train, y_train)

Line 1 mengimport perpustakaan yang membolehkan anda memecah dataset menjadi dua bahagian.

Talian 2 memanggil fungsi dari pustaka yang memisahkan dataset menjadi dua bahagian dan menyerahkan set data yang dibahagikan kepada dua pasang pemboleh ubah.

Talian 3 mengambil contoh pengeluar hutan secara rambang yang baru anda buat, kemudian panggil kaedah yang sesuai untuk melatih model dengan dataset latihan.

Menjalankan data ujian

Dalam kod berikut, baris pertama memberi suapan dataset ujian kepada model, maka baris ketiga memaparkan output: >>>> ramalan = rf. meramal (X_test) >>>> ramalan

array ([0, 0, 2, 2, 2, 2, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2]) > Menilai model

Anda boleh merujuk rujukan output daripada ramalan terhadap array

  • y_test
  • . Akibatnya, anda dapat melihat bahawa ia meramalkan dua titik data ujian tidak betul. Jadi ketepatan model hutan rawak adalah 86. 67 peratus.
  • Berikut ialah kod: >>>> dari metrik import sklearn >>>> ramalan

array ([0, 0, 2, 2, 2, 0, 0, 2, 2, 1, (0, 0, 2, 2, 1, 2, 2, 2)) >>>> y_test

2, 2]) >>>> metrik. accuracy_score (y_test, diramalkan)

0. 8666666666666667 # 1. 0 adalah ketepatan 100 peratus >>>> ramalan == y_test

array ([Benar, Benar, Benar, Benar, Benar, Benar, Benar, Benar, Benar, Benar, Benar, Benar, Salah, Benar,

Benar], dtype = bool)

Bagaimanakah model hutan rawak berfungsi jika anda menukar parameter

n_estimators menjadi 150? Nampaknya ia tidak akan membuat perbezaan untuk dataset kecil ini. Ia menghasilkan hasil yang sama: >>>> rf = RandomForestClassifier (n_estimators = 150, random_state = 111) >>>> rf = rf. patut (X_train, y_train) >>>> ramalan = rf. meramal (X_test) >>>> ramalan

array ([0, 0, 2, 2, 2, 2, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2]) >

Cara Membuat Model Pembelajaran yang Diawasi dengan Hutan Rawak untuk Analisis Predictive - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...