Rumah Kewangan Peribadi Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2024

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2024
Anonim

Anda ingin membuat model analisis ramalan yang boleh anda perolehi dengan menggunakan hasil yang diketahui. Untuk melakukan itu, kami akan memecahkan dataset kami kepada dua set: satu untuk melatih model dan satu untuk menguji model. Pembahagian 70/30 antara kumpulan latihan dan ujian akan mencukupi. Dua barisan kod berikutnya akan mengira dan menyimpan saiz setiap set: >> trainSize testSize <- nrow (autos) - trainSize

Untuk mengeluarkan nilai-nilai, taipkan nama pembolehubah yang digunakan untuk menyimpan nilai dan tekan enter. Inilah output:

>> trainSize [1] 279> testSize [1] 119

Kod ini menentukan saiz dataset yang anda berikan untuk membuat dataset latihan dan ujian kami. Anda masih belum mencipta set itu. Juga, anda tidak mahu hanya memanggil 279 pemerhatian pertama latihan dan memanggil pemerhatian terakhir 119 set ujian. Itu akan membuat model yang buruk kerana dataset itu muncul yang dipesan. Khususnya, lajur model itu dipesan dari terkecil hingga paling besar.

Dari memeriksa data, anda dapat melihat bahawa sebahagian besar lebih besar, lapan silinder, pergeseran yang lebih besar, autos kuasa lebih besar menetap di bahagian atas dataset. Dari pemerhatian ini, tanpa perlu menjalankan sebarang algoritma pada data, anda sudah boleh memberitahu bahawa (secara umum untuk dataset ini) kereta lebih tua berbanding dengan kereta yang lebih baru seperti berikut:

Lebih berat

Mempunyai lapan silinder

  • Memiliki anjakan yang lebih besar

  • Mempunyai tenaga kuda yang lebih tinggi

    Okay, jelas banyak orang tahu sesuatu tentang kereta, jadi tanya tentang apa yang korelasi itu tidak akan terlalu jauh selepas anda melihat data. Seseorang yang mempunyai banyak pengetahuan kereta mungkin sudah tahu ini tanpa melihat data.
  • Ini hanyalah satu contoh domain (kereta) yang mudah difahami oleh ramai orang. Jika ini adalah data mengenai kanser, namun kebanyakan orang tidak akan segera memahami apa arti setiap sifat.

Ini adalah di mana ahli domain dan pemodelan data sangat penting untuk proses pemodelan. Pakar domain mungkin mempunyai pengetahuan yang terbaik yang sifatnya paling penting (atau paling tidak) penting - dan bagaimana sifat-sifatnya berkait dengan satu sama lain.

Mereka boleh mencadangkan kepada pemodelan data yang pemboleh ubah untuk bereksperimen dengan. Mereka boleh memberikan berat yang lebih besar kepada atribut yang lebih penting dan / atau berat yang lebih kecil kepada atribut-atribut yang paling tidak penting (atau menghapusnya sama sekali).

Jadi anda perlu membuat dataset latihan dan dataset ujian yang benar-benar mewakili seluruh set. Salah satu cara untuk melakukannya ialah untuk mencipta set latihan dari pemilihan rawak keseluruhan dataset.Di samping itu, anda ingin membuat ujian ini dapat dihasilkan supaya anda dapat belajar dari contoh yang sama.

Oleh itu tetapkan benih untuk penjana rawak supaya kami akan mempunyai set latihan "rawak" sama. Kod berikut melakukan tugas itu: >> ditetapkan. seed (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSet <- autos [-training_indices,]

(mpg) setiap pemerhatian. Algoritma regresi menggunakan hasil untuk melatih model dengan melihat hubungan antara pemboleh ubah ramalan (salah satu daripada tujuh atribut) dan pemboleh ubah tindak balas (mpg).

Set ujian mengandungi sisa data (iaitu bahagian yang tidak termasuk dalam set latihan). Anda perlu perhatikan bahawa set ujian juga termasuk pembolehubah tindak balas (mpg). 

Apabila anda menggunakan fungsi ramalan (dari model) dengan set ujian, ia mengabaikan pembolehubah tindak balas dan hanya menggunakan pembolehubah ramalan selagi nama lajur adalah sama dengan yang terdapat dalam set latihan.

Untuk membuat model regresi linear yang menggunakan atribut mpg sebagai pembolehubah tindak balas dan semua pembolehubah lain sebagai pemboleh ubah ramalan, ketik baris kod berikut: >> model

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...