Rumah Kewangan Peribadi Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2024

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2024
Anonim

Anda ingin membuat model analisis ramalan yang boleh anda perolehi dengan menggunakan hasil yang diketahui. Untuk melakukan itu, kami akan memecahkan dataset kami kepada dua set: satu untuk melatih model dan satu untuk menguji model. Pembahagian 70/30 antara kumpulan latihan dan ujian akan mencukupi. Dua barisan kod berikutnya akan mengira dan menyimpan saiz setiap set: >> trainSize testSize <- nrow (autos) - trainSize

Untuk mengeluarkan nilai-nilai, taipkan nama pembolehubah yang digunakan untuk menyimpan nilai dan tekan enter. Inilah output:

>> trainSize [1] 279> testSize [1] 119

Kod ini menentukan saiz dataset yang anda berikan untuk membuat dataset latihan dan ujian kami. Anda masih belum mencipta set itu. Juga, anda tidak mahu hanya memanggil 279 pemerhatian pertama latihan dan memanggil pemerhatian terakhir 119 set ujian. Itu akan membuat model yang buruk kerana dataset itu muncul yang dipesan. Khususnya, lajur model itu dipesan dari terkecil hingga paling besar.

Dari memeriksa data, anda dapat melihat bahawa sebahagian besar lebih besar, lapan silinder, pergeseran yang lebih besar, autos kuasa lebih besar menetap di bahagian atas dataset. Dari pemerhatian ini, tanpa perlu menjalankan sebarang algoritma pada data, anda sudah boleh memberitahu bahawa (secara umum untuk dataset ini) kereta lebih tua berbanding dengan kereta yang lebih baru seperti berikut:

Lebih berat

Mempunyai lapan silinder

  • Memiliki anjakan yang lebih besar

  • Mempunyai tenaga kuda yang lebih tinggi

    Okay, jelas banyak orang tahu sesuatu tentang kereta, jadi tanya tentang apa yang korelasi itu tidak akan terlalu jauh selepas anda melihat data. Seseorang yang mempunyai banyak pengetahuan kereta mungkin sudah tahu ini tanpa melihat data.
  • Ini hanyalah satu contoh domain (kereta) yang mudah difahami oleh ramai orang. Jika ini adalah data mengenai kanser, namun kebanyakan orang tidak akan segera memahami apa arti setiap sifat.

Ini adalah di mana ahli domain dan pemodelan data sangat penting untuk proses pemodelan. Pakar domain mungkin mempunyai pengetahuan yang terbaik yang sifatnya paling penting (atau paling tidak) penting - dan bagaimana sifat-sifatnya berkait dengan satu sama lain.

Mereka boleh mencadangkan kepada pemodelan data yang pemboleh ubah untuk bereksperimen dengan. Mereka boleh memberikan berat yang lebih besar kepada atribut yang lebih penting dan / atau berat yang lebih kecil kepada atribut-atribut yang paling tidak penting (atau menghapusnya sama sekali).

Jadi anda perlu membuat dataset latihan dan dataset ujian yang benar-benar mewakili seluruh set. Salah satu cara untuk melakukannya ialah untuk mencipta set latihan dari pemilihan rawak keseluruhan dataset.Di samping itu, anda ingin membuat ujian ini dapat dihasilkan supaya anda dapat belajar dari contoh yang sama.

Oleh itu tetapkan benih untuk penjana rawak supaya kami akan mempunyai set latihan "rawak" sama. Kod berikut melakukan tugas itu: >> ditetapkan. seed (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSet <- autos [-training_indices,]

(mpg) setiap pemerhatian. Algoritma regresi menggunakan hasil untuk melatih model dengan melihat hubungan antara pemboleh ubah ramalan (salah satu daripada tujuh atribut) dan pemboleh ubah tindak balas (mpg).

Set ujian mengandungi sisa data (iaitu bahagian yang tidak termasuk dalam set latihan). Anda perlu perhatikan bahawa set ujian juga termasuk pembolehubah tindak balas (mpg). 

Apabila anda menggunakan fungsi ramalan (dari model) dengan set ujian, ia mengabaikan pembolehubah tindak balas dan hanya menggunakan pembolehubah ramalan selagi nama lajur adalah sama dengan yang terdapat dalam set latihan.

Untuk membuat model regresi linear yang menggunakan atribut mpg sebagai pembolehubah tindak balas dan semua pembolehubah lain sebagai pemboleh ubah ramalan, ketik baris kod berikut: >> model

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...