Rumah Kewangan Peribadi Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2025

Video: 02 Regresi Linear dengan R Prediksi menggunakan Model Regresi 2025
Anonim

Anda ingin membuat model analisis ramalan yang boleh anda perolehi dengan menggunakan hasil yang diketahui. Untuk melakukan itu, kami akan memecahkan dataset kami kepada dua set: satu untuk melatih model dan satu untuk menguji model. Pembahagian 70/30 antara kumpulan latihan dan ujian akan mencukupi. Dua barisan kod berikutnya akan mengira dan menyimpan saiz setiap set: >> trainSize testSize <- nrow (autos) - trainSize

Untuk mengeluarkan nilai-nilai, taipkan nama pembolehubah yang digunakan untuk menyimpan nilai dan tekan enter. Inilah output:

>> trainSize [1] 279> testSize [1] 119

Kod ini menentukan saiz dataset yang anda berikan untuk membuat dataset latihan dan ujian kami. Anda masih belum mencipta set itu. Juga, anda tidak mahu hanya memanggil 279 pemerhatian pertama latihan dan memanggil pemerhatian terakhir 119 set ujian. Itu akan membuat model yang buruk kerana dataset itu muncul yang dipesan. Khususnya, lajur model itu dipesan dari terkecil hingga paling besar.

Dari memeriksa data, anda dapat melihat bahawa sebahagian besar lebih besar, lapan silinder, pergeseran yang lebih besar, autos kuasa lebih besar menetap di bahagian atas dataset. Dari pemerhatian ini, tanpa perlu menjalankan sebarang algoritma pada data, anda sudah boleh memberitahu bahawa (secara umum untuk dataset ini) kereta lebih tua berbanding dengan kereta yang lebih baru seperti berikut:

Lebih berat

Mempunyai lapan silinder

  • Memiliki anjakan yang lebih besar

  • Mempunyai tenaga kuda yang lebih tinggi

    Okay, jelas banyak orang tahu sesuatu tentang kereta, jadi tanya tentang apa yang korelasi itu tidak akan terlalu jauh selepas anda melihat data. Seseorang yang mempunyai banyak pengetahuan kereta mungkin sudah tahu ini tanpa melihat data.
  • Ini hanyalah satu contoh domain (kereta) yang mudah difahami oleh ramai orang. Jika ini adalah data mengenai kanser, namun kebanyakan orang tidak akan segera memahami apa arti setiap sifat.

Ini adalah di mana ahli domain dan pemodelan data sangat penting untuk proses pemodelan. Pakar domain mungkin mempunyai pengetahuan yang terbaik yang sifatnya paling penting (atau paling tidak) penting - dan bagaimana sifat-sifatnya berkait dengan satu sama lain.

Mereka boleh mencadangkan kepada pemodelan data yang pemboleh ubah untuk bereksperimen dengan. Mereka boleh memberikan berat yang lebih besar kepada atribut yang lebih penting dan / atau berat yang lebih kecil kepada atribut-atribut yang paling tidak penting (atau menghapusnya sama sekali).

Jadi anda perlu membuat dataset latihan dan dataset ujian yang benar-benar mewakili seluruh set. Salah satu cara untuk melakukannya ialah untuk mencipta set latihan dari pemilihan rawak keseluruhan dataset.Di samping itu, anda ingin membuat ujian ini dapat dihasilkan supaya anda dapat belajar dari contoh yang sama.

Oleh itu tetapkan benih untuk penjana rawak supaya kami akan mempunyai set latihan "rawak" sama. Kod berikut melakukan tugas itu: >> ditetapkan. seed (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSet <- autos [-training_indices,]

(mpg) setiap pemerhatian. Algoritma regresi menggunakan hasil untuk melatih model dengan melihat hubungan antara pemboleh ubah ramalan (salah satu daripada tujuh atribut) dan pemboleh ubah tindak balas (mpg).

Set ujian mengandungi sisa data (iaitu bahagian yang tidak termasuk dalam set latihan). Anda perlu perhatikan bahawa set ujian juga termasuk pembolehubah tindak balas (mpg). 

Apabila anda menggunakan fungsi ramalan (dari model) dengan set ujian, ia mengabaikan pembolehubah tindak balas dan hanya menggunakan pembolehubah ramalan selagi nama lajur adalah sama dengan yang terdapat dalam set latihan.

Untuk membuat model regresi linear yang menggunakan atribut mpg sebagai pembolehubah tindak balas dan semua pembolehubah lain sebagai pemboleh ubah ramalan, ketik baris kod berikut: >> model

Cara Membuat Model Analisis Predictive dengan Regrression R - dummies

Pilihan Editor

Bagaimana Menghubungkan Item Menu ke Kategori di Joomla - dummies

Bagaimana Menghubungkan Item Menu ke Kategori di Joomla - dummies

Untuk artikel yang dikategorikan dalam Joomla untuk dilihat oleh pengguna laman web anda, anda perlu memautkan item menu Joomla anda ke kategori Joomla yang mengandungi artikel yang ingin anda siarkan. Dengan menyambungkan kategori ke item menu, semua artikel dalam kategori boleh didapati melalui item menu yang berkaitan. Untuk membuat ...

Cara Memasang Joomla CMS pada Server Jauh - dummies

Cara Memasang Joomla CMS pada Server Jauh - dummies

Sebaik sahaja anda telah memuatkan fail Joomla yang tidak diturunkan di pelayan jauh dan sediakan MySQL untuk Joomla, anda sudah bersedia untuk memasang Sistem Pengurusan Kandungan Joomla (CMS). Navigasi ke tapak anda di pelayan tuan rumah. Anda melihat halaman pemasangan Joomla pertama. Pilih bahasa. Klik Seterusnya. Semua item dalam pane bahagian atas ...

Cara Membiarkan Pengguna Menguruskan Akaun Sendiri di Joomla - dummies

Cara Membiarkan Pengguna Menguruskan Akaun Sendiri di Joomla - dummies

Walaupun anda boleh mengurus pengguna dari hujung belakang, Joomla menyediakan kemudahan yang baik yang membolehkan pengguna menguruskan diri mereka juga. Anda boleh membuat halaman di mana pengguna boleh mendaftar, log masuk, menetapkan semula kata laluan mereka, diingatkan kata laluan mereka, dan sebagainya. Buat laman pengurusan pengguna Untuk membuat halaman yang membolehkan pengguna mengurus sendiri, anda ...

Pilihan Editor

Pengguna dan Definisi SharePoint berbeza - dummies

Pengguna dan Definisi SharePoint berbeza - dummies

SharePoint mempunyai banyak jenis pengguna yang berbeza, dan bergantung di mana peranan anda sesuai , anda mungkin mempunyai pengalaman yang sangat berbeza dari pengguna SharePoint yang lain. Sebagai contoh, anda mungkin ditugaskan untuk membuat dan mentadbir laman web SharePoint untuk pasukan anda. Dalam kes ini, anda mungkin melihat ke hadapan fungsi yang luas SharePoint ...

Dan Microblog dalam SharePoint - dummies

Dan Microblog dalam SharePoint - dummies

Microblogging dibuat terkenal oleh Twitter. SharePoint 2013 membawa mikroblogging ke dunia korporat. Menggunakan Twitter, anda menghantar mesej ringkas kepada dunia. Anda boleh mengikuti orang lain dan menarik pengikut anda sendiri. Anda menyebut orang lain menggunakan simbol @ yang diikuti dengan nama mereka dan boleh menanda topik menggunakan # ...

Mengeksport Table Akses ke Senarai Dalam Talian SharePoint - dummies

Mengeksport Table Akses ke Senarai Dalam Talian SharePoint - dummies

Jika anda mempunyai meja dalam Akses yang ada pangkalan data yang anda ingin sediakan untuk ahli pasukan anda yang tidak mempunyai aplikasi MS Access 2010, cara terbaik untuk melakukan ini adalah untuk mengeksport jadual tersebut ke dalam senarai SharePoint. Ikuti langkah-langkah berikut: Dari pangkalan data anda, klik kanan pada jadual di ...

Pilihan Editor

Penyediaan aSVAB: Akar - patung

Penyediaan aSVAB: Akar - patung

Menjadi akrab dengan akar untuk ASVAB. Akar adalah kebalikan dari kuasa atau eksponen. Terdapat pelbagai jenis akar tak terhingga. Anda mempunyai akar kuadrat, yang bermaksud "membuang" asas kepada kuasa kedua; akar kubus, yang bermaksud "membuang" asas yang dinaikkan kepada kuasa ketiga; akar yang keempat, untuk ...

ASVAB Penyediaan: Bekerja dengan Perpuluhan - patung

ASVAB Penyediaan: Bekerja dengan Perpuluhan - patung

Anda perlu tahu bagaimana untuk bekerja dengan perpuluhan untuk ASBAB . Perpuluhan adalah kaedah menulis nombor pecahan tanpa menggunakan pengangka dan penyebut. Anda boleh menulis pecahan 7/10 sebagai perpuluhan 0. 7; anda menyebutnya "tujuh persepuluh" atau "titik nol tujuh. "Tempoh atau titik perpuluhan menunjukkan bahawa nombor itu ...

ASVAB Subtest Details - dummies

ASVAB Subtest Details - dummies

Tergantung di mana dan untuk tujuan apa yang anda ambil ujian, anda mungkin menghadapi beberapa versi ASVAB. Versi terkomputer dari ASVAB (CAT-ASVAB) mengandungi sembilan subtest masa yang berasingan. Pada CAT-ASVAB, Maklumat Auto dan Maklumat Kedai dipisahkan kepada dua ujian berbeza, sedangkan mereka digabungkan pada versi kertas. Lihatlah ...