Rumah Kewangan Peribadi Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Video: 01 Data Analisis Dengan R Visualisasi Data A 2025

Video: 01 Data Analisis Dengan R Visualisasi Data A 2025
Anonim

Anda perlu mendapatkan data dalam bentuk yang boleh digunakan oleh algoritma untuk membina model analisis ramalan. Untuk melakukannya, anda perlu mengambil sedikit masa untuk memahami data dan mengetahui struktur data. Ketik fungsi untuk mengetahui struktur data. Perintah dan keluarannya kelihatan seperti ini: data

str (autos) '. bingkai ': 398 obs. daripada 9 pembolehubah: $ V1: num 18 15 18 16 17 15 14 14 14 15 … $ V2: int 8 8 8 8 8 8 8 8 8 8 … $ V3: num 307 350 318 304 302 429 454 440 455 390 … $ V4: chr "130. 0" "165. 0" "150. 0" "150. 0" … $ V5: num 3504 3693 3436 3433 3449 … $ V6: num 12 11. 5 11 12 10. 5 10 9 8 5 10 8. 5 … $ V7: int 70 70 70 70 70 70 70 70 70 70 … … V8: int 1 1 1 1 1 1 1 1 1 1 … $ V9: Faktor w / 305 tahap "amc ambassador brougham", …: 

50 37 232 15 162 142 55 224 242 2 …

Dari melihat struktur, anda boleh mengetahui bahawa terdapat beberapa penyediaan data dan pembersihan untuk dilakukan. Berikut adalah senarai tugas yang diperlukan:

  • Namakan semula nama lajur.

    Ini tidak diperlukan, tetapi untuk tujuan contoh ini, lebih baik menggunakan nama lajur yang anda boleh faham dan ingat.

  • Tukar jenis data V4 ( kuda kuda ) ke jenis data angka .

    Dalam contoh ini, kuasa kuda adalah nilai berangka berterusan dan bukan jenis data aksara.

  • Mengendalikan nilai yang hilang.

    Di sini kuasa kuda mempunyai enam nilai yang hilang.

  • Tukar sifat yang mempunyai nilai diskret kepada faktor.

    Di sini silinder, tahun model, dan asal mempunyai nilai-nilai diskret.

  • Buang nama V9 ( nama kereta ).

    Di sini nama kereta tidak menambah nilai kepada model yang anda buat. Jika atribut asal tidak diberikan, anda boleh memperoleh asal dari atribut nama kereta.

Untuk menamakan semula jenis lajur dalam kod berikut: >> kolnames (autos) <-

c ("mpg", "silinder", "displacement" "berat", "pecutan", "model", "asal", 

"carName")

Seterusnya, tukar jenis data kuasa kuda kepada angka dengan kod berikut: >> autos $ horsepower < sebagai. numerik (kuasa kuda kuda autos)

Program ini akan mengeluh kerana tidak semua nilai dalam kuasa kuda merupakan representasi rentetan nombor. Terdapat beberapa nilai yang hilang yang diwakili sebagai "? "Watak. Tidak apa-apa untuk sekarang kerana R menukar setiap contoh? ke NA.

Cara yang biasa untuk mengendalikan nilai-nilai yang hilang bagi pembolehubah yang berterusan adalah untuk menggantikan setiap nilai yang hilang dengan min keseluruhan lajur. Barisan kod berikut ini ialah: >> autos $ horsepower [adalah.na (autos $ kuda kuda)] <- maksud (autos $ kuda kuda, na rm = TRUE)

Adalah penting untuk mempunyai. rm-TRUE dalam fungsi min. Ia memberitahu fungsi untuk tidak menggunakan lajur dengan nilai nol dalam pengiraannya. Tanpa itu, fungsi itu akan kembali.

Seterusnya, tukar atribut dengan nilai diskret kepada faktor. Tiga sifat telah dikenal pasti sebagai diskret. Tiga garisan kod berikut mengubah sifat. >> autos $ asal autos $ modelYear autos $ cylinders <- factor (autos $ cylinders)

Akhir sekali, keluarkan atribut dari bingkai data dengan baris kod ini: >> autos $ carName <- nULL < Pada ketika ini, anda telah selesai menyediakan data untuk proses pemodelan. Berikut adalah pandangan struktur selepas proses penyediaan data: data

str (autos) '. bingkai ': 398 obs. daripada 8 pembolehubah: $ mpg: num 18 15 18 16 17 15 14 14 14 15 … $ silinder: Faktor w / 5 tahap "3", "4", "5", "6", …:

5 5 5 5 5 5 5 5 5 5 … $ displacement: num 307 350 318 304 302 429 454 440 455 390 … $ horsepower: num 130 165 150 150 140 198 220 215 225 190 … $ weight: num 3504 3693 3436 3433 3449 … $ pecutan: num 12 11. 5 11 12 10. 5 10 9 8. 5 10 8. 5 … $ modelYear: Faktor w / 13 tahap "70", "71", "72", …:

1 1 1 1 1 1 1 1 1 1 … $ asal: Faktor w / 3 tahap "1", "2", "3":

1 1 1 1 1 1 1 1 1 1 …

Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Pilihan Editor

Bagaimana Menghubungkan Item Menu ke Kategori di Joomla - dummies

Bagaimana Menghubungkan Item Menu ke Kategori di Joomla - dummies

Untuk artikel yang dikategorikan dalam Joomla untuk dilihat oleh pengguna laman web anda, anda perlu memautkan item menu Joomla anda ke kategori Joomla yang mengandungi artikel yang ingin anda siarkan. Dengan menyambungkan kategori ke item menu, semua artikel dalam kategori boleh didapati melalui item menu yang berkaitan. Untuk membuat ...

Cara Memasang Joomla CMS pada Server Jauh - dummies

Cara Memasang Joomla CMS pada Server Jauh - dummies

Sebaik sahaja anda telah memuatkan fail Joomla yang tidak diturunkan di pelayan jauh dan sediakan MySQL untuk Joomla, anda sudah bersedia untuk memasang Sistem Pengurusan Kandungan Joomla (CMS). Navigasi ke tapak anda di pelayan tuan rumah. Anda melihat halaman pemasangan Joomla pertama. Pilih bahasa. Klik Seterusnya. Semua item dalam pane bahagian atas ...

Cara Membiarkan Pengguna Menguruskan Akaun Sendiri di Joomla - dummies

Cara Membiarkan Pengguna Menguruskan Akaun Sendiri di Joomla - dummies

Walaupun anda boleh mengurus pengguna dari hujung belakang, Joomla menyediakan kemudahan yang baik yang membolehkan pengguna menguruskan diri mereka juga. Anda boleh membuat halaman di mana pengguna boleh mendaftar, log masuk, menetapkan semula kata laluan mereka, diingatkan kata laluan mereka, dan sebagainya. Buat laman pengurusan pengguna Untuk membuat halaman yang membolehkan pengguna mengurus sendiri, anda ...

Pilihan Editor

Pengguna dan Definisi SharePoint berbeza - dummies

Pengguna dan Definisi SharePoint berbeza - dummies

SharePoint mempunyai banyak jenis pengguna yang berbeza, dan bergantung di mana peranan anda sesuai , anda mungkin mempunyai pengalaman yang sangat berbeza dari pengguna SharePoint yang lain. Sebagai contoh, anda mungkin ditugaskan untuk membuat dan mentadbir laman web SharePoint untuk pasukan anda. Dalam kes ini, anda mungkin melihat ke hadapan fungsi yang luas SharePoint ...

Dan Microblog dalam SharePoint - dummies

Dan Microblog dalam SharePoint - dummies

Microblogging dibuat terkenal oleh Twitter. SharePoint 2013 membawa mikroblogging ke dunia korporat. Menggunakan Twitter, anda menghantar mesej ringkas kepada dunia. Anda boleh mengikuti orang lain dan menarik pengikut anda sendiri. Anda menyebut orang lain menggunakan simbol @ yang diikuti dengan nama mereka dan boleh menanda topik menggunakan # ...

Mengeksport Table Akses ke Senarai Dalam Talian SharePoint - dummies

Mengeksport Table Akses ke Senarai Dalam Talian SharePoint - dummies

Jika anda mempunyai meja dalam Akses yang ada pangkalan data yang anda ingin sediakan untuk ahli pasukan anda yang tidak mempunyai aplikasi MS Access 2010, cara terbaik untuk melakukan ini adalah untuk mengeksport jadual tersebut ke dalam senarai SharePoint. Ikuti langkah-langkah berikut: Dari pangkalan data anda, klik kanan pada jadual di ...

Pilihan Editor

Penyediaan aSVAB: Akar - patung

Penyediaan aSVAB: Akar - patung

Menjadi akrab dengan akar untuk ASVAB. Akar adalah kebalikan dari kuasa atau eksponen. Terdapat pelbagai jenis akar tak terhingga. Anda mempunyai akar kuadrat, yang bermaksud "membuang" asas kepada kuasa kedua; akar kubus, yang bermaksud "membuang" asas yang dinaikkan kepada kuasa ketiga; akar yang keempat, untuk ...

ASVAB Penyediaan: Bekerja dengan Perpuluhan - patung

ASVAB Penyediaan: Bekerja dengan Perpuluhan - patung

Anda perlu tahu bagaimana untuk bekerja dengan perpuluhan untuk ASBAB . Perpuluhan adalah kaedah menulis nombor pecahan tanpa menggunakan pengangka dan penyebut. Anda boleh menulis pecahan 7/10 sebagai perpuluhan 0. 7; anda menyebutnya "tujuh persepuluh" atau "titik nol tujuh. "Tempoh atau titik perpuluhan menunjukkan bahawa nombor itu ...

ASVAB Subtest Details - dummies

ASVAB Subtest Details - dummies

Tergantung di mana dan untuk tujuan apa yang anda ambil ujian, anda mungkin menghadapi beberapa versi ASVAB. Versi terkomputer dari ASVAB (CAT-ASVAB) mengandungi sembilan subtest masa yang berasingan. Pada CAT-ASVAB, Maklumat Auto dan Maklumat Kedai dipisahkan kepada dua ujian berbeza, sedangkan mereka digabungkan pada versi kertas. Lihatlah ...