Rumah Kewangan Peribadi Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Video: 01 Data Analisis Dengan R Visualisasi Data A 2024

Video: 01 Data Analisis Dengan R Visualisasi Data A 2024
Anonim

Anda perlu mendapatkan data dalam bentuk yang boleh digunakan oleh algoritma untuk membina model analisis ramalan. Untuk melakukannya, anda perlu mengambil sedikit masa untuk memahami data dan mengetahui struktur data. Ketik fungsi untuk mengetahui struktur data. Perintah dan keluarannya kelihatan seperti ini: data

str (autos) '. bingkai ': 398 obs. daripada 9 pembolehubah: $ V1: num 18 15 18 16 17 15 14 14 14 15 … $ V2: int 8 8 8 8 8 8 8 8 8 8 … $ V3: num 307 350 318 304 302 429 454 440 455 390 … $ V4: chr "130. 0" "165. 0" "150. 0" "150. 0" … $ V5: num 3504 3693 3436 3433 3449 … $ V6: num 12 11. 5 11 12 10. 5 10 9 8 5 10 8. 5 … $ V7: int 70 70 70 70 70 70 70 70 70 70 … … V8: int 1 1 1 1 1 1 1 1 1 1 … $ V9: Faktor w / 305 tahap "amc ambassador brougham", …: 

50 37 232 15 162 142 55 224 242 2 …

Dari melihat struktur, anda boleh mengetahui bahawa terdapat beberapa penyediaan data dan pembersihan untuk dilakukan. Berikut adalah senarai tugas yang diperlukan:

  • Namakan semula nama lajur.

    Ini tidak diperlukan, tetapi untuk tujuan contoh ini, lebih baik menggunakan nama lajur yang anda boleh faham dan ingat.

  • Tukar jenis data V4 ( kuda kuda ) ke jenis data angka .

    Dalam contoh ini, kuasa kuda adalah nilai berangka berterusan dan bukan jenis data aksara.

  • Mengendalikan nilai yang hilang.

    Di sini kuasa kuda mempunyai enam nilai yang hilang.

  • Tukar sifat yang mempunyai nilai diskret kepada faktor.

    Di sini silinder, tahun model, dan asal mempunyai nilai-nilai diskret.

  • Buang nama V9 ( nama kereta ).

    Di sini nama kereta tidak menambah nilai kepada model yang anda buat. Jika atribut asal tidak diberikan, anda boleh memperoleh asal dari atribut nama kereta.

Untuk menamakan semula jenis lajur dalam kod berikut: >> kolnames (autos) <-

c ("mpg", "silinder", "displacement" "berat", "pecutan", "model", "asal", 

"carName")

Seterusnya, tukar jenis data kuasa kuda kepada angka dengan kod berikut: >> autos $ horsepower < sebagai. numerik (kuasa kuda kuda autos)

Program ini akan mengeluh kerana tidak semua nilai dalam kuasa kuda merupakan representasi rentetan nombor. Terdapat beberapa nilai yang hilang yang diwakili sebagai "? "Watak. Tidak apa-apa untuk sekarang kerana R menukar setiap contoh? ke NA.

Cara yang biasa untuk mengendalikan nilai-nilai yang hilang bagi pembolehubah yang berterusan adalah untuk menggantikan setiap nilai yang hilang dengan min keseluruhan lajur. Barisan kod berikut ini ialah: >> autos $ horsepower [adalah.na (autos $ kuda kuda)] <- maksud (autos $ kuda kuda, na rm = TRUE)

Adalah penting untuk mempunyai. rm-TRUE dalam fungsi min. Ia memberitahu fungsi untuk tidak menggunakan lajur dengan nilai nol dalam pengiraannya. Tanpa itu, fungsi itu akan kembali.

Seterusnya, tukar atribut dengan nilai diskret kepada faktor. Tiga sifat telah dikenal pasti sebagai diskret. Tiga garisan kod berikut mengubah sifat. >> autos $ asal autos $ modelYear autos $ cylinders <- factor (autos $ cylinders)

Akhir sekali, keluarkan atribut dari bingkai data dengan baris kod ini: >> autos $ carName <- nULL < Pada ketika ini, anda telah selesai menyediakan data untuk proses pemodelan. Berikut adalah pandangan struktur selepas proses penyediaan data: data

str (autos) '. bingkai ': 398 obs. daripada 8 pembolehubah: $ mpg: num 18 15 18 16 17 15 14 14 14 15 … $ silinder: Faktor w / 5 tahap "3", "4", "5", "6", …:

5 5 5 5 5 5 5 5 5 5 … $ displacement: num 307 350 318 304 302 429 454 440 455 390 … $ horsepower: num 130 165 150 150 140 198 220 215 225 190 … $ weight: num 3504 3693 3436 3433 3449 … $ pecutan: num 12 11. 5 11 12 10. 5 10 9 8. 5 10 8. 5 … $ modelYear: Faktor w / 13 tahap "70", "71", "72", …:

1 1 1 1 1 1 1 1 1 1 … $ asal: Faktor w / 3 tahap "1", "2", "3":

1 1 1 1 1 1 1 1 1 1 …

Cara Sediakan Data dalam Regresi R untuk Analitik Rancangan - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...