Rumah Kewangan Peribadi 10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

Isi kandungan:

Video: Cara membuka file yang tidak bisa dibuka pada Windows 2024

Video: Cara membuka file yang tidak bisa dibuka pada Windows 2024
Anonim

Hamparan ini mungkin salah satu aplikasi PC yang paling banyak digunakan - dan untuk alasan yang baik: Spreadsheets menjadikannya sangat mudah untuk melakukan perhitungan dan operasi lain pada jadual data. Tetapi spreadsheets menimbulkan beberapa risiko juga: Mereka mudah rosak dan sangat sukar untuk debug. Berita baiknya adalah, anda boleh menggunakan R untuk melakukan banyak perkara yang sama seperti yang biasa anda lakukan dalam spreadsheet.

Menambah jumlah baris dan lajur

Satu tugas yang sering anda lakukan dalam spreadsheet ialah menghitung jumlah baris atau lajur. Cara termudah untuk melakukan ini adalah menggunakan fungsi rowSums () dan colSums (). Begitu juga, gunakan rowMeans () dan colMeans () untuk mengira cara.

Cuba pada iris dataset terbina dalam. Pertama, keluarkan lajur kelima, kerana mengandungi teks yang menggambarkan spesies iris: >> iris. num <- iris [-5]

Kemudian kirakan jumlah dan min bagi setiap lajur:

colSums (iris. Num)> colMeans (iris num)
Kedua fungsi ini sangat mudah, tetapi anda mungkin ingin mengira beberapa statistik lain untuk setiap lajur atau baris. Terdapat cara mudah untuk menyeberangi baris atau lajur susunan atau bingkai data: memohon () berfungsi. Sebagai contoh, mendapatkan minimum lajur adalah sama dengan menggunakan fungsi min () ke dimensi kedua data anda:

memohon (iris, num, 2, min)> memohon (iris num, 2, max)

Nombor pemformatan

Anda boleh menggunakan format () untuk menjadikan nombor anda menjadi teks cantik, sedia untuk dicetak. Fungsi ini mengambil sejumlah argumen untuk mengawal format hasil anda. Berikut adalah beberapa:

trim

  • : Nilai logik. Sekiranya FALSE, ia menambah ruang untuk betul membenarkan keputusan tersebut. Jika BENAR, ia menekan ruang utama. digit

  • : Berapa banyak digit angka angka penting untuk dipaparkan. nsmall

  • : Jumlah minimum digit selepas titik perpuluhan. Selain itu, anda mengawal format titik perpuluhan dengan perpuluhan. tanda, tanda antara jarak

sebelum titik perpuluhan dengan besar. tanda, dan tanda antara selang selepas titik perpuluhan dengan kecil. tanda. Sebagai contoh, anda boleh mencetak nombor 12345. 6789 dengan koma sebagai titik perpuluhan, ruang sebagai tanda besar, dan titik sebagai tanda kecil: format >> (12345.6789, angka = 9, perpuluhan. mark = "", kecil, tanda = ".", kecil selang = 3) [1] "12 345, 678. 9"

Sebagai contoh yang lebih praktikal, untuk mengira cara beberapa lajur dalam mtcars dan kemudian cetak hasil dengan dua digit selepas titik perpuluhan, gunakan yang berikut: >> x format (x, digit = 2, nsmall = 2) mpg cyl disp hp "20.09 "" 6. 19 "" 230. 72 "" 146. 69 "

Perhatikan bahawa hasilnya bukan lagi nombor tetapi rentetan teks. Oleh itu, berhati-hati apabila anda menggunakan pemformatan nombor - ini sepatutnya menjadi langkah terakhir dalam aliran kerja pelaporan anda.

Jika anda biasa dengan pengaturcaraan dalam bahasa yang sama dengan C atau C ++, maka anda juga boleh mendapatkan fungsi sprintf () yang berguna. Pembungkus ini membolehkan anda menampal nombor diformat anda secara langsung ke dalam rentetan.

Berikut adalah contoh menukarkan nombor ke dalam peratusan: >> x sprintf ("%. 1f %%", 100 * x) [1] "50. 0% "" 51. 0% "" 52. 0% "" 53. 0% "" 54. 0% "" 55. 0% "

Inilah yang berlaku: Argumen pertama untuk sprintf () menunjukkan format - dalam kes ini,"%. 1f %% ". Hujah format menggunakan literal khas yang menunjukkan bahawa fungsi itu harus menggantikan literal ini dengan pembolehubah dan memohon beberapa pemformatan. Literals selalu bermula dengan simbol%. Jadi, dalam kes ini,%. 1f bermaksud untuk memformat nilai yang dibekalkan pertama sebagai nilai titik tetap dengan satu digit selepas titik perpuluhan, dan %% adalah literal yang bermaksud mencetak%.

Untuk memformatkan beberapa nombor sebagai mata wang - dalam kes ini, U. S. dolar - gunakan: >> set. benih (1)> x sprintf ("$% 3.2f", x) [1] "$ 265. 51" "$ 372. 12" "$ 572. 85" "$ 908. 21" "$ 201. 68 "

Fungsi sprintf () memberi anda cara alternatif untuk menyisipkan nilai pembolehubah mana-mana ke dalam satu string: >> harga barangan sprintf ("% s biaya $% 3. 2f ", barangan, harga)] "Kos roti $ 2.10" "kos kue $ 4. 00"

Apa yang terjadi di sini ialah, kerana anda membekalkan dua vektor (masing-masing dengan dua elemen) untuk sprintf (), hasil anda adalah vektor dengan dua elemen. R siklus melalui unsur-unsur dan meletakkannya ke dalam literatur sprintf ().

Anda boleh melakukan segalanya dengan paste () dan format () yang boleh anda lakukan dengan sprintf (), jadi anda tidak perlu menggunakannya. Tetapi apabila anda melakukannya, ia dapat memudahkan kod anda.

Menyusun data

Untuk menyusun data dalam R, anda menggunakan fungsi sort () atau perintah ().

Untuk menyusun mtc bingkai data dalam peningkatan atau penurunan urutan hp lajur, gunakan: >> dengan (mtcars, mtcars [order (hp),])> dengan (mtcars, mtcars [order (hp, = TRUE),])

Membuat pilihan dengan jika

Spreadsheets memberikan anda keupayaan untuk melakukan semua jenis "Bagaimana jika? "Analisis. Salah satu cara untuk melakukan ini adalah menggunakan fungsi if () dalam spreadsheet.

R juga mempunyai fungsi if (), tetapi kebanyakannya digunakan untuk kawalan aliran dalam skrip anda. Kerana anda biasanya ingin melakukan perhitungan pada keseluruhan vektor dalam R, biasanya lebih sesuai menggunakan fungsi ifelse ().

Berikut adalah contoh menggunakan ifelse () untuk mengenal pasti kereta dengan kecekapan bahan api yang tinggi dalam metafon dataset: mtcars,]

Menghitung jumlah bersyarat

Sesuatu yang lain yang mungkin anda lakukan dalam Excel adalah mengira jumlah dan bilangan bersyarat yang bersyarat dengan fungsi sumif () dan countif ().

Anda boleh melakukan perkara yang sama di salah satu daripada dua cara dalam R:

Gunakan ifelse.

Cukup kirakan ukuran kepentingan pada subset data anda.

Katakan anda mahu mengira purata kecekapan bahan api bersyarat dalam mtcars. Anda melakukan ini dengan fungsi min (). Sekarang, untuk mendapatkan kecekapan bahan api untuk kereta sama ada sisi ambang 150 daya kuda, cubalah berikut: >> dengan (mtcars, mean (mpg)) [1] 20. 09062> dengan (mtcars, mean (mpg [hp dengan (mtcars, mean (mpg [hp> = 150]) [1] 15. 40667

Mengira bilangan elemen dalam vektor adalah sama dengan menanyakan panjangnya.) mempunyai panjang bersamaan R (): >> dengan (mtcars, panjang (mpg [hp> 150])) [1] 13

Meletakkan lajur atau baris

Kadangkala anda perlu menukar data anda dari baris ke lajur atau sebaliknya. Dalam R, fungsi untuk menukar matriks ialah t (): >> xx [1] [2] [3] [1,] 1 5 9 [2,] 2 Untuk mendapatkan matriks matriks, gunakan t ():

t (x) [1] [2] [3] [4] [1,] 1 2 3 4 [2,] 5 6 7 8 [3,] 9 10 11 12

Anda juga boleh menggunakan t () untuk menukar bingkai data, lakukan ini. Hasil transposisi adalah sentiasa matriks (atau array). Kerana array sentiasa mempunyai hanya satu jenis pemboleh ubah, seperti angka atau aksara, jenis pemboleh ubah hasil anda mungkin tidak seperti apa yang anda harapkan.

  • Mencari nilai yang unik atau diduplikasi

  • Untuk mengenal pasti semua nilai unik dalam data anda, gunakan fungsi unik (). Cuba cari nilai unik bilangan silinder di mtcars: >> unik (mtcars $ cyl) [1] 6 4 8

Kadangkala anda ingin tahu nilai data anda adalah pendua. Bergantung pada keadaan anda, pendua tersebut akan sah, tetapi kadang-kadang penyertaan pendua mungkin menunjukkan masalah kemasukan data.

Fungsi untuk mengenalpasti penyertaan pendua adalah pendua (). Dalam iris dataset terbina dalam, ada baris yang ditiru dalam baris 143. Cubalah sendiri: >> dupes head (dupes) [1] FALSE FALSE FALSE FALSE FALSE FALSE> yang (dupes) [1] 143> iris [dupes,] Sepal. Panjang Sepal. Lebar Petal. Panjang kelopak. Spesies Lebar 143 5. 8 2. 7 5. 1 1. 9 virginica

Oleh kerana hasil pendua () adalah vektor logik, anda boleh menggunakannya sebagai indeks untuk menghapus baris dari data anda. Untuk melakukan ini, gunakan operator penafian - titik seru (seperti dalam dupes): >> iris [! [a] 149

Bekerja dengan jadual carian

Dalam aplikasi spreadsheet seperti Excel, anda boleh membuat jadual carian dengan fungsi vlookup atau gabungan indeks dan padanan.

Di R, mungkin mudah digunakan untuk menggabungkan () atau padanan (). Fungsi () perlawanan mengembalikan vektor dengan kedudukan elemen yang sepadan dengan nilai carian anda.

Sebagai contoh, untuk mencari lokasi elemen "Toyota Corolla" dalam nama baris mtcars, cuba yang berikut: >> index index [1] 20> mtcars [index, 1: 4] hp Toyota Corolla 33. 9 4 71. 1 65

Bekerja dengan jadual pangsi

Untuk jadual mudah di R, anda boleh menggunakan fungsi tapply () untuk mencapai hasil yang sama untuk memisahkan jadual dalam Excel.Berikut adalah contoh menggunakan tapply () untuk mengira hp min bagi kereta dengan bilangan silinder dan gear yang berbeza: >> dengan (mtcars, tapply (hp, senarai (silinder, gear), min)) 4 4 4 4. 0000 76. 0 102. 0 6 107. 5000 116. 5 175. 0 8 194. 1667 NA 299. 5

Untuk jadual yang lebih kompleks - iaitu jadual dengan lebih daripada dua faktor silang - menggunakan agregat () fungsi:

agregat (hp ~ sil + gear + am, mtcars, mean) alat silinder hp 1 4 3 0 97. 00000 2 6 3 0 107. 50000 3 8 3 0 194. 16667 4 4 4 0 78. 50000 5 6 4 0 123. 00000 6 4 4 1 75. 16667 7 6 4 1 110. 00000 8 4 5 1 102. 00000 9 6 5 1 175. 00000 10 8 5 1 299. 50000

Menggunakan pencari matlamat dan pemecah

Dalam R, fungsi mengoptimumkan () berfungsi menyediakan satu mekanisme yang agak mudah untuk mengoptimumkan fungsi.

Bayangkan anda adalah pengarah jualan sebuah syarikat dan anda perlu menetapkan harga terbaik untuk produk anda. Dengan kata lain, cari harga produk yang memaksimumkan pendapatan.

Dalam ekonomi, model harga mudah menyatakan bahawa orang membeli kurang daripada produk tertentu apabila kenaikan harga. Fungsi ini sangat sederhana yang mempunyai tingkah laku ini:

jualan <- fungsi (harga) {100 - 0. 5 * price}

Pendapatan dijangka kemudiannya hanyalah hasil jualan dan jualan yang diharapkan: >> pendapatan <- fungsi (harga) {harga * jualan (harga)}

Anda boleh menggunakan fungsi kurva () untuk merancang fungsi yang berterusan. Ini mengambil fungsi sebagai input dan menghasilkan plot. Cobalah merancang tingkah laku jualan dan hasil menggunakan fungsi kurva (), harga berbeza dari $ 50 hingga $ 150: >> kurva oldpar (jualan, dari = 50, ke = 150, xname = "harga", utama = "Jualan ")> Kurva (pendapatan, dari = 50, ke = 150, xname =" harga ", utama =" Hasil ")> par (oldpar)

Hasil anda sepatutnya kelihatan seperti ini.

Model jualan dan hasil yang diharapkan.

Anda mempunyai model jualan dan hasil kerja. Anda dapat melihat dengan segera bahawa terdapat hasil maksimum. Seterusnya, gunakan fungsi R mengoptimumkan () untuk mencari nilai maksimum itu. Untuk menggunakan mengoptimumkan (), anda perlu menceritakan fungsi yang digunakan (dalam kes ini, pendapatan ()), serta selang (dalam kes ini, harga antara 50 dan 150). Secara lalai, mengoptimumkan () mencari nilai minimum, jadi dalam hal ini anda harus memberitahunya untuk mencari nilai maksimum: >> mengoptimalkan (pendapatan, selang = c (50, 150), maksimum = TRUE) $ maksimum [1] 100 $ objektif [1] 5000

Dan di sana anda pergi. Caj harga sebanyak $ 100, dan mengharapkan untuk mendapatkan $ 5, 000 hasil.

10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

Pilihan Editor

Lookup pintar di Office Online - dummies

Lookup pintar di Office Online - dummies

Di versi pengguna Office Online, ada ciri yang sangat keren yang membolehkan anda untuk mencari maklumat dari Bing, Wikipedia, Kamus Bahasa Inggeris Oxford, dan web itu sendiri, tanpa meninggalkan skrin atau halaman yang anda sedang aktif. Sebagai contoh, sebagai contoh, anda menulis blog di Word Online yang menyebut Paul Revere. Anda mahu ...

SharePoint Online App Options - dummies

SharePoint Online App Options - dummies

SharePoint Online dilengkapi dengan koleksi senarai standard dan perpustakaan. Microsoft telah mengambil masa untuk membangunkan ini untuk menjadikan kehidupan anda sebagai pemaju lebih mudah, jadi anda juga boleh menggunakannya. Senarai berikut memperkenalkan aplikasi senarai SharePoint standard dan memberikan penerangan ringkas: App Access: Aplikasi ini ...

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Di Skype untuk Perniagaan, anda boleh menandai kenalan anda untuk makluman perubahan status. Ada kalanya anda memerlukan input daripada ahli pasukan. Cara terbaik untuk melakukannya dengan cepat adalah untuk menjangkau ahli pasukan anda, sama ada satu-satu atau kepada mereka sekaligus, melalui mesyuarat maya ad hoc. Mengetahui anda ...

Pilihan Editor

Outlook Kenalan 2016 Tab Rumah - dummies

Outlook Kenalan 2016 Tab Rumah - dummies

Pandangan Kenalan 2016 adalah lebih daripada sekadar senarai nama dan alamat e-mel. Anda boleh memanfaatkan tab Kenalan Home pada Outlook 2016 Ribbon untuk membuat kenalan baru, untuk mengatur cara anda melihat kenalan yang anda ada, atau untuk membuat mesej e-mel atau mel menggabungkan dokumen. Imej berikut menunjukkan ...

Quick for Outlook 2013 - dummies

Quick for Outlook 2013 - dummies

Outlook 2013 adalah program pelbagai guna. Ia adalah buku alamat, kalendar, senarai tugasan, dan program pengendalian e-mel, semua dalam satu. Ciri Outlook yang paling popular, bagaimanapun, adalah pengendalian e-mel. Berjuta-juta orang menggunakan Outlook sebagai program e-mel utama mereka, dan atas sebab yang baik! Ia pantas, lengkap, dan mudah digunakan dan ...

Pilihan Editor

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Semasa mengatasi masalah Windows Server 2008 yang perlu anda kenal dengan Perkhidmatan konsol. Konsol perkhidmatan diakses dengan memilih Start → Administrative Tools → Services. Seperti yang digambarkan dalam menunjukkan angka berikut, konsol Perkhidmatan memaparkan senarai semua perkhidmatan yang sedang berjalan pada sistem anda. Jika ciri pelayan Windows tidak berfungsi ...

Keselamatan Akaun Administrator rangkaian - dummies

Keselamatan Akaun Administrator rangkaian - dummies

Pentadbir rangkaian bertanggungjawab untuk menyediakan sistem keselamatan rangkaian. Untuk melakukan itu, pentadbir mesti dikecualikan daripada semua sekatan keselamatan. Kerana ini, akaun pentadbir rangkaian mesti dilayan dengan berhati-hati. Banyak rangkaian secara automatik membuat akaun pengguna pentadbir apabila anda memasang perisian rangkaian. Nama pengguna dan kata laluan ...

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pertanyaan DNS biasa adalah pertanyaan carian ke hadapan, sesuai dengan nama domain yang memenuhi syarat. Peninjauan terbalik adalah bertentangan dengan pendahuluan ke hadapan: Ia mengembalikan nama domain yang lengkap bagi host berdasarkan alamat IPnya. Peninjauan terbalik adalah mungkin kerana domain khas yang dipanggil ...