Rumah Kewangan Peribadi 10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

Isi kandungan:

Video: Cara membuka file yang tidak bisa dibuka pada Windows 2025

Video: Cara membuka file yang tidak bisa dibuka pada Windows 2025
Anonim

Hamparan ini mungkin salah satu aplikasi PC yang paling banyak digunakan - dan untuk alasan yang baik: Spreadsheets menjadikannya sangat mudah untuk melakukan perhitungan dan operasi lain pada jadual data. Tetapi spreadsheets menimbulkan beberapa risiko juga: Mereka mudah rosak dan sangat sukar untuk debug. Berita baiknya adalah, anda boleh menggunakan R untuk melakukan banyak perkara yang sama seperti yang biasa anda lakukan dalam spreadsheet.

Menambah jumlah baris dan lajur

Satu tugas yang sering anda lakukan dalam spreadsheet ialah menghitung jumlah baris atau lajur. Cara termudah untuk melakukan ini adalah menggunakan fungsi rowSums () dan colSums (). Begitu juga, gunakan rowMeans () dan colMeans () untuk mengira cara.

Cuba pada iris dataset terbina dalam. Pertama, keluarkan lajur kelima, kerana mengandungi teks yang menggambarkan spesies iris: >> iris. num <- iris [-5]

Kemudian kirakan jumlah dan min bagi setiap lajur:

colSums (iris. Num)> colMeans (iris num)
Kedua fungsi ini sangat mudah, tetapi anda mungkin ingin mengira beberapa statistik lain untuk setiap lajur atau baris. Terdapat cara mudah untuk menyeberangi baris atau lajur susunan atau bingkai data: memohon () berfungsi. Sebagai contoh, mendapatkan minimum lajur adalah sama dengan menggunakan fungsi min () ke dimensi kedua data anda:

memohon (iris, num, 2, min)> memohon (iris num, 2, max)

Nombor pemformatan

Anda boleh menggunakan format () untuk menjadikan nombor anda menjadi teks cantik, sedia untuk dicetak. Fungsi ini mengambil sejumlah argumen untuk mengawal format hasil anda. Berikut adalah beberapa:

trim

  • : Nilai logik. Sekiranya FALSE, ia menambah ruang untuk betul membenarkan keputusan tersebut. Jika BENAR, ia menekan ruang utama. digit

  • : Berapa banyak digit angka angka penting untuk dipaparkan. nsmall

  • : Jumlah minimum digit selepas titik perpuluhan. Selain itu, anda mengawal format titik perpuluhan dengan perpuluhan. tanda, tanda antara jarak

sebelum titik perpuluhan dengan besar. tanda, dan tanda antara selang selepas titik perpuluhan dengan kecil. tanda. Sebagai contoh, anda boleh mencetak nombor 12345. 6789 dengan koma sebagai titik perpuluhan, ruang sebagai tanda besar, dan titik sebagai tanda kecil: format >> (12345.6789, angka = 9, perpuluhan. mark = "", kecil, tanda = ".", kecil selang = 3) [1] "12 345, 678. 9"

Sebagai contoh yang lebih praktikal, untuk mengira cara beberapa lajur dalam mtcars dan kemudian cetak hasil dengan dua digit selepas titik perpuluhan, gunakan yang berikut: >> x format (x, digit = 2, nsmall = 2) mpg cyl disp hp "20.09 "" 6. 19 "" 230. 72 "" 146. 69 "

Perhatikan bahawa hasilnya bukan lagi nombor tetapi rentetan teks. Oleh itu, berhati-hati apabila anda menggunakan pemformatan nombor - ini sepatutnya menjadi langkah terakhir dalam aliran kerja pelaporan anda.

Jika anda biasa dengan pengaturcaraan dalam bahasa yang sama dengan C atau C ++, maka anda juga boleh mendapatkan fungsi sprintf () yang berguna. Pembungkus ini membolehkan anda menampal nombor diformat anda secara langsung ke dalam rentetan.

Berikut adalah contoh menukarkan nombor ke dalam peratusan: >> x sprintf ("%. 1f %%", 100 * x) [1] "50. 0% "" 51. 0% "" 52. 0% "" 53. 0% "" 54. 0% "" 55. 0% "

Inilah yang berlaku: Argumen pertama untuk sprintf () menunjukkan format - dalam kes ini,"%. 1f %% ". Hujah format menggunakan literal khas yang menunjukkan bahawa fungsi itu harus menggantikan literal ini dengan pembolehubah dan memohon beberapa pemformatan. Literals selalu bermula dengan simbol%. Jadi, dalam kes ini,%. 1f bermaksud untuk memformat nilai yang dibekalkan pertama sebagai nilai titik tetap dengan satu digit selepas titik perpuluhan, dan %% adalah literal yang bermaksud mencetak%.

Untuk memformatkan beberapa nombor sebagai mata wang - dalam kes ini, U. S. dolar - gunakan: >> set. benih (1)> x sprintf ("$% 3.2f", x) [1] "$ 265. 51" "$ 372. 12" "$ 572. 85" "$ 908. 21" "$ 201. 68 "

Fungsi sprintf () memberi anda cara alternatif untuk menyisipkan nilai pembolehubah mana-mana ke dalam satu string: >> harga barangan sprintf ("% s biaya $% 3. 2f ", barangan, harga)] "Kos roti $ 2.10" "kos kue $ 4. 00"

Apa yang terjadi di sini ialah, kerana anda membekalkan dua vektor (masing-masing dengan dua elemen) untuk sprintf (), hasil anda adalah vektor dengan dua elemen. R siklus melalui unsur-unsur dan meletakkannya ke dalam literatur sprintf ().

Anda boleh melakukan segalanya dengan paste () dan format () yang boleh anda lakukan dengan sprintf (), jadi anda tidak perlu menggunakannya. Tetapi apabila anda melakukannya, ia dapat memudahkan kod anda.

Menyusun data

Untuk menyusun data dalam R, anda menggunakan fungsi sort () atau perintah ().

Untuk menyusun mtc bingkai data dalam peningkatan atau penurunan urutan hp lajur, gunakan: >> dengan (mtcars, mtcars [order (hp),])> dengan (mtcars, mtcars [order (hp, = TRUE),])

Membuat pilihan dengan jika

Spreadsheets memberikan anda keupayaan untuk melakukan semua jenis "Bagaimana jika? "Analisis. Salah satu cara untuk melakukan ini adalah menggunakan fungsi if () dalam spreadsheet.

R juga mempunyai fungsi if (), tetapi kebanyakannya digunakan untuk kawalan aliran dalam skrip anda. Kerana anda biasanya ingin melakukan perhitungan pada keseluruhan vektor dalam R, biasanya lebih sesuai menggunakan fungsi ifelse ().

Berikut adalah contoh menggunakan ifelse () untuk mengenal pasti kereta dengan kecekapan bahan api yang tinggi dalam metafon dataset: mtcars,]

Menghitung jumlah bersyarat

Sesuatu yang lain yang mungkin anda lakukan dalam Excel adalah mengira jumlah dan bilangan bersyarat yang bersyarat dengan fungsi sumif () dan countif ().

Anda boleh melakukan perkara yang sama di salah satu daripada dua cara dalam R:

Gunakan ifelse.

Cukup kirakan ukuran kepentingan pada subset data anda.

Katakan anda mahu mengira purata kecekapan bahan api bersyarat dalam mtcars. Anda melakukan ini dengan fungsi min (). Sekarang, untuk mendapatkan kecekapan bahan api untuk kereta sama ada sisi ambang 150 daya kuda, cubalah berikut: >> dengan (mtcars, mean (mpg)) [1] 20. 09062> dengan (mtcars, mean (mpg [hp dengan (mtcars, mean (mpg [hp> = 150]) [1] 15. 40667

Mengira bilangan elemen dalam vektor adalah sama dengan menanyakan panjangnya.) mempunyai panjang bersamaan R (): >> dengan (mtcars, panjang (mpg [hp> 150])) [1] 13

Meletakkan lajur atau baris

Kadangkala anda perlu menukar data anda dari baris ke lajur atau sebaliknya. Dalam R, fungsi untuk menukar matriks ialah t (): >> xx [1] [2] [3] [1,] 1 5 9 [2,] 2 Untuk mendapatkan matriks matriks, gunakan t ():

t (x) [1] [2] [3] [4] [1,] 1 2 3 4 [2,] 5 6 7 8 [3,] 9 10 11 12

Anda juga boleh menggunakan t () untuk menukar bingkai data, lakukan ini. Hasil transposisi adalah sentiasa matriks (atau array). Kerana array sentiasa mempunyai hanya satu jenis pemboleh ubah, seperti angka atau aksara, jenis pemboleh ubah hasil anda mungkin tidak seperti apa yang anda harapkan.

  • Mencari nilai yang unik atau diduplikasi

  • Untuk mengenal pasti semua nilai unik dalam data anda, gunakan fungsi unik (). Cuba cari nilai unik bilangan silinder di mtcars: >> unik (mtcars $ cyl) [1] 6 4 8

Kadangkala anda ingin tahu nilai data anda adalah pendua. Bergantung pada keadaan anda, pendua tersebut akan sah, tetapi kadang-kadang penyertaan pendua mungkin menunjukkan masalah kemasukan data.

Fungsi untuk mengenalpasti penyertaan pendua adalah pendua (). Dalam iris dataset terbina dalam, ada baris yang ditiru dalam baris 143. Cubalah sendiri: >> dupes head (dupes) [1] FALSE FALSE FALSE FALSE FALSE FALSE> yang (dupes) [1] 143> iris [dupes,] Sepal. Panjang Sepal. Lebar Petal. Panjang kelopak. Spesies Lebar 143 5. 8 2. 7 5. 1 1. 9 virginica

Oleh kerana hasil pendua () adalah vektor logik, anda boleh menggunakannya sebagai indeks untuk menghapus baris dari data anda. Untuk melakukan ini, gunakan operator penafian - titik seru (seperti dalam dupes): >> iris [! [a] 149

Bekerja dengan jadual carian

Dalam aplikasi spreadsheet seperti Excel, anda boleh membuat jadual carian dengan fungsi vlookup atau gabungan indeks dan padanan.

Di R, mungkin mudah digunakan untuk menggabungkan () atau padanan (). Fungsi () perlawanan mengembalikan vektor dengan kedudukan elemen yang sepadan dengan nilai carian anda.

Sebagai contoh, untuk mencari lokasi elemen "Toyota Corolla" dalam nama baris mtcars, cuba yang berikut: >> index index [1] 20> mtcars [index, 1: 4] hp Toyota Corolla 33. 9 4 71. 1 65

Bekerja dengan jadual pangsi

Untuk jadual mudah di R, anda boleh menggunakan fungsi tapply () untuk mencapai hasil yang sama untuk memisahkan jadual dalam Excel.Berikut adalah contoh menggunakan tapply () untuk mengira hp min bagi kereta dengan bilangan silinder dan gear yang berbeza: >> dengan (mtcars, tapply (hp, senarai (silinder, gear), min)) 4 4 4 4. 0000 76. 0 102. 0 6 107. 5000 116. 5 175. 0 8 194. 1667 NA 299. 5

Untuk jadual yang lebih kompleks - iaitu jadual dengan lebih daripada dua faktor silang - menggunakan agregat () fungsi:

agregat (hp ~ sil + gear + am, mtcars, mean) alat silinder hp 1 4 3 0 97. 00000 2 6 3 0 107. 50000 3 8 3 0 194. 16667 4 4 4 0 78. 50000 5 6 4 0 123. 00000 6 4 4 1 75. 16667 7 6 4 1 110. 00000 8 4 5 1 102. 00000 9 6 5 1 175. 00000 10 8 5 1 299. 50000

Menggunakan pencari matlamat dan pemecah

Dalam R, fungsi mengoptimumkan () berfungsi menyediakan satu mekanisme yang agak mudah untuk mengoptimumkan fungsi.

Bayangkan anda adalah pengarah jualan sebuah syarikat dan anda perlu menetapkan harga terbaik untuk produk anda. Dengan kata lain, cari harga produk yang memaksimumkan pendapatan.

Dalam ekonomi, model harga mudah menyatakan bahawa orang membeli kurang daripada produk tertentu apabila kenaikan harga. Fungsi ini sangat sederhana yang mempunyai tingkah laku ini:

jualan <- fungsi (harga) {100 - 0. 5 * price}

Pendapatan dijangka kemudiannya hanyalah hasil jualan dan jualan yang diharapkan: >> pendapatan <- fungsi (harga) {harga * jualan (harga)}

Anda boleh menggunakan fungsi kurva () untuk merancang fungsi yang berterusan. Ini mengambil fungsi sebagai input dan menghasilkan plot. Cobalah merancang tingkah laku jualan dan hasil menggunakan fungsi kurva (), harga berbeza dari $ 50 hingga $ 150: >> kurva oldpar (jualan, dari = 50, ke = 150, xname = "harga", utama = "Jualan ")> Kurva (pendapatan, dari = 50, ke = 150, xname =" harga ", utama =" Hasil ")> par (oldpar)

Hasil anda sepatutnya kelihatan seperti ini.

Model jualan dan hasil yang diharapkan.

Anda mempunyai model jualan dan hasil kerja. Anda dapat melihat dengan segera bahawa terdapat hasil maksimum. Seterusnya, gunakan fungsi R mengoptimumkan () untuk mencari nilai maksimum itu. Untuk menggunakan mengoptimumkan (), anda perlu menceritakan fungsi yang digunakan (dalam kes ini, pendapatan ()), serta selang (dalam kes ini, harga antara 50 dan 150). Secara lalai, mengoptimumkan () mencari nilai minimum, jadi dalam hal ini anda harus memberitahunya untuk mencari nilai maksimum: >> mengoptimalkan (pendapatan, selang = c (50, 150), maksimum = TRUE) $ maksimum [1] 100 $ objektif [1] 5000

Dan di sana anda pergi. Caj harga sebanyak $ 100, dan mengharapkan untuk mendapatkan $ 5, 000 hasil.

10 Perkara yang Anda boleh lakukan dalam R yang Anda Akan Selesai di Microsoft Excel - dummies

Pilihan Editor

Bagaimana Membuat Perubahan Global untuk Pautan di Dreamweaver - dummies

Bagaimana Membuat Perubahan Global untuk Pautan di Dreamweaver - dummies

Jika anda mahu mengubah link di seluruh dunia di Dreamweaver untuk menunjuk URL baru atau ke beberapa halaman lain di laman web anda, anda boleh menggunakan pilihan Tukar Link Sitewide untuk memasukkan URL baru dan menukar setiap rujukan secara automatik. Anda boleh menggunakan pilihan ini untuk menukar sebarang jenis pautan, termasuk mailto, ...

Cara Mengurus Tapak di Dreamweaver - dummies

Cara Mengurus Tapak di Dreamweaver - dummies

Setelah anda menyelesaikan proses persediaan tapak, tambahan kepada persediaan tapak dengan memilih Site → Manage Sites untuk membuka kotak dialog Kelola Tapak. Untuk mengedit tapak yang telah anda tetapkan, pilih nama tapak dalam kotak dialog Kelola Tapak, dan kemudian klik ikon ...

Cara Membuat Atribut Dreamweaver Disunting - dummies

Cara Membuat Atribut Dreamweaver Disunting - dummies

Di samping membuat sebarang elemen dalam halaman yang dapat diedit, membuat atribut mana-mana unsur dalam Dreamweaver boleh diedit. Langkah ini hanya perlu jika anda ingin membuat atribut disunting apabila tag itu sendiri tidak boleh diedit (contohnya, apabila anda ingin keupayaan untuk menukar imej latar belakang ...

Pilihan Editor

Dating Selepas 50: Membiarkan Seseorang Down - dummies

Dating Selepas 50: Membiarkan Seseorang Down - dummies

Berfikir tentang bagaimana perasaan apabila anda orang yang lebih cintakan, dan orang lain menganggap anda hanya membengkak - tetapi pada satu titik. Ini keadaan yang sukar. Orang suka siapa yang mereka cintai, dan hanya kerana tarikh yang memikirkan anda sebagai kawan tidak secara automatik menyejukkan api tarikan dan ...

Dating Selepas 50: Bagaimana Pendekatan Seorang - patung

Dating Selepas 50: Bagaimana Pendekatan Seorang - patung

Hak cipta © 2014 AARP. Hak cipta terpelihara. Sekiranya anda tidak bertarikh dalam masa yang lama, menghampiri seseorang mungkin berasa canggung, dan didekati mungkin merasa memalukan atau sedikit menakutkan. Jika anda ketakutan, pastikan bahawa sementara kastam telah berubah, asas-asas akan kembali kepada anda. Ia sebenarnya sedikit seperti ...

Pilihan Editor

Cara Membuat Strategi Keamanan Pengkomputeran Awan - monyet

Cara Membuat Strategi Keamanan Pengkomputeran Awan - monyet

Strategi keselamatan yang dirancang, isu yang berbeza akan muncul dengan pengkomputeran awan. Oleh itu, strategi anda perlu mengambil kira model pengkomputeran yang berbeza ini. Malah, anda ingin memastikan bahawa strategi keselamatan IT anda dipenuhi dengan strategi keselamatan awan anda. Penunjuk untuk mewujudkan awan ...

Dan Forensik dalam penyedia perkhidmatan pengkomputeran Cloud - dummies

Dan Forensik dalam penyedia perkhidmatan pengkomputeran Cloud - dummies

Masing-masing mempunyai cara pengurusan sendiri. Terdapat tiga kumpulan produk keselamatan IT - log aktiviti, sistem perlindungan pencerobohan berasaskan tuan rumah dan sistem perlindungan intrusi berasaskan rangkaian, dan audit data. Log aktiviti sebagai keselamatan pengkomputeran awan Banyak keupayaan pembalakan dimasukkan ke dalam sistem pengendalian, aplikasi, pangkalan data, dan peranti seperti ...

Menggabungkan Pengkomputeran Awan dan Seni Bina Berorientasikan Perkhidmatan - makmies

Menggabungkan Pengkomputeran Awan dan Seni Bina Berorientasikan Perkhidmatan - makmies

Awan mempunyai beberapa ciri utama: keanjalan, - peruntukan perkhidmatan, antara muka berasaskan piawaian, dan membayar semasa anda pergi. Jenis fungsi ini harus direkayasa ke dalam perisian. Untuk mencapai kejuruteraan jenis ini memerlukan asas untuk awan direka dengan baik dan diwarisi dengan baik. Bagaimana pula dengan seni bina awan yang membuat pendekatan ini mungkin? ...