Rumah Kewangan Peribadi Cara Plot Summarized Data dalam ggplot2 dalam R - dummies

Cara Plot Summarized Data dalam ggplot2 dalam R - dummies

Isi kandungan:

Video: Quick Plots - R Studio (ggplot2) 2024

Video: Quick Plots - R Studio (ggplot2) 2024
Anonim

Satu ciri yang sangat mudah dari ggplot2 adalah pelbagai fungsi untuk meringkaskan data R anda dalam plot. Ini bermakna anda sering tidak perlu merumuskan semula data anda. Sebagai contoh, ketinggian bar dalam histogram menunjukkan berapa banyak pemerhatian sesuatu yang anda ada dalam data anda.

Ringkasan statistik untuk ini adalah mengira pemerhatian. Ahli statistik merujuk kepada proses ini sebagai binning, dan stat default untuk geom_bar () adalah stat_bin ().

Secara analog dengan cara setiap geom mempunyai stats lalai yang berkaitan, setiap statistik juga mempunyai geom lalai.

Jadi, ini menimbulkan persoalan: Bagaimana anda memutuskan sama ada menggunakan geom atau stat? Secara teori, tidak kira sama ada anda memilih geom atau stat terlebih dahulu. Walau bagaimanapun dalam amalan, ia sering intuitif untuk memulakan dengan jenis plot terlebih dahulu - dengan kata lain, nyatakan geom. Sekiranya anda mahu menambah satu lagi ringkasan statistik, gunakan statistik.

Dalam plot ini, anda menggunakan data yang sama untuk mula membuat hamburan dengan geom_point () dan kemudian anda menambah garis lancar dengan stat_smooth ().

Lihat beberapa contoh praktikal menggunakan fungsi stat.

Stat Deskripsi Geom Lalai
stat_bin () Mengira bilangan pemerhatian dalam tong. geom_bar ()
stat_smooth () Mencipta garis lancar. geom_line ()
stat_sum () Menambah nilai. geom_point ()
stat_identity () Tiada ringkasan. Plot data seperti. geom_point ()
stat_boxplot () Meringkaskan data untuk petak box-and-whisker. geom_boxplot ()
Bagaimana data bin di ggplot2

Anda telah melihat bagaimana menggunakan stat_bin () untuk meringkaskan data anda ke dalam tong, kerana ini adalah stat default geom_bar (). Ini bermakna bahawa dua baris kod berikut menghasilkan plot yang sama: >> ggplot (gempa, aes (x = kedalaman)) + geom_bar (binwidth = 50)> ggplot (gempa, aes (x = kedalaman) binwidth = 50)

Bagaimana untuk memperlancar data R dalam ggplot2

Pakej ggplot2 juga menjadikannya sangat mudah untuk membuat garis regresi melalui data anda. Anda menggunakan fungsi stat_smooth () untuk membuat garis jenis ini.

Perkara yang menarik tentang stat_smooth () ialah ia menggunakan regresi tempatan secara lalai. R mempunyai beberapa fungsi yang boleh melakukan ini, tetapi ggplot2 menggunakan fungsi loess () untuk regresi tempatan. Ini bermakna jika anda ingin membuat model regresi linear anda perlu memberitahu stat_smooth () untuk menggunakan fungsi yang lebih lancar. Anda melakukan ini dengan hujah kaedah.

Untuk menggambarkan penggunaan yang lebih lancar, mulailah dengan membuat penumpuan pengangguran dalam dataset longley: >> ggplot (longley, aes (x = Year, y = Bekerja)) + geom_point ()

Next, tambah halus.Ini semudah menambahkan stat_smooth () ke baris kod anda. >> ggplot (longley, aes (x = Year, y = Employed)) + + geom_point () + stat_smooth ()

Akhir sekali, beritahu stat_smooth untuk menggunakan model regresi linear. Anda melakukan ini dengan menambah kaedah argumen = "lm". >> ggplot (longley, aes (x = Year, y = Employed)) + + geom_point () + stat_smooth (method = "lm")

How to tell ggplot2 to leave data you unsummarized

tidak mahu ggplot2 untuk meringkaskan data anda dalam plot. Ini biasanya berlaku apabila data anda telah diringkaskan sebelum atau apabila setiap baris bingkai data anda terpapar secara berasingan. Dalam kes ini, anda ingin memberitahu ggplot2 untuk tidak berbuat apa-apa, dan statistik untuk melakukan ini adalah stat_identity ().
Cara Plot Summarized Data dalam ggplot2 dalam R - dummies

Pilihan Editor

Lookup pintar di Office Online - dummies

Lookup pintar di Office Online - dummies

Di versi pengguna Office Online, ada ciri yang sangat keren yang membolehkan anda untuk mencari maklumat dari Bing, Wikipedia, Kamus Bahasa Inggeris Oxford, dan web itu sendiri, tanpa meninggalkan skrin atau halaman yang anda sedang aktif. Sebagai contoh, sebagai contoh, anda menulis blog di Word Online yang menyebut Paul Revere. Anda mahu ...

SharePoint Online App Options - dummies

SharePoint Online App Options - dummies

SharePoint Online dilengkapi dengan koleksi senarai standard dan perpustakaan. Microsoft telah mengambil masa untuk membangunkan ini untuk menjadikan kehidupan anda sebagai pemaju lebih mudah, jadi anda juga boleh menggunakannya. Senarai berikut memperkenalkan aplikasi senarai SharePoint standard dan memberikan penerangan ringkas: App Access: Aplikasi ini ...

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Di Skype untuk Perniagaan, anda boleh menandai kenalan anda untuk makluman perubahan status. Ada kalanya anda memerlukan input daripada ahli pasukan. Cara terbaik untuk melakukannya dengan cepat adalah untuk menjangkau ahli pasukan anda, sama ada satu-satu atau kepada mereka sekaligus, melalui mesyuarat maya ad hoc. Mengetahui anda ...

Pilihan Editor

Outlook Kenalan 2016 Tab Rumah - dummies

Outlook Kenalan 2016 Tab Rumah - dummies

Pandangan Kenalan 2016 adalah lebih daripada sekadar senarai nama dan alamat e-mel. Anda boleh memanfaatkan tab Kenalan Home pada Outlook 2016 Ribbon untuk membuat kenalan baru, untuk mengatur cara anda melihat kenalan yang anda ada, atau untuk membuat mesej e-mel atau mel menggabungkan dokumen. Imej berikut menunjukkan ...

Quick for Outlook 2013 - dummies

Quick for Outlook 2013 - dummies

Outlook 2013 adalah program pelbagai guna. Ia adalah buku alamat, kalendar, senarai tugasan, dan program pengendalian e-mel, semua dalam satu. Ciri Outlook yang paling popular, bagaimanapun, adalah pengendalian e-mel. Berjuta-juta orang menggunakan Outlook sebagai program e-mel utama mereka, dan atas sebab yang baik! Ia pantas, lengkap, dan mudah digunakan dan ...

Pilihan Editor

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Semasa mengatasi masalah Windows Server 2008 yang perlu anda kenal dengan Perkhidmatan konsol. Konsol perkhidmatan diakses dengan memilih Start → Administrative Tools → Services. Seperti yang digambarkan dalam menunjukkan angka berikut, konsol Perkhidmatan memaparkan senarai semua perkhidmatan yang sedang berjalan pada sistem anda. Jika ciri pelayan Windows tidak berfungsi ...

Keselamatan Akaun Administrator rangkaian - dummies

Keselamatan Akaun Administrator rangkaian - dummies

Pentadbir rangkaian bertanggungjawab untuk menyediakan sistem keselamatan rangkaian. Untuk melakukan itu, pentadbir mesti dikecualikan daripada semua sekatan keselamatan. Kerana ini, akaun pentadbir rangkaian mesti dilayan dengan berhati-hati. Banyak rangkaian secara automatik membuat akaun pengguna pentadbir apabila anda memasang perisian rangkaian. Nama pengguna dan kata laluan ...

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pertanyaan DNS biasa adalah pertanyaan carian ke hadapan, sesuai dengan nama domain yang memenuhi syarat. Peninjauan terbalik adalah bertentangan dengan pendahuluan ke hadapan: Ia mengembalikan nama domain yang lengkap bagi host berdasarkan alamat IPnya. Peninjauan terbalik adalah mungkin kerana domain khas yang dipanggil ...