Rumah Kewangan Peribadi Bagaimana Statistik Suss dalam ggplot2 di R - dummies

Bagaimana Statistik Suss dalam ggplot2 di R - dummies

Isi kandungan:

Video: Statistical Programming with R by Connor Harris 2024

Video: Statistical Programming with R by Connor Harris 2024
Anonim

Selepas data, pemetaan, dan geom, unsur keempat lapisan ggplot2 dalam R menggambarkan bagaimana data harus diringkaskan. Dalam ggplot2, anda merujuk kepada ringkasan statistik ini sebagai statistik .

Satu ciri mudah ggplot2 adalah pelbagai fungsi untuk meringkaskan data anda dalam plot. Ini bermakna anda sering tidak perlu merumuskan semula data anda. Sebagai contoh, ketinggian bar dalam histogram menunjukkan berapa banyak pemerhatian sesuatu yang anda ada dalam data anda. Ringkasan statistik untuk ini adalah mengira pemerhatian. Ahli statistik merujuk kepada proses ini sebagai binning, dan stat default untuk geom_bar () adalah stat_bin ().

Secara analog dengan cara setiap geom mempunyai stats lalai yang berkaitan, setiap statistik juga mempunyai geom lalai.

Jadi, ini menimbulkan persoalan: Bagaimana anda memutuskan sama ada menggunakan geom atau stat? Secara teori, tidak kira sama ada anda memilih geom atau stat terlebih dahulu. Walau bagaimanapun dalam amalan, ia sering intuitif untuk memulakan dengan jenis plot terlebih dahulu - dengan kata lain, nyatakan geom. Sekiranya anda mahu menambah satu lagi ringkasan statistik, gunakan statistik.

geom_bar (). "Membuat histogram dengan geom_bar ().

Dalam plot ini, anda menggunakan data yang sama untuk mula mencipta hamburan dengan geom_point (), dan kemudian anda menambahkan garis lancar dengan stat_smooth ()

Stat

Deskripsi

Geom Default stat_bin () Mengira bilangan pemerhatian dalam tong.
geom_bar () stat_smooth () Mencipta garis lancar
geom_line () stat_sum () Menambahkan nilai
geom_point () stat_identity () Tiada ringkasan. Plot data seperti
geom_point () stat_boxplot () Meringkaskan data untuk petak box-and-whisker.
geom_boxplot ()
> Data binning
Anda telah melihat bagaimana menggunakan stat_bin () untuk meringkaskan data anda ke dalam tong, kerana ini adalah stat default geom_bar (). Ini bermakna bahawa dua baris kod berikut menghasilkan plot yang sama: >> ggplot (gempa, aes (x = kedalaman)) + geom_bar (binwidth = 50)> ggplot (gempa, aes (x = kedalaman)) + stat_bin (binwid th = 50)
Data melicinkan

Pakej ggplot2 juga menjadikannya sangat mudah untuk membuat garis regresi melalui data anda. Anda menggunakan fungsi stat_smooth () untuk membuat garis jenis ini.

Perkara yang menarik tentang stat_smooth () ialah ia menggunakan regresi tempatan secara lalai. R mempunyai beberapa fungsi yang boleh melakukan ini, tetapi ggplot2 menggunakan fungsi loess () untuk regresi tempatan. Ini bermakna jika anda ingin membuat model regresi linear, anda perlu memberitahu stat_smooth () untuk menggunakan fungsi yang lebih lancar.Anda melakukan ini dengan hujah kaedah.

Untuk menggambarkan penggunaan yang lebih lancar, mulakan dengan mencipta penumpuan pengangguran dalam dataset longley: >> p p

Seterusnya, tambahkan lebih lancar. Ini semudah menambahkan stat_smooth () ke baris kod anda. >> p + stat_smooth ()

Grafik anda harus kelihatan seperti plot di sebelah kiri imej di bawah.

Kadangkala, ggplot2 menjana mesej dengan petua dan maklumat tambahan. Selagi anda tidak melihat amaran atau kesilapan, anda boleh mengabaikan mesej ini dengan selamat. Dalam kes ini, stat_smooth () memberitahu anda bahawa lalai yang lebih lancar adalah kaedah yang dipanggil

loess

(melicinkan setempat). Mesej ini juga mengatakan anda boleh menggunakan kaedah pelicinan alternatif.

Akhirnya, gunakan stat_smooth () agar sesuai dan plot model regresi linear. Anda melakukan ini dengan menambah kaedah argumen = "lm": >> p + stat_smooth (method = "lm")

Grafik anda sekarang harus kelihatan seperti plot di sebelah kanan.

stat_smooth ().

Menambah garis regresi dengan stat_smooth (). Melakukan apa-apa dengan identiti Kadangkala anda tidak mahu ggplot2 meringkaskan data anda dalam plot. Ini biasanya berlaku apabila data anda sudah pra-diringkaskan atau apabila setiap baris bingkai data anda terpapar secara berasingan Dalam kes ini, anda ingin memberitahu ggplot2 untuk tidak berbuat apa-apa, dan statistik untuk melakukan ini adalah stat_identity (). Anda mungkin perasan bahawa stat_identity adalah statistik lalai untuk mata dan garisan

Bagaimana Statistik Suss dalam ggplot2 di R - dummies

Pilihan Editor

Lookup pintar di Office Online - dummies

Lookup pintar di Office Online - dummies

Di versi pengguna Office Online, ada ciri yang sangat keren yang membolehkan anda untuk mencari maklumat dari Bing, Wikipedia, Kamus Bahasa Inggeris Oxford, dan web itu sendiri, tanpa meninggalkan skrin atau halaman yang anda sedang aktif. Sebagai contoh, sebagai contoh, anda menulis blog di Word Online yang menyebut Paul Revere. Anda mahu ...

SharePoint Online App Options - dummies

SharePoint Online App Options - dummies

SharePoint Online dilengkapi dengan koleksi senarai standard dan perpustakaan. Microsoft telah mengambil masa untuk membangunkan ini untuk menjadikan kehidupan anda sebagai pemaju lebih mudah, jadi anda juga boleh menggunakannya. Senarai berikut memperkenalkan aplikasi senarai SharePoint standard dan memberikan penerangan ringkas: App Access: Aplikasi ini ...

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Bagaimana Tag Kenalan di Skype untuk Perniagaan - dummies

Di Skype untuk Perniagaan, anda boleh menandai kenalan anda untuk makluman perubahan status. Ada kalanya anda memerlukan input daripada ahli pasukan. Cara terbaik untuk melakukannya dengan cepat adalah untuk menjangkau ahli pasukan anda, sama ada satu-satu atau kepada mereka sekaligus, melalui mesyuarat maya ad hoc. Mengetahui anda ...

Pilihan Editor

Outlook Kenalan 2016 Tab Rumah - dummies

Outlook Kenalan 2016 Tab Rumah - dummies

Pandangan Kenalan 2016 adalah lebih daripada sekadar senarai nama dan alamat e-mel. Anda boleh memanfaatkan tab Kenalan Home pada Outlook 2016 Ribbon untuk membuat kenalan baru, untuk mengatur cara anda melihat kenalan yang anda ada, atau untuk membuat mesej e-mel atau mel menggabungkan dokumen. Imej berikut menunjukkan ...

Quick for Outlook 2013 - dummies

Quick for Outlook 2013 - dummies

Outlook 2013 adalah program pelbagai guna. Ia adalah buku alamat, kalendar, senarai tugasan, dan program pengendalian e-mel, semua dalam satu. Ciri Outlook yang paling popular, bagaimanapun, adalah pengendalian e-mel. Berjuta-juta orang menggunakan Outlook sebagai program e-mel utama mereka, dan atas sebab yang baik! Ia pantas, lengkap, dan mudah digunakan dan ...

Pilihan Editor

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Pentadbiran: Bekerja dengan Perkhidmatan - dummies

Semasa mengatasi masalah Windows Server 2008 yang perlu anda kenal dengan Perkhidmatan konsol. Konsol perkhidmatan diakses dengan memilih Start → Administrative Tools → Services. Seperti yang digambarkan dalam menunjukkan angka berikut, konsol Perkhidmatan memaparkan senarai semua perkhidmatan yang sedang berjalan pada sistem anda. Jika ciri pelayan Windows tidak berfungsi ...

Keselamatan Akaun Administrator rangkaian - dummies

Keselamatan Akaun Administrator rangkaian - dummies

Pentadbir rangkaian bertanggungjawab untuk menyediakan sistem keselamatan rangkaian. Untuk melakukan itu, pentadbir mesti dikecualikan daripada semua sekatan keselamatan. Kerana ini, akaun pentadbir rangkaian mesti dilayan dengan berhati-hati. Banyak rangkaian secara automatik membuat akaun pengguna pentadbir apabila anda memasang perisian rangkaian. Nama pengguna dan kata laluan ...

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pentadbir rangkaian: Zon Carian Songsang - dummies

Pertanyaan DNS biasa adalah pertanyaan carian ke hadapan, sesuai dengan nama domain yang memenuhi syarat. Peninjauan terbalik adalah bertentangan dengan pendahuluan ke hadapan: Ia mengembalikan nama domain yang lengkap bagi host berdasarkan alamat IPnya. Peninjauan terbalik adalah mungkin kerana domain khas yang dipanggil ...