Video: Data Analysis in R by Dustin Tran 2024
Distribusi kebarangkalian adalah salah satu daripada banyak teknik statistik yang boleh digunakan untuk menganalisis data untuk mencari pola yang berguna. Anda menggunakan taburan kebarangkalian untuk mengira kebarangkalian yang berkaitan dengan unsur-unsur dataset:
-
Pengedaran binomial: Anda akan menggunakan taburan binomial untuk menganalisis pemboleh ubah yang boleh menganggap hanya satu daripada dua nilai. Sebagai contoh, anda boleh menentukan kebarangkalian bahawa peratusan anggota tertentu di kelab sukan adalah kidal.
-
Pengagihan Poisson: Anda akan menggunakan taburan Poisson untuk menerangkan kemungkinan bilangan peristiwa tertentu yang berlaku sepanjang selang waktu. Contohnya, ia boleh digunakan untuk menggambarkan kebarangkalian bilangan hits yang tertera di laman web pada waktu yang akan datang.
-
Pengedaran normal: Pengedaran normal adalah taburan kebarangkalian yang paling banyak digunakan dalam kebanyakan disiplin, termasuk ekonomi, kewangan, pemasaran, biologi, psikologi, dan banyak lagi. Salah satu ciri ciri dari taburan normal ialah simetri - kebarangkalian pembolehubah adalah jarak yang diberikan di bawah min di mana taburan sama dengan kebarangkalian ia adalah jarak yang sama di atas min.
Sebagai contoh, jika ketinggian min semua lelaki di Amerika Syarikat ialah 70 inci, dan ketinggian biasanya diedarkan, lelaki yang dipilih secara rawak sama besarnya antara 68 dan 70 inci tinggi kerana dia adalah antara 70 dan 72 inci tinggi.
Pengedaran biasa berfungsi dengan baik dengan banyak aplikasi. Sebagai contoh, ia sering digunakan dalam bidang kewangan untuk menerangkan pulangan kepada aset kewangan. Disebabkan kemudahan penafsiran dan pelaksanaannya, taburan normal kadang-kadang digunakan walaupun asumsi normal adalah hanya kira-kira yang betul.
-
Pengagihan t-pelajar: Pengagihan t-pelajar adalah sama dengan taburan normal, tetapi dengan pengagihan t-Pelajar, nilai-nilai yang sangat kecil atau sangat besar kemungkinan besar akan berlaku. Pengedaran ini sering digunakan dalam situasi di mana pemboleh ubah mempamerkan terlalu banyak variasi untuk selaras dengan taburan normal. Ini adalah benar apabila sifat-sifat sampel kecil sedang dianalisis. Dengan sampel kecil, variasi di antara sampel mungkin agak besar, jadi pengedaran normal tidak boleh digunakan untuk menggambarkan sifatnya.
Pengagihan t-pelajar telah dibangunkan oleh W.S. Gosset ketika bekerja di syarikat pembuatan Guinness. Dia cuba untuk menerangkan sifat-sifat sampel kecil.
-
Pengedaran chi-kuadrat: Pengedaran chi-square sesuai untuk beberapa jenis aplikasi. Sebagai contoh, anda boleh menggunakannya untuk menentukan sama ada populasi mengikuti taburan kebarangkalian tertentu. Anda juga boleh menggunakannya untuk menguji sama ada varians dari populasi sama dengan nilai yang ditentukan, dan untuk menguji kebebasan dua dataset.
-
F-distribution: F-distribusi berasal dari pengedaran chi-kuadrat. Anda menggunakannya untuk menguji sama ada variasi dua populasi bersamaan. Pengagihan F juga berguna dalam aplikasi seperti analisis regresi.