Isi kandungan:
- Penting tidak selalu bermakna penting
- Regresi tidak selalu linier
- Mengekstrap di luar sampel scatterplot adalah idea yang tidak baik
- Perhatikan variabiliti di sekeliling garis regresi
- Contoh boleh menjadi terlalu besar
- Konsumen: Ketahuilah paksi anda
- Menggambarkan pembolehubah kategori seolah-olah ia adalah pemboleh ubah kuantitatif yang salah
- Bila perlu, sertakan variabiliti dalam graf anda
- Berhati-hati apabila mengaitkan konsep buku teks statistik ke Excel
Video: Dragnet: Homicide / The Werewolf / Homicide 2024
Dunia statistik penuh dengan perangkap, tetapi ia juga penuh dengan peluang. Sama ada anda seorang pengguna statistik atau seseorang yang perlu menafsirkannya, mungkin ada yang bermasalah. Ia juga mungkin untuk berjalan di sekitar mereka. Berikut adalah sepuluh petua dan perangkap dari bidang pengujian hipotesis, regresi, korelasi, dan graf.
Penting tidak selalu bermakna penting
Kepentingan adalah, dalam banyak cara, istilah yang kurang dipilih. Apabila ujian statistik menghasilkan keputusan yang signifikan, dan keputusannya adalah menolak H 0 , yang tidak menjamin bahawa kajian di belakang data adalah penting. Statistik hanya boleh membantu membuat keputusan tentang nombor dan kesimpulan tentang proses yang menghasilkannya. Mereka tidak boleh membuat proses itu penting atau menghancurkan bumi. Kepentingan adalah sesuatu yang anda harus menilai sendiri - dan tidak ada ujian statistik yang dapat dilakukan untuk anda.
Regresi tidak selalu linier
Apabila cuba menyesuaikan model regresi kepada scatterplot, godaan itu akan segera menggunakan garis. Ini adalah model regresi yang paling difahami, dan apabila anda menguasainya, cerun dan pemintas bukanlah sesuatu yang menakutkan.
Tetapi regresi linear bukan satu-satunya jenis regresi. Ia mungkin untuk menyesuaikan lengkung melalui scatterplot. Jangan tertipu: Konsep statistik di belakang regresi kurvilinear lebih sukar difahami daripada konsep di sebalik regresi linear.
Walau bagaimanapun, mengambil masa untuk menguasai konsep tersebut. Kadang-kadang, lengkung adalah lebih baik daripada garis.
Mengekstrap di luar sampel scatterplot adalah idea yang tidak baik
Sama ada anda bekerja dengan regresi linear atau regresi kurvilinear, perlu diingat bahawa tidak sesuai untuk umum di luar batas-batas scatterplot.
Katakan anda telah menubuhkan hubungan ramalan yang kukuh di antara ujian kebolehan matematik dan prestasi dalam kursus matematik, dan penumpuan anda merangkumi hanya satu bakat sempit matematik. Anda tidak mempunyai cara untuk mengetahui sama ada hubungan itu melebihi jangkauan itu. Ramalan di luar julat itu tidak sah.
Taruhan terbaik anda adalah untuk memperluas serpihan dengan menguji lebih ramai orang. Anda mungkin mendapati bahawa hubungan asal hanya menceritakan sebahagian daripada cerita.
Perhatikan variabiliti di sekeliling garis regresi
Analisis berhati-hati terhadap sisa (perbezaan antara nilai diperhatikan dan yang diramalkan) boleh memberitahu anda banyak tentang seberapa baik garis yang sesuai dengan data. Andaian asas adalah bahawa kebolehubahan di sekitar garis regresi adalah sama dan ke atas garisan.Jika tidak, model mungkin tidak seperti ramalan seperti yang anda fikirkan. Sekiranya kebolehubahan adalah sistematik (kebolehubahan pada satu hujung daripada yang lain), regresi kurvilinear mungkin lebih sesuai daripada linear. Kesilapan standard anggaran tidak akan selalu menjadi penunjuk.
Contoh boleh menjadi terlalu besar
Percaya atau tidak, ini kadangkala berlaku dengan koefisien korelasi. Sampel yang sangat besar dapat membuat koefisien korelasi kecil secara signifikan statistik.
Tetapi apa yang dimaksudkan dengan pekali korelasi itu? Koefisien penentuan -r 2 - adalah adil. 038, bermakna SS Regresi kurang daripada 4 peratus daripada SS Jumlah . Itu persatuan yang sangat kecil.
Bawah: Apabila melihat pekali korelasi, ketahui saiz sampel. Sekiranya ia cukup besar, ia boleh menjadikan persatuan remeh penting secara statistik. (Hmmm … signifikansi - ada lagi!)
Konsumen: Ketahuilah paksi anda
Apabila anda melihat graf, pastikan anda tahu apa yang terdapat pada setiap paksi. Pastikan anda memahami unit ukuran. Adakah anda faham pembolehubah bebas? Adakah anda faham pemboleh ubah bergantung? Bolehkah anda menerangkan setiap kata dalam kata-kata anda sendiri? Jika jawapan kepada mana-mana soalan ini adalah "Tidak," anda tidak faham graf yang anda lihat.
Apabila melihat graf dalam iklan TV, berhati-hati jika ia hilang terlalu cepat, sebelum anda dapat melihat apa yang terdapat pada paksi. Pengiklan mungkin cuba mencipta kesan palsu tentang hubungan palsu dalam graf. Hubungan bergelar mungkin sah seperti yang lain dalam pengiklanan TV - bukti ilmiah melalui kartun animasi: Berus kecil berus animasi kecil yang membersihkan gigi kartun tidak semestinya menjamin gigi putih jika anda membeli produk.
Menggambarkan pembolehubah kategori seolah-olah ia adalah pemboleh ubah kuantitatif yang salah
Jadi anda hanya bersedia bersaing dalam Siri Rock-Paper-Gunting World Series. Sebagai persediaan untuk kejohanan antarabangsa ini, anda telah mengumpulkan semua perlawanan anda dari sepuluh tahun yang lalu, menyenaraikan peratusan masa yang anda menang ketika anda bermain setiap peranan.
Untuk meringkaskan semua hasil, gunakan keupayaan grafik Excel untuk membuat graf.
Begitu ramai orang membuat graf jenis ini - orang yang sepatutnya tahu lebih baik. Garis dalam graf ini menerangkan kesinambungan dari satu titik ke titik lain. Dengan data ini, tentu saja, itu mustahil. Apa antara batu dan kertas? Kenapa mereka unit yang sama? Mengapa ketiga-tiga kategori dalam perintah itu?
Secara ringkas, graf garis bukan graf yang betul apabila sekurang-kurangnya salah satu pemboleh ubah anda adalah satu set kategori. Sebaliknya, buat graf lajur. Carta pai juga berfungsi di sini kerana data adalah peratusan dan anda hanya mempunyai beberapa keping.
Bila perlu, sertakan variabiliti dalam graf anda
Apabila titik dalam graf anda mewakili cara, pastikan graf tersebut termasuk kesilapan standard bagi setiap min.Ini memberi penonton idea tentang kebolehubahan dalam data - yang merupakan aspek penting dalam data.
Bermakna dengan sendirinya tidak selalu memberitahu anda keseluruhan cerita. Ambil setiap peluang untuk memeriksa variasi dan penyelewengan standard. Anda mungkin mendapati beberapa nuggets tersembunyi. Variasi sistematik - nilai tinggi varians yang dikaitkan dengan cara yang besar, contohnya - mungkin petunjuk mengenai hubungan yang tidak anda lihat sebelumnya.
Berhati-hati apabila mengaitkan konsep buku teks statistik ke Excel
Jika anda serius melakukan kerja-kerja statistik, anda mungkin mempunyai kesempatan untuk melihat teks statistik atau dua. Ingat bahawa simbol dalam beberapa bidang statistik tidak standard.
Menyambungkan konsep buku teks ke fungsi statistik Excel boleh menjadi cabaran kerana teks dan kerana Excel. Mesej dalam kotak dialog dan dalam fail Bantuan mungkin mengandungi simbol selain daripada yang anda baca, atau mereka mungkin menggunakan simbol yang sama tetapi dengan cara yang berbeza. Perbezaan ini mungkin menyebabkan anda membuat kemasukan yang salah ke dalam parameter dalam kotak dialog, menyebabkan ralat yang sukar dikesan.