Video: KSSM17 1IN 06 Membina Plot Batang dan Daun 2024
A plot batang dan daun adalah peranti grafis di mana pengedaran kumpulan data diatur oleh nilai berangka pemerhatian dalam dataset. Rajah tersebut terdiri daripada "batang," yang menunjukkan kategori yang berbeza dalam data, dan "daun," yang menunjukkan nilai-nilai pemerhatian individu dalam dataset.
Sebagai contoh, berikut adalah gambarajah batang dan daun untuk harga harian saham Microsoft mulai 1 Januari 2013 hingga 31 Disember 2013. Harganya berkisar dari $ 25. 16 hingga $ 38. 14:
Pada plot batang dan daun, setiap baris mewakili satu kategori; untuk dataset ini, setiap kategori adalah jumlah dolar. Sebagai contoh, kategori 32 terdiri daripada semua harga antara $ 32. 00 dan $ 32. 99. Setiap harga saham Microsoft disebut dalam dolar dan sen. Bahagian kiri bar menunjukkan dolar (batang); sebelah kanan bar menunjukkan sen (daun), selepas bulat ke 10 sen terdekat. Sebagai contoh, harga $ 32. 23 dibundarkan kepada $ 32. 20, dan ini muncul sebagai 2 di sebelah kanan bar bagi kategori 32. Harga $ 33. 48 dibundarkan kepada $ 33. 50; ini muncul sebagai 5 di sebelah kanan bar bagi kategori 33.
Dengan menggunakan teknik ini, mudah untuk melihat berapa banyak harga jatuh ke dalam setiap kategori. Sebagai contoh, terdapat 14 hari dagangan dalam dataset di mana harga stok Microsoft berada antara $ 25. 00 dan $ 25. 99. Terdapat tiga hari urus niaga di mana harga stok Microsoft adalah antara $ 29. 00 dan $ 29. 99. Harga antara $ 33. 00 dan $ 33. 99 berlaku paling kerap, dan harga antara $ 38. 00 dan $ 38. 99 adalah yang paling jarang berlaku pada tahun ini.
Salah satu kelebihan rajah batang dan daun ialah mudah untuk mengenal pasti mod daripada dataset. (Ingatlah bahawa mod adalah nilai yang paling kerap berlaku dalam dataset.) Jika anda melihat hanya pada julat dolar, maka mudah untuk melihat julat yang mengandungi pengamatan yang paling - yang mempunyai daun terpanjang. Dalam kes ini, harga dalam kisaran 33 ($ 33- $ 33. 99) akan dianggap sebagai mod kerana ia mengandungi kebanyakan pemerhatian.
Satu lagi kelebihan rajah ini adalah bahawa outliers mudah ditemui. Outlier adalah pemerhatian dalam dataset yang jauh lebih besar atau lebih kecil daripada pemerhatian lain dalam dataset. Outlier akan ditunjukkan oleh jurang yang besar antara kedua-dua batang pertama atau terakhir dan yang terdekat.(Bab 10 bercakap lebih lanjut mengenai outliers.)
Salah satu kelemahan untuk rajah batang-dan-daun adalah bahawa mereka menjadi sukar untuk mentafsir untuk dataset besar kerana saiz daun menjadi sukar dikawal.