Video: TUTORIAL : Cara Membaca Data SPSS dan Menentukan Uji (Tukey HSD /BNJ, BNT, atau Duncann) 2025
Sebelum anda cuba huraikan data anda dalam R, anda perlu memastikan data anda dalam format yang betul. Ini bermakna
-
Memastikan semua data anda terkandung dalam bingkai data (atau dalam vektor jika pembolehubah tunggal)
-
Memastikan bahawa semua pembolehubah adalah jenis yang betul
-
Memeriksa bahawa semua nilai diproses dengan betul
Sesetengah data hanya boleh mempunyai beberapa nilai yang berbeza. Sebagai contoh, orang boleh sama ada lelaki atau perempuan, dan anda boleh menerangkan kebanyakan jenis rambut dengan hanya beberapa warna.
Kadangkala lebih banyak nilai secara teorinya mungkin tetapi tidak realistik. Sebagai contoh, kereta boleh mempunyai lebih daripada 16 silinder dalam enjin mereka, tetapi anda tidak akan dapati banyak dari mereka. Dalam satu cara atau lain, semua data ini dapat dilihat sebagai kategoris . Dengan definisi ini, data kategori juga termasuk data ordinal.
Sebaliknya, anda mempunyai data yang boleh mempunyai jumlah nilai yang tidak mungkin. Ini tidak semestinya bermaksud bahawa nilai-nilai itu boleh menjadi nilai apa sahaja yang anda suka. Contohnya, perbatuan kereta dinyatakan dalam batu per galon, selalunya dibulatkan ke seluruh batu. Walau bagaimanapun, nilai sebenar akan sedikit berbeza bagi setiap kereta.
Satu-satunya perkara yang mentakrifkan berapa banyak nilai yang mungkin anda benarkan adalah ketepatan yang anda nyatakan data. Data yang boleh dinyatakan dengan mana-mana tahap ketepatan yang dipilih ialah berterusan . Data berskala selang dan data berskala nisbah biasanya data berterusan.
Perbezaan antara data kategori dan berterusan tidak selalu jelas. Umur adalah, pada dasarnya, pembolehubah berterusan, tetapi ia sering dinyatakan dalam bilangan tahun sejak lahir.
Anda masih mempunyai banyak nilai yang mungkin jika anda melakukannya, tetapi apa yang berlaku jika anda melihat umur anak-anak di sekolah menengah tempatan anda? Tiba-tiba anda hanya mempunyai lima, mungkin enam, nilai yang berbeza dalam data anda. Pada ketika itu, anda boleh mendapatkan lebih banyak daripada analisis anda jika anda merawat data sebagai kategori.
Apabila menerangkan data anda, anda perlu membuat perbezaan di antara data yang mendapat manfaat daripada ditukar kepada faktor dan data yang perlu kekal angka. Jika anda dapat melihat data anda sebagai kategori, mengubahnya menjadi faktor yang membantu dengan menganalisisnya.
