Video: Perak Ambil Kira Pandangan Dan Kritikan Penduduk Ipoh Terhadap RKK:- Datuk Saarani Mohamad 2024
Perlombongan data mempunyai keperluan yang sangat ketat untuk organisasi data. Mereka tidak eksotik, kompleks, atau sukar untuk memenuhi, tetapi mereka ketat. Angka ini menunjukkan sampel data yang dilihat sebagai jadual dalam perisian penambangan data.
Setiap baris mewakili satu petak hartanah. Maklumat mengenai petak hartanah disusun dalam ruangan. Lajur pertama mengandungi nombor pengenalan cukai (TAXKEY), lajur kedua mengandungi nilai penilaian tanah dari penilaian sebelumnya (P_A_LAND), dan sebagainya.
Setiap penyertaan di mana-mana satu baris berkaitan dengan satu petak tertentu tanah. Setiap penyertaan di mana-mana lajur adalah jenis maklumat yang sama. Tiada baris atau lajur dibiarkan kosong kerana sebab yang berkaitan dengan gaya dan kebolehbacaan. Data ini diatur dengan baik untuk menyiasat perbezaan di antara petak hartanah.
Jika, bukan harta tanah, anda menyiasat orang, setiap orang akan diwakili oleh satu baris dalam data, dan semua butiran tentang orang akan diorganisir ke dalam lajur. Jika anda menyiasat sinar-x dada, setiap x-ray dada akan diwakili oleh satu baris dalam data, dan semua butiran mengenai sinar-x dada akan diatur ke dalam lajur.
Dalam terminologi analisis data, perkara yang anda sedang belajar - perkara dalam baris - dipanggil kes atau rekod. Dan butiran tentang mereka, yang berada dalam lajur, dipanggil pembolehubah . Anda juga akan mendengar lajur yang dipanggil bidang, terutama dalam konteks pangkalan data.
Jadi, perlombongan data memerlukan data yang dianjurkan dengan satu baris untuk setiap kes dan satu lajur untuk setiap pembolehubah. Banyak sumber data sudah diatur dengan cara ini. Ahli statistik menyusun data dengan cara ini dengan kebiasaan. Profesional pangkalan data mungkin tidak menggunakan pendekatan ini untuk kebanyakan kerja mereka, tetapi biasanya mereka akan memahami apa yang anda inginkan jika anda memanggilnya meja datar .
Anda akan menemui variasi halus dalam struktur data. Sesetengah jenis perisian menggunakan maklumat deskriptif di tajuk sebelum data, seperti format khusus tertentu yang berkaitan dengan aplikasi data pertambangan Orange dan Weka. Sesetengah prosedur analitik kompleks mempunyai keperluan tambahan atau sedikit variasi (ini agak luar biasa). Tetapi teras data masih mempunyai kes-kes dalam baris dan pemboleh ubah dalam lajur.