Video: Statistical Programming with R by Connor Harris 2024
Penambang data berfungsi dengan cepat. Untuk mendapatkan kelajuan, anda perlu menggunakan alat yang sesuai dan temukan helah perdagangan. Alat perlombongan data terbaik anda adalah otak anda, dengan sedikit pengetahuan. Alat kedua terbaik adalah aplikasi penambangan data dengan antara muka pengaturcaraan visual.
Dengan pengaturcaraan visual, langkah-langkah dalam proses kerja anda diwakili oleh imej-imej kecil yang anda aturkan pada skrin untuk membuat gambar aliran dan logik kerja anda. Pengaturcaraan visual menjadikannya lebih mudah untuk melihat apa yang anda lakukan dalam beberapa langkah berbanding dengan arahan (pengaturcaraan) atau menu konvensional.
Dalam contoh ini, anda boleh melihat proses kerja di kawasan utama permohonan penambangan data. Sekitarnya adalah menu projek baru-baru ini, alat untuk fungsi penambangan data, penonton untuk membantu anda menavigasi proses kompleks, dan log. Butiran ini berbeza sedikit dari satu produk ke produk yang lain.
Lihat lebih dekat dengan proses itu. Walaupun anda hanya menetapkan dalam usaha anda untuk menjadi penambang data, anda mungkin boleh memahami banyak perkara yang berlaku hanya dengan melihat rajah ini, termasuk yang berikut:
-
Anda boleh melihat Pembaca CSV. Sekiranya anda sedar. format data csv (nilai dipisahkan koma), anda mungkin sudah tahu bahawa ini adalah import data. (Dan ini langkah pertama; anda memerlukan data untuk melakukan apa-apa lagi.)
-
Kemudian anda melihat alat-alat yang jelas dilabelkan oleh fungsi-fungsi seperti Rename Lebar dan Manipulasi String. Ini adalah langkah penyediaan data.
-
Pearson Tree mungkin misteri jika anda baru memodelkan, tetapi alat ini membuat pokok keputusan model dari subset data.
-
Langkah-langkah terakhir menggunakan model untuk data yang disimpan berasingan untuk ujian, dan melakukan beberapa teknik penilaian.