Video: Tempoh moratorium bauksit dilanjutkan Julai ini 2024
Sebahagian daripada Data Perlombongan Untuk Menipu Cheat Sheet
The Proses Standard Industri Cross-Industry untuk Perlombongan Data ( CRISP-DM ) adalah kerangka proses penambangan data yang dominan. Ia adalah standard terbuka; sesiapa sahaja boleh menggunakannya. Senarai berikut menerangkan pelbagai fasa proses.
-
Pengetahuan perniagaan: Dapatkan pemahaman yang jelas mengenai masalah yang anda selesaikan untuk menyelesaikannya, bagaimana ia mempengaruhi organisasi anda, dan matlamat anda untuk mengatasinya. Tugas dalam fasa ini termasuk:
-
Mengenal pasti matlamat perniagaan anda
-
Menilai kedudukan anda
-
Menetapkan tujuan perlombongan data anda
-
Menghasilkan pelan projek anda
-
-
Pemahaman data: dokumen itu, mengenal pasti pengurusan data dan isu kualiti data. Tugas untuk fasa ini termasuk:
-
Mengumpul data
-
Menjelaskan
-
Meneroka
-
Mengesahkan kualiti
-
-
Penyediaan data: Dapatkan data anda sedia untuk digunakan untuk pemodelan. Tugas untuk fasa ini termasuk:
-
Memilih data
-
Data pembersihan
-
Membina
-
Mengintegrasikan
-
Pemformatan
-
-
Pemodelan: Gunakan teknik matematik untuk mengenal pasti corak dalam data anda. Tugas untuk fasa ini termasuk:
-
Memilih teknik
-
Ujian merancang
-
Model bangunan
-
Model penilaian
-
-
Penilaian: Tinjau corak yang telah anda temukan dan menilai potensi mereka untuk kegunaan perniagaan. Tugas untuk fasa ini termasuk:
-
Menilai keputusan
-
Memeriksa proses
-
Menentukan langkah seterusnya
-
-
Pelaksanaan: Letakkan penemuan anda untuk bekerja dalam perniagaan setiap hari. Tugas untuk fasa ini termasuk:
-
Perancangan perancangan (kaedah anda untuk mengintegrasikan penemuan perlombongan data ke penggunaan)
-
Melaporkan hasil akhir
-
Meninjau hasil akhir
-