Video: The Groucho Marx Show: American Television Quiz Show - Door / Food Episodes 2024
Oleh Meta S. Brown
Penambangan data adalah cara yang ahli perniagaan biasa menggunakan pelbagai teknik analisa data untuk mendedahkan berguna maklumat daripada data dan letakkan maklumat tersebut ke dalam penggunaan praktikal. Penambang data tidak merosakkan teori dan andaian. Mereka mengesahkan penemuan mereka dengan ujian. Dan mereka faham bahawa perkara berubah, jadi apabila penemuan yang bekerja seperti pesona kemarin tidak berlaku hari ini, mereka menyesuaikan diri.
Pelombongan data perintis Thomas Khabaza telah membangunkan "Sembilan Undang-Undang Data Perlombongan" untuk membimbing pelombong data baru ketika mereka turun ke tempat kerja. Panduan rujukan ini menunjukkan kepada anda apa yang setiap undang-undang ini bermakna untuk kerja harian anda.Undang-undang Pertambangan Data 1, atau "Undang-undang Tujuan Perniagaan":
-
Objektif perniagaan adalah asal setiap penyelesaian penambangan data.
Undang-undang Perlombongan Data 2, atau "Undang-Undang Pengetahuan Perniagaan":
-
Pengetahuan Perniagaan adalah penting kepada setiap langkah proses perlombongan data . Anda tidak perlu menjadi ahli statistik mewah untuk melakukan perlombongan data, tetapi anda perlu mengetahui sesuatu tentang apa yang dimaksudkan oleh data dan bagaimana perniagaan berfungsi.
-
Penyediaan data adalah lebih daripada separuh daripada setiap proses perlombongan data . Cukup banyak setiap penambang data akan menghabiskan lebih banyak masa untuk penyediaan data daripada analisis.
Undang-undang Data Perlombongan ke-4, atau "Tiada Makan Tengahari Percuma untuk Data Miner":
-
Model yang sesuai untuk aplikasi tertentu hanya dapat ditemui dengan percubaan . Dalam perlombongan data, model dipilih melalui percubaan dan kesilapan.
Undang-undang ke-5 Perlombongan Data:
-
Selalu ada corak dalam data . Sebagai penambang data, anda meneroka data untuk mencari pola yang berguna. Memahami corak dalam data membolehkan anda mempengaruhi apa yang berlaku pada masa akan datang.
Undang-undang Data Perlombongan ke-6, atau "Undang-undang Insight":
-
Perlombongan data meningkatkan persepsi dalam domain perniagaan . Kaedah perlombongan data membolehkan anda memahami perniagaan anda lebih baik daripada yang anda boleh lakukan tanpa mereka.
Undang-undang Data Perlombongan ke-7 atau "Undang-undang Ramalan":
-
Ramalan meningkatkan maklumat secara umum oleh generalisasi. Perlombongan data membantu kita menggunakan apa yang kita tahu untuk membuat ramalan yang lebih baik (atau anggaran) perkara yang tidak kita ketahui.
Undang-undang Data Perlombongan ke-8, atau "Undang-undang Nilai":
-
Nilai hasil perlombongan data tidak ditentukan oleh ketepatan atau kestabilan model ramalan . Model anda mesti menghasilkan ramalan yang baik, secara konsisten. Itu sahaja.
Undang-undang Data Perlombongan ke-9, atau "Undang-undang Perubahan":
-
Semua corak tertakluk kepada perubahan. Mana-mana model yang memberi anda ramalan yang hebat hari ini mungkin tidak berguna hari esok.
Tahap Proses Perlombongan Data
Proses Piawai Perindustrian Industri untuk Perlombongan Data ( CRISP-DM ) adalah kerangka proses penambangan data yang dominan. Ia adalah standard terbuka; sesiapa sahaja boleh menggunakannya. Senarai berikut menerangkan pelbagai fasa proses. Pengetahuan perniagaan:
-
Dapatkan pemahaman yang jelas mengenai masalah yang anda selesaikan untuk menyelesaikannya, bagaimana ia mempengaruhi organisasi anda, dan matlamat anda untuk mengatasinya. Tugas dalam fasa ini termasuk: Mengenal pasti matlamat perniagaan anda
-
Menilai kedudukan anda
-
Menentukan matlamat perlombongan data anda
-
Menghasilkan pelan projek anda
-
Pemahaman data:
-
-
dokumen itu, mengenal pasti pengurusan data dan isu kualiti data. Tugas untuk fasa ini termasuk: Mengumpul data
-
Menjelaskan
-
Menjelajahi
-
Mengesahkan kualiti
-
Penyediaan data:
-
-
Dapatkan data anda sedia untuk digunakan untuk pemodelan. Tugas untuk fasa ini termasuk: Memilih data
-
Data pembersihan
-
Membina
-
Mengintegrasikan
-
Pemformatan
-
Pemodelan:
-
-
Gunakan teknik matematik untuk mengenal pasti corak dalam data anda. Tugas untuk fasa ini termasuk: Memilih teknik
-
Ujian merancang
-
Model bangunan
-
Model penilaian
-
Penilaian:
-
-
Tinjau pola yang telah anda temukan dan menilai potensi mereka untuk kegunaan perniagaan. Tugas untuk fasa ini termasuk: Menilai keputusan
-
Memeriksa proses
-
Menentukan langkah seterusnya
-
Pelaksanaan:
-
-
Letakkan penemuan anda untuk bekerja dalam perniagaan setiap hari. Tugas untuk fasa ini termasuk: Perancangan perancangan (kaedah anda untuk mengintegrasikan penemuan perlombongan data ke penggunaan)
-
Melaporkan hasil akhir
-
Meninjau hasil akhir
-