Isi kandungan:
- Undang-undang 1: Matlamat perniagaan
- Undang-undang ke-2: Pengetahuan perniagaan
- Undang-undang ke 3: Penyediaan data
- Undang-undang keempat: Model yang betul
- Undang-undang ke-5: Pola
- Undang-undang ke-6: Pengukuhan
- Undang-undang ke-7: Ramalan
- Undang-undang ke-8: Nilai
- Undang-undang ke-9: Perubahan
Video: Pencemaran Bauksit: Kajian Undang-Undang Kualiti Alam Sekeliling 1974 2024
Setiap profesion mempunyai prinsip bimbingan, idea-idea yang memberikan struktur dan bimbingan dalam kerja setiap hari. Perlombongan data tidak terkecuali. Berikut ialah sembilan idea asas untuk membimbing anda apabila anda bekerja dan menjadi penambang data. Ini adalah 9 Undang-undang Perlombongan Data kerana pada asalnya dinyatakan oleh perintis data perintis, Thomas Khabaza.
Undang-undang 1: Matlamat perniagaan
Berikut adalah Undang-undang Pertambangan Data 1, atau "Undang-undang Tujuan Perniagaan": Objektif perniagaan adalah asal setiap penyelesaian penambangan data.
Anda meneroka data untuk mencari maklumat yang membantu anda menjalankan perniagaan dengan lebih baik. Bukankah ini harus menjadi mantera bagi semua analisis data perniagaan? Sudah tentu ia sepatutnya! Namun pemula data yang baru sering memberi tumpuan kepada teknologi dan maklumat lain, yang mungkin menarik tetapi tidak selaras dengan keperluan dan matlamat pembuat keputusan eksekutif.
Anda perlu membangunkan tabiat mengenal pasti matlamat perniagaan sebelum melakukan apa-apa lagi, dan memfokuskan pada matlamat tersebut pada setiap langkah dalam proses penambangan data. Adalah penting bahawa undang-undang ini datang terlebih dahulu. Semua orang perlu memahami bahawa perlombongan data adalah satu proses dengan tujuan.
Undang-undang ke-2: Pengetahuan perniagaan
Berikut adalah Hukum Perlombongan Data 2, atau "Undang-Undang Pengetahuan Perniagaan": Pengetahuan perniagaan adalah penting bagi setiap langkah proses penambangan data.
Perlombongan data memberikan kuasa kepada orang - ahli perniagaan - yang menggunakan pengetahuan, pengalaman, dan wawasan perniagaan mereka, bersama dengan kaedah penambangan data, untuk mencari makna dalam data.
Anda tidak perlu menjadi ahli statistik mewah untuk melakukan perlombongan data, tetapi anda perlu mengetahui sesuatu tentang apa yang dimaksudkan oleh data dan bagaimana perniagaan berfungsi. Hanya apabila anda memahami data dan masalah yang anda perlukan untuk menyelesaikannya, proses penambangan data boleh membantu anda mencari maklumat yang berguna dan meletakkannya untuk digunakan.
Undang-undang ke 3: Penyediaan data
Berikut adalah Undang-undang Perlombongan Data ke-3, atau "Undang-undang Penyediaan Data": Penyediaan data adalah lebih daripada separuh daripada setiap proses penambangan data.
Ahli statistik tradisional sering mempunyai peluang untuk mengumpulkan data baru untuk menangani soalan penyelidikan tertentu. Mereka boleh menggunakan proses yang ketat untuk merancang eksperimen, membuat soal selidik penyelidikan kaji selidik atau sebaliknya mengumpulkan data berkualiti tinggi yang disasarkan dengan baik untuk matlamat penyelidikan tertentu. Namun selepas itu, mereka masih banyak menghabiskan masa dan menyediakan data untuk analisis.
Penambang data, sebaliknya, hampir selalu perlu bekerja dengan apa sahaja data yang ada. Mereka menggunakan rekod perniagaan sedia ada, data awam, atau data yang mereka boleh beli.Kemungkinannya, semua data itu dikumpulkan untuk tujuan tertentu selain daripada perlombongan data, dan tanpa sebarang pelan yang ketat atau proses pengumpulan data yang teliti. Jadi penambang data menghabiskan banyak masa untuk penyediaan data.
Undang-undang keempat: Model yang betul
Berikut adalah Hukum Perlombongan Data ke-4, atau "NFL-DM": Model yang sesuai untuk aplikasi tertentu hanya dapat ditemui dengan percubaan.
Undang-undang ini juga dikenali dengan NFL-DM, yang bermakna bahawa ada No Free Lunch untuk penambang data.
Pertama, apa model? Ini persamaan yang mewakili corak yang dilihat dalam data. Sekurang-kurangnya, ia mewakili corak dengan cara kasar. Model matematik perkara sebenar tidak sempurna! Ini adalah fakta kehidupan, dan ia juga benar bagi ahli fizik nuklear kerana ia adalah untuk penambang data.
Dalam perlombongan data, model dipilih melalui percubaan dan kesilapan. Anda akan mencuba dengan jenis model yang berbeza.
Undang-undang ke-5: Pola
Berikut adalah Undang-undang Perlombongan Data 5: Selalu ada corak.
Sebagai penambang data, anda akan meneroka data untuk mencari corak yang berguna. Dengan kata lain, anda akan mencari hubungan yang bermakna antara pembolehubah dalam data. Memahami hubungan ini memberikan pemahaman yang lebih baik tentang perniagaan, dan ramalan yang lebih baik mengenai apa yang akan berlaku pada masa akan datang. Paling penting, corak pemahaman dalam data membolehkan anda mempengaruhi apa yang akan berlaku pada masa akan datang.
Anda sentiasa mencari corak. Data sentiasa ada untuk memberitahu anda. Kadang-kadang, ia mengesahkan bahawa apa yang telah anda lakukan adalah betul. Itu mungkin tidak begitu menarik, tetapi sekurang-kurangnya ia memberitahu anda bahawa anda berada di landasan yang betul. Hari-hari lain, data mungkin memberitahu anda bahawa amalan perniagaan semasa anda tidak berfungsi. Itu menarik, dan walaupun ia mungkin tidak menyenangkan dalam jangka pendek, mengetahui kebenaran adalah langkah penting ke arah peningkatan.
Undang-undang ke-6: Pengukuhan
Berikut adalah Undang-undang Pertambangan Data ke-6, atau "Undang-undang Insight": Penambangan data menguatkan persepsi dalam domain perniagaan.
Kaedah penambangan data membolehkan anda memahami perniagaan anda dengan lebih baik daripada yang anda boleh lakukan tanpa mereka. Kaedah penambangan data membantu anda seperti pembesar atau mikroskop, yang membolehkan penemuan kesan yang sukar atau mustahil untuk mengesan melalui pelaporan biasa.
Perlombongan data tidak segera.
Penemuan dan pembelajaran melalui perlombongan data adalah proses interaktif. Anda akan membuat penemuan, mengetahui sedikit dari masing-masing, dan menggunakan apa yang telah anda temukan untuk mengambil tindakan. Keputusan setiap tindakan yang anda cuba akan menghasilkan lebih banyak data, dan data tersebut membolehkan anda memahami sesuatu yang lebih. Ini kitaran penemuan, dan kitaran berterusan selagi anda terus meneroka dan eksperimen.
Undang-undang ke-7: Ramalan
Berikut adalah Undang-Undang Perlombongan Data ke-7, atau "Undang-undang Ramalan": Ramalan meningkatkan maklumat secara umum oleh generalisasi.
Perlombongan data membantu anda menggunakan apa yang anda tahu untuk membuat ramalan yang lebih baik (atau anggaran) perkara yang anda tidak tahu. Perlombongan data menggunakan kaedah data dan pemodelan untuk menggantikan jangkaan tidak rasmi anda dengan anggaran data yang berasaskan data, konsisten, dan lebih tepat.
Undang-undang ke-8: Nilai
Berikut adalah Undang-undang Perlombongan Data ke-8, atau "Undang-undang Nilai": Nilai hasil penambangan data tidak ditentukan oleh ketepatan atau kestabilan model ramalan.
Penambang data tidak merosakkan teori. Sebagai pelombong data, anda mungkin tidak pernah tahu teori di sebalik model statistik yang anda gunakan. Mungkin itu juga, kerana dalam perlombongan data, anda akan menggunakan model tersebut dengan cara yang tidak semestinya sesuai dengan teori di belakangnya.
Anda akan mencari model yang menghasilkan ramalan yang betul (dan anda akan menggunakan ujian, bukan teori statistik, untuk menilai itu). Tetapi anda mungkin lebih prihatin dengan isu-isu lain, seperti sama ada model itu membuat rasa perniagaan, menyinari anda tentang faktor ramalan yang tidak dijangka atau praktikal untuk digunakan di tempat kerja anda.
Undang-undang ke-9: Perubahan
Berikut adalah Undang-undang Perlombongan Data ke-9, atau "Undang-undang Perubahan": Semua corak boleh berubah.
Dunia sentiasa berubah. Model yang memberikan anda ramalan yang hebat hari ini mungkin tidak berguna hari esok. Ini adalah fakta kehidupan untuk semua penganalisis data, bukan hanya penambang data.