Video: Week 6 2024
Data yang dikumpulkan oleh organisasi besar dalam perniagaan harian biasanya disimpan dalam pangkalan data. Tetapi pentadbir pangkalan data mungkin tidak bersedia untuk membenarkan penambang data mengakses langsung ke sumber data, dan capaian langsung mungkin bukan pilihan terbaik dari sudut pandangan anda sama ada Akses langsung ke operasi (digunakan untuk operasi perniagaan rutin) boleh menjadi idea yang buruk kerana
-
Penambang data menggunakan banyak data
Anda boleh secara tidak sengaja melanggar undang-undang privasi data atau pengurusan data lain yang tidak sengaja mengikat sumber dan mengganggu operasi perniagaan biasa. -
Pangkalan data operasi tidak dianjurkan untuk perlombongan data
-
Anda boleh menghabiskan banyak masa bergelut untuk mendapatkan data yang anda perlukan, dan masih tidak pasti untuk mendapatkannya dengan betul. Apabila anda memerlukan data dari pangkalan data operasi (dan anda mempunyai kelulusan yang sesuai untuk menggunakan data tersebut), anda harus membincangkan keperluan anda dengan pentadbir yang bertanggungjawab untuk data tersebut. Anda perlu menjelaskan dengan tepat data yang anda perlukan, format yang anda perlukan untuk perlombongan data, dan sama ada anda memerlukan data sekali atau secara berterusan.
Akses data yang sedang dijalankan adalah perkara lain. Pentadbir mungkin tidak mahu memberikan ekstrak data berulang-ulang, dan memberi anda akses langsung ke sistem perniagaan berisiko. Penyelesaian yang lazim adalah untuk membuat pangkalan data analitik
. Ini adalah pangkalan data hubungan biasa yang berasingan daripada sistem perniagaan konvensional. Data secara rutin (dan secara automatik) dipindahkan dari sistem perniagaan ke pangkalan data analisis, dan penambang data boleh mengaksesnya pada bila-bila masa.
Jika pentadbir pangkalan data menegaskan bahawa data tidak boleh disimpan dengan cara ini, tanyakan sama ada kemungkinan membuat
view (pertanyaan tersimpan yang boleh dipertimbangkan seolah-olah itu adalah jadual data konvensional) dengan organisasi yang anda perlukan. Banyak produk perlombongan data dapat membaca data dari pangkalan data. Langkah-langkah yang diperlukan bervariasi berdasarkan
Rekabentuk aplikasi perlombongan data
-
Struktur pangkalan data sumber
-
Middleware, biasanya dipanggil pemandu
-
( ODBC, pemandu JDBC <, perisian khusus yang mengantara antara perisian pangkalan data dan aplikasi Dokumentasi untuk aplikasi perlombongan data anda memberitahu anda sama ada ia boleh membaca data dari pangkalan data, dan jika ya, alat atau fungsi apa yang digunakan dan bagaimana.Pentadbir yang menyediakan pangkalan data analitik boleh memberikan butiran tentang mengakses pangkalan data. Jika anda sudah selesa bekerja dengan pangkalan data dan aplikasi lain, anda tidak akan mengejutkan melakukan perkara yang sama dengan aplikasi penambangan data. Sekiranya pangkalan data adalah baru kepada anda, dapatkan orang yang berpengetahuan dari organisasi anda untuk memandu anda melalui proses dengan pangkalan data dan aplikasi penambangan data anda sendiri.