Video: Python - Extracting ZIP, TAR, GZ and other archives 2024
Apabila anda mula mempertimbangkan apa yang perlu dilakukan mengenai fail-fail ekstrak dan lain-lain jenis jenis-jenis gudang data jenis yang wujud dalam organisasi anda, anda mesti mencarinya - yang mungkin sukar dicari, memandangkan sifat persekitaran ini.
Berikut adalah petunjuk: Ikuti laporan. Melalui sesi kerja kumpulan dan mesyuarat individu, tentukan dan mengkatalogkan laporan yang digunakan oleh pekerja sepanjang organisasi yang anda bekerjasama untuk membina gudang data. Sebahagian daripada laporan tersebut mungkin datang terus dari aplikasi pengeluaran, dan pangkalan data dan fail masing-masing.
Buat masa ini, jangan risau tentang laporan aplikasi pengeluaran ini. (Jejaki mereka, walaupun, kerana anda boleh menggunakannya sebagai titik permulaan yang sangat baik untuk analisis "data apa yang kami perlukan?", Yang menentukan apa yang anda mahu letakkan di dalam gudang data.) Laporan lain berasal dari data yang diekstrak dari satu atau lebih aplikasi dan disimpan di suatu tempat. Laporan-laporan itu adalah orang-orang yang menumpukan sekarang.
Menggunakan set laporan sebagai titik permulaan anda, mula-mula menentukan siapa yang menggunakannya dan siapa yang bertanggungjawab untuk menghasilkannya. Anda perlu tahu siapa yang menggunakan laporan yang dihasilkan kerana anda mungkin mendapati tiada siapa yang menggunakannya lagi. Hanya dengan menilai inventori laporan dan penggunaan semasa mereka, anda akan selesai dengan menghapuskan fungsi ini tidak dapat digunakan sepenuhnya dari persekitaran pergudangan data anda (dan menguruskan kerumitannya).
Sekali anda memahami pola penggunaan laporan, mengenali orang yang bertanggungjawab untuk menghasilkan laporan. Mereka adalah orang yang mungkin boleh memberitahu anda di mana mereka mendapatkan data, proses yang mereka gunakan untuk menyediakan dan memuatkan data tersebut sebelum menjalankan laporan, dan masalah dan masalah apa yang mereka ada dengan ketersediaan data dan integriti.
Kadang kala, tidak ada individu yang mengetahui keseluruhan urutan langkah-ke-akhir yang digunakan untuk mengekstrak data, menyediakan dan mengatur data tersebut, dan menjalankan laporan - terutama sekali apabila proses ini menyeberangi batas organisasi. (Sebagai contoh, organisasi IT mengendalikan pengekstrakan awal data dan beberapa jaminan kualiti asas, dan organisasi perniagaan mengendalikan proses gabungan dan menjalankan laporan.)
Dalam keadaan ini, dapatkan semua orang di bilik yang sama untuk membincangkan dan bersetuju tentang bagaimana keadaan berfungsi. Anda boleh mengelak daripada menghabiskan banyak masa bermain, "katanya," dengan orang yang secara terang-terangan, anda mungkin akan menimbulkan persoalan dan permintaan berterusan untuk mesyuarat.
Pada akhirnya, melalui ketekunan, anda akan mendapat gambaran lengkap tentang siapa yang menggunakan data mana, siapa yang bertanggungjawab membuat data itu, dan apa yang berlaku di belakang tabir untuk menjadikannya semua berlaku.
Jangan lupa mengapa bahagian gambar - untuk tujuan perniagaan ekstrak fail sedang digunakan. Anda perlu mengetahui maklumat ini, sebagai sebahagian daripada analisis keperluan anda. Semasa anda menyemak apa yang berlaku hari ini, tanya soalan semasa anda mempunyai perhatian pengguna, seperti:
-
Kenapa anda memerlukan maklumat dalam laporan itu?
-
Apakah keputusan yang membuat laporan ini membantu anda dalam membuat?
-
Apabila anda menganalisis data pada laporan itu, siapakah yang akan menyampaikan penemuan anda?
Barisan pertanyaan anda harus mengikuti pemahaman tradisional mengenai keperluan laporan tersebut. Mendapatkan pemahaman yang kukuh tentang soalan-soalan ini di titik analisis ini akan menjimatkan masa anda dalam jangka panjang.