Isi kandungan:
- Mengenal pasti jenis analitik
- Mengenalpasti cabaran yang lazim dalam analisis
- Wrangling data mentah untuk wawasan yang boleh dipertikaikan
Video: A2 Hosting Review: Actually BUYING & TESTING Their Plans [2019] 2024
Menghidupkan data mentah anda menjadi wawasan yang boleh diambil tindakan adalah langkah pertama dalam perkembangan dari data yang anda telah dikumpulkan kepada sesuatu yang sebenarnya memberi faedah kepada anda. Para saintis data yang berpusatkan perniagaan menggunakan analisis data untuk menghasilkan pandangan dari data mentah.
Mengenal pasti jenis analitik
Disenaraikan di bawah, dalam usaha meningkatkan kerumitan, adalah empat jenis analitik data yang paling mungkin anda hadapi:
-
Analisis deskriptif: Analisis jenis ini menjawab soalan, "Apa yang berlaku? "Analisis deskriptif didasarkan pada data sejarah dan semasa. Seorang penganalisis perniagaan atau ahli sains data yang berpusatkan perniagaan mendasarkan kecerdasan perniagaan moden pada analisis deskriptif.
-
Analisis diagnostik: Anda menggunakan analitik jenis ini untuk mencari jawapan kepada soalan, "mengapa sesuatu yang tertentu ini berlaku? "Atau" apa yang salah? "Analisis diagnostik berguna untuk mengurangkan dan membuat kesimpulan tentang kejayaan atau kegagalan sub-komponen dalam mana-mana inisiatif yang didorong oleh data.
-
Analisis ramalan: Walaupun analisis jenis ini berdasarkan data sejarah dan semasa, analitik ramalan pergi satu langkah lebih jauh daripada analisis deskriptif. Analisis ramalan melibatkan model rumit - bangunan dan analisis untuk meramalkan peristiwa masa hadapan atau trend. Dalam konteks perniagaan, analisis ini akan dilakukan oleh saintis data yang berpusatkan perniagaan.
-
Analitik preskriptif: Analisis jenis ini bertujuan untuk mengoptimumkan proses, struktur, dan sistem melalui tindakan bermaklumat yang berdasarkan analisis ramalan - pada dasarnya memberitahu anda apa yang perlu anda lakukan berdasarkan anggaran yang diketahui tentang apa yang akan berlaku. Kedua-dua penganalisis perniagaan dan saintis data yang berpusatkan perniagaan boleh menghasilkan analitik preskriptif, tetapi kaedah dan sumber data mereka berbeza.
Idealnya, perniagaan harus melibatkan diri dalam semua empat jenis analitik data, tetapi analitik preskriptif adalah cara yang paling langsung dan efektif yang dapat menghasilkan nilai dari pemahaman data.
Mengenalpasti cabaran yang lazim dalam analisis
Analytics biasanya menimbulkan sekurang-kurangnya dua cabaran dalam perusahaan perniagaan. Pertama, organisasi sering kali mempunyai masa yang sukar untuk mencari pekerja baru dengan set kemahiran tertentu yang termasuk analisis. Kedua, penganalisis mahir sering mengalami kesukaran menyampaikan wawasan yang rumit dengan cara yang difahami oleh pembuat keputusan pengurusan.
Untuk mengatasi cabaran-cabaran ini, organisasi mesti mewujudkan dan memupuk budaya yang menghargai dan menerima produk analisis. Usaha ini mesti berfungsi untuk mendidik semua peringkat organisasi, supaya pengurusan mempunyai konsep dasar analisis dan kejayaan yang dapat dicapai dengan melaksanakannya.
Sebaliknya, saintis data yang berpusatkan perniagaan mesti mempunyai pengetahuan kerja yang sangat kukuh tentang perniagaan secara umum dan, khususnya, pemahaman yang mantap tentang perniagaan di tangan. Pengetahuan perniagaan yang kuat adalah salah satu daripada tiga keperluan utama dari mana-mana saintis data yang berpusatkan perniagaan - yang lain dua adalah ketajaman pengkodean yang kuat dan kemahiran analisis kuantitatif yang kuat melalui matematik dan pemodelan statistik.
Wrangling data mentah untuk wawasan yang boleh dipertikaikan
Wrangling data adalah satu lagi bahagian penting dalam kerja yang diperlukan untuk menukar data kepada pandangan. Untuk membina analisis dari data mentah, anda hampir selalu perlu menggunakan wrangling data - proses dan prosedur yang anda gunakan untuk membersihkan dan menukar data dari satu format dan struktur ke yang lain supaya data itu tepat dan dalam format alat analitik dan skrip memerlukan pengambilan.
Senarai berikut menyerlahkan beberapa amalan dan isu-isu yang paling berkaitan dengan penolakan data:
-
Pengekstrakan data: Ahli sains data yang berpusatkan perniagaan mesti terlebih dahulu mengenalpasti dataset apa yang berkaitan dengan masalah yang dihadapi, dan kemudian ekstrak jumlah data yang diperlukan untuk menyelesaikan masalah. (Proses pengekstrakan ini biasanya disebut sebagai perlombongan data.)
-
Data munging: Data munging melibatkan pembersihan data mentah yang diekstrak melalui penambangan data, kemudian mengubahnya menjadi format yang memungkinkan untuk penggunaan yang lebih mudah dari data. (Mung memulakan hidup sebagai proses yang merosakkan, di mana anda akan menukar sesuatu yang dapat dikenali menjadi sesuatu yang tidak dapat dikenali, oleh itu ungkapan Mash Sehingga Tidak Baik, atau MUNG.)
-
Tadbir urus data: Tata tadbir urus data adalah piawaian yang digunakan sebagai langkah kawalan kualiti untuk memastikan sumber data manual dan automatik mematuhi piawaian data model di tangan. Piawaian tadbir urus data mesti digunakan supaya data berada di granulariti yang betul apabila ia disimpan dan siap digunakan.
Granularity adalah ukuran terperinci tahap dataset. Data granulariti ditentukan oleh saiz relatif subkumpulan yang mana data dibahagikan.
-
Reka bentuk data: Seni bina IT adalah kunci. Sekiranya data anda diasingkan dalam repositori yang berasingan - silap data yang terkenal semua orang mengadu tentang - maka ia hanya tersedia untuk beberapa orang dalam satu perniagaan tertentu. Struktur data siled menghasilkan senario di mana majoriti data organisasi tidak dapat digunakan oleh organisasi pada umumnya. (Tidak perlu dikatakan, struktur data siled sangat membazir dan tidak cekap.)
Jika matlamat anda adalah untuk memperoleh nilai dan wawasan yang paling tinggi dari data perniagaan organisasi anda, maka anda harus memastikan bahawa data tersebut disimpan dalam gudang data pusat dan tidak dalam silo berasingan.