Video: An overview of Azure Integration Services | Azure Friday 2024
Sekitar 1995, vendor mula meletakkan perisian mereka sebagai alat gudang data maya. Premis asas adalah kadang-kadang ia tidak masuk akal untuk menyalin dan memanipulasi sekumpulan data, sekiranya seseorang memerlukannya. Mengapa tidak mengakses data terus dari sumber pada asas yang diperlukan?
Alas, mengakses data melalui rangkaian di sumbernya telah terbukti paling tidak mencabar masalah dalam cuba menyediakan jenis penyimpanan data di tempat. Cabaran yang sama yang dihadapi dalam apa-apa persekitaran pergudangan data (seperti berurusan dengan kualiti data, menentukan jenis transformasi mesti berlaku, dan memilih cara mengendalikan transformasi apabila sumber berbeza tidak konsisten) masih ada.
Hanya kerana anda boleh mendapatkan data di sumbernya (dalam hampir semua pangkalan data atau struktur fail) tidak bermakna data menyediakan perisikan perniagaan yang diperlukan apabila ia berada di tangan anda.
Untuk menyelesaikan isu-isu kualiti data, banyak arkitek data telah mula melaksanakan pembinaan mart data bottom-up untuk membangunkan gudang data berasaskan komponen. Daripada mempunyai satu pangkalan data yang mana anda memberi makan semua data (membuat gudang data anda), satu siri komponen masing-masing mengendalikan satu set fungsi tertentu (seperti menjawab soalan perniagaan tertentu) atau subjek tertentu. Bersama-sama, data ini (atau komponen) terdiri daripada persekitaran pergudangan data.
Ini senibina data akses berasaskan komponen yang dinamik adalah asas untuk pergudangan data maya dan, lebih khusus lagi, apa yang ditawarkan oleh Enterprise Information Integration (EII) ke pasaran.
Angka ini menunjukkan persekitaran di mana komponen individu dicipta dalam persekitaran pergudangan data dengan cara yang paling bawah. Daripada menggabungkan komponen ke dalam satu pangkalan data yang besar (dan menyalin semua data sekali lagi), EII mencipta persekitaran pergudangan data di mana pengguna boleh mengakses kandungan setiap komponen dari alat perisikan perniagaan seperti mereka semua disimpan bersama, walaupun mereka tidak.
Fikirkan tentang cara anda menggunakan pelayar web pada desktop anda. Anda sama ada mengklik pautan atau menaip URL tertentu, dan persekitaran, yang bekerja di belakang tabir, membawa anda ke tempat yang tepat untuk kandungan yang anda minta. Sekarang, bayangkan Internet berjalan lebih cepat.
Apabila anda pergi ke pelbagai laman web, anda tidak dapat mengakses iklan untuk pemacu roda empat terkini yang anda coveting, skor sukan, kartun Dilbert, atau apa sahaja yang anda lakukan di Internet.Anda membawa kembali kepingan data yang kemudian digabungkan dan dihantar kembali ke penyemak imbas anda. Itu pergudangan data maya - ia sama seperti Internet!
Bukan idea yang baik untuk membina persekitaran pergudangan data maya untuk mengakses data sumber secara langsung, dalam format asalnya. Cabaran anda tidak memikirkan cara untuk menyertai pangkalan data lintas platform (menggabungkan data IMS dengan data DB2, contohnya) dan mengendalikan jenis transformasi peringkat sistem, ini memastikan bahawa kualiti data adalah tinggi dan tidak memerlukan pengguna untuk membersihkan data secara manual.
Oleh itu, setiap aplikasi perlu menjadi gudang dan mengandungi penerbit data yang bertanggungjawab untuk semua perkhidmatan middleware (seperti pengekstrakan dan jaminan kualiti), seperti yang dinyatakan dalam peraturan perniagaan alam sekitar.
Penerbit data boleh dibayangkan beroperasi hampir dalam mod masa sebenar, seperti yang perlu dilakukan di kedai data operasi, atau ia boleh berfungsi dalam mod berkala (berorientasikan kelompok) jika kemasukan segera tidak diperlukan. Dalam keadaan ini, penerbit data adalah produk middleware mini yang tertanam dalam aplikasi (atau perkhidmatan yang diakses oleh aplikasi).
Apabila anda memikirkan pergudangan data maya, ganti soalan "Bolehkah saya mendapatkan data? "Dengan soalan" Bolehkah saya mendapatkan data yang boleh digunakan? "Penerbit data memainkan peranan penting, dan tidak boleh diabaikan.
Anda juga tidak boleh mengabaikan seni bina data. Hanya kerana anda sedang membangunkan komponen dengan cara bawah dan mereka sedang diakses di tempat, dan bukannya disalin ke dalam pangkalan data gudang data yang lebih besar, tidak bermakna anda boleh mengabaikan fungsi ini.
Katakan bahawa satu komponen menyimpan ID pelanggan sebagai nombor lima angka selepas perubahan berlaku dan mengandungi hanya pelanggan yang membuat pembelian dalam tempoh enam bulan yang lalu. Dan komponen lain, yang mengandungi semua pelanggan yang pernah membeli produk syarikat anda, menggunakan pengenal angka abjad tujuh huruf. Dalam keadaan ini, anda mungkin mempunyai masalah ketidakpadanan data yang sama seperti yang anda lakukan jika anda mengakses data secara terus dari sumber.
Walaupun EII membenarkan perbezaan antara kandungan komponen, anda mesti memahami dan menguruskan perbezaan supaya anda tidak menghalang misi perisikan perniagaan.