Video: Calculation Model (lite version) for Global Management Challenge 2024
Gudang data warehouse adalah tanpa embel-embel, telanjang-telinga, pendekatan berteknologi rendah untuk menyediakan data yang dapat membantu beberapa pengambilan keputusan perniagaan anda. Tanpa embel-embel bermakna anda menyatukan, di mana mungkin, keupayaan terbukti dan alat yang sudah ada dalam organisasi anda untuk membina sistem anda.
Subjek dan kandungan data lite gudang data
Satu gudang data lite difokuskan pada pelaporan atau analisis hanya satu atau mungkin dua kawasan subjek. Katakan dalam kerja anda di bahagian wayarles sebuah syarikat telefon, anda menganalisa jualan perkhidmatan seperti minit dalam rangkaian, minit luar rangkaian, mesej teks, akses Internet, dan penggunaan mudah alih yang lain kepada isi rumah pengguna.
Jika anda membina lite gudang data semata-mata untuk tujuan ini, anda mempunyai semua maklumat yang diperlukan untuk menyokong analisis dan pelaporan anda untuk pasaran pengguna. Anda tidak mempunyai sebarang maklumat mengenai pengguna perniagaan dan sejarah pembayaran, bagaimanapun, kerana maklumat itu adalah sebahagian daripada bidang subjek yang berbeza, seperti ditunjukkan dalam angka ini.
Berdasarkan halangan kawasan subjek, lite gudang data hanya mempunyai kandungan data yang cukup untuk memenuhi tujuan utama persekitaran, tetapi tidak mencukupi bagi banyak senario apa yang tidak terstruktur yang pengguna dapat membuatnya. Oleh itu, anda mesti memilih dengan teliti, dari antara satu set semua unsur data yang mungkin dan memilih subset yang dapat diurus - elemen yang, tanpa ragu, penting untuk dimiliki. Proses ini adalah sama untuk pelaksanaan gudang data, kecuali bahwa Anda harus sangat disiplin ketika Anda membuat keputusan tentang isi apa yang harus disertakan.
Sumber data
Lite gudang data mempunyai satu set sumber data terhad - biasanya, satu hingga beberapa. Sebagai sebahagian daripada persekitaran aplikasi tunggal secara keseluruhan, contohnya, lite gudang data bertindak sebagai ejen penstrukturan untuk data aplikasi untuk menjadikannya lebih banyak pertanyaan dan mesra laporan.
Cara yang paling umum untuk menyusun semula data aplikasi tunggal adalah untuk menamakan kandungan jadual pangkalan data relasional untuk menghapuskan sebanyak
operasi gabungan hubungan (proses menyatukan data dari lebih dari satu jadual pangkalan data) yang mungkin apabila pengguna menjalankan laporan atau melakukan pertanyaan yang mudah. Denormalisasi adalah bertentangan dengan konsep pangkalan data relasi normalisasi, satu set garis panduan yang kompleks yang memberitahu anda yang mana elemen data harus di mana jadual dalam pangkalan data.
Apabila anda
denormalize pangkalan data, anda tidak bimbang tentang data yang diduplikasi; anda cuba untuk membuat baris data dalam satu jadual yang kemungkinan besar mencerminkan laporan dan pertanyaan yang dijalankan oleh pengguna. Angka ini menunjukkan contoh satu sumber data gudang lite yang dibina berdasarkan pengesahan. Walaupun anda boleh menggunakan data luaran yang disediakan dalam pelaksanaan lite gudang data, data yang anda gunakan jarang sekali diperoleh. Anda lebih cenderung untuk memasukkan data yang telah anda gunakan untuk analisis (mungkin secara berasingan).
Alat perisikan perniagaan
Para pengguna data warehouse lite biasanya bertanya dan membuat laporan yang mencerminkan perspektif "Beritahu saya apa yang terjadi". Oleh kerana pengguna tidak melakukan pemprosesan analisis yang berat, produk yang mereka gunakan untuk mengakses gudang data harus mudah digunakan.
Pengekstrakan, pergerakan, dan pemuatan data
Kesederhanaan adalah nama permainan dalam lite gudang data. Oleh itu, buatlah proses mengekstrak data dari sumber dan melakukan semua fungsi yang diperlukan untuk mempersiapkan data tersebut untuk dimuatkan sebagai mudah dengan menggunakan kedua-dua elemen ini:
Ekstrak fail mudah dari sistem run-the-business dan pemindahan fail yang membolehkan anda untuk memindahkan data dari sumbernya ke lite gudang data
-
Kod tersuai langsung (atau mungkin alat yang mudah digunakan) yang boleh mengekstrak dan memindahkan data
-
Jika sumber data untuk lite gudang data anda dibina berdasarkan pangkalan data relasi dan anda merancang untuk menggunakan produk pangkalan data yang sama untuk gudang data anda, gunakan SQL untuk mengendalikan pengekstrakan dan pergerakan data dengan mudah. Langkah-langkah ini - seperti yang ditunjukkan dalam gambar - menyediakan prosedur standard untuk proses ini (anda perlu menyesuaikan langkah-langkah ini untuk persekitaran tertentu anda, sudah tentu):
Pada sistem yang menempatkan gudang anda, gunakan SQL CREATE TABLE pernyataan untuk membuat takrif bagi setiap jadual dalam lite gudang data anda.
-
Buat pangkalan data
-
sandaran yang mengandungi salinan semua jadual dari sumber yang menyediakan data ke gudang, dan kemudian muatkan semula jadual tersebut ke dalam kawasan pementasan pada sistem yang anda merancang untuk mencari gudang data anda. Anda harus memastikan bahawa jalur lebar rangkaian dan tetingkap masa memadai untuk menyalin semua jadual sumber kepada sistem dengan menggunakan program pemindahan fail.
Gunakan pernyataan SQL INSERT, dengan pernyataan SELECT bersarang yang menyatakan jadual sumber dan lajur masing-masing yang akan mengisi jadual gudang data (dan bagaimana jadual akan disertakan), untuk memuatkan data ke dalam lite gudang data anda.
-
Jalankan satu rangkaian jaminan kualiti (QA) untuk mengesahkan bahawa semua data telah dimuatkan dengan betul.
-
Semak kiraan baris, jumlah angka, dan apa sahaja yang anda boleh.
Senibina
Senibina lite gudang data terdiri daripada pangkalan data yang digunakan untuk menyimpan data, alat perisikan perniagaan depan yang digunakan untuk mengakses data, cara data dipindahkan, dan bilangan subjek kawasan-kawasan.Kata-kata berkaitan persekitaran ini adalah minimalis: tiada lonceng, tiada peluit, tiada apa yang mewah - hanya teknologi yang cukup digunakan untuk persekitaran untuk memberi pengguna akses kepada data yang mereka perlukan.
Senibina lite gudang data, seperti yang ditunjukkan dalam angka ini, mengandungi jenis komponen utama:
Satu pangkalan data mengandungi data gudang.
-
Pangkalan data itu diberi makan terus dari setiap sumber yang menyediakan data ke gudang.
-
Pengguna mengakses data terus dari gudang.