Video: Amazon, Jeff Bezos and collecting data | DW Documentary 2024
Apabila merancang untuk pergudangan data, ingat bahawa landskap data hari ini kini merangkumi pelbagai saluran maklumat baru, sumber data baru, dan analisis baru dan laporan yang penting. Menurut kumpulan penganalisis, hampir 80 hingga 85 peratus daripada data hari ini tidak tersusun, dan saluran maklumat baru seperti Web, e-mel, suara melalui IP, pemesejan segera (IM), mesej teks, dan podcast dengan cepat mencipta kedai-kedai data nontradisional. Data dari mana-mana sumber ini akan diminta daripada pengguna anda untuk disepadukan ke dalam gudang data anda.
Nombor:
-
Numerik data dalam bentuk teknikal bilangan bulat dan nombor perpuluhan Teks:
-
Data aksara, biasanya maklumat alfanumerik panjang-tetap yang jarang lebih daripada 255 aksara setiap kejadian, walaupun (sangat jarang) mungkin naik hingga 4, 000 aksara
-
Sama ada tarikh dan masa sebenar atau, lebih berkemungkinan, julat tarikh (seperti bulan dan tahun yang jualan produk dikumpulkan dan disimpan) ia.
Untuk menjadi adil, pergudangan data dalam penjelmaan asalnya, sebagai tempat penyimpanan maklumat yang diperoleh dari aplikasi warisan untuk menyokong pelaporan dan analisis, tidak memerlukan apa-apa selain daripada jenis data tradisional ini. Jenis data tradisional ini membentuk asas data berstruktur yang diuruskan oleh pangkalan data, pangkalan data pangkalan data yang paling popular atau pangkalan data multidimensi.