Rumah Kewangan Peribadi Peranan ETL Tradisional dalam Big Data - dummies

Peranan ETL Tradisional dalam Big Data - dummies

Video: Ejen Ali Episod 9 - Misi: Peranan 2024

Video: Ejen Ali Episod 9 - Misi: Peranan 2024
Anonim

Peralatan ETL menggabungkan tiga fungsi penting (ekstrak, mengubah, beban) yang diperlukan untuk mendapatkan data dari satu persekitaran data yang besar dan masukkannya ke persekitaran data yang lain. Secara tradisinya, ETL telah digunakan dengan pemprosesan batch dalam persekitaran gudang data. Gudang data menyediakan pengguna perniagaan dengan cara untuk menyatukan maklumat untuk menganalisis dan melaporkan data yang berkaitan dengan fokus perniagaan mereka. Alat ETL digunakan untuk mengubah data ke format yang diperlukan oleh gudang data.

Transformasi sebenarnya dilakukan di lokasi pertengahan sebelum data dimuatkan ke dalam gudang data. Banyak vendor perisian, termasuk IBM, Informatica, Pervasive, Talend, dan Pentaho, menyediakan alat perisian ETL.

ETL menyediakan infrastruktur asas untuk integrasi dengan melaksanakan tiga fungsi penting:

  • Ekstrak: Baca data dari pangkalan data sumber.

  • Transform: Tukar format data yang diekstrak supaya ia mematuhi keperluan pangkalan data sasaran. Transformasi dilakukan dengan menggunakan peraturan atau menggabungkan data dengan data lain.

  • Beban: Tulis data ke pangkalan data sasaran.

Walau bagaimanapun, ETL sedang berkembang untuk menyokong integrasi di lebih daripada gudang data tradisional. ETL boleh menyokong integrasi merentas sistem transaksi, kedai data operasi, platform BI, hab MDM, awan, dan platform Hadoop. Para vendor perisian ETL memperluaskan penyelesaiannya untuk menyediakan pengekstrakan data, transformasi, dan pemuatan data antara Hadoop dan platform pengurusan data tradisional.

ETL dan alat perisian untuk proses penyepaduan data lain seperti pembersihan data, pemprofilan, dan mengaudit semua kerja pada aspek data yang berbeza untuk memastikan data tersebut dapat dipercaya. Alat ETL diintegrasikan dengan alat-alat kualiti data, dan banyak menggabungkan alat-alat untuk pembersihan data, pemetaan data, dan mengenal pasti keturunan data. Dengan ETL, anda hanya mengeluarkan data yang anda perlukan untuk integrasi. Alat

ETL diperlukan untuk pemuatan dan penukaran data berstruktur dan tidak berstruktur ke dalam Hadoop. Alat ETL lanjutan boleh membaca dan menulis beberapa fail selari dari dan ke Hadoop untuk mempermudah bagaimana data digabungkan menjadi proses transformasi biasa. Beberapa penyelesaian menggabungkan perpustakaan transformasi ETL prebuilt untuk kedua-dua data transaksi dan interaksi yang dijalankan di Hadoop atau infrastruktur grid tradisional.

Transformasi data adalah proses menukar format data supaya ia dapat digunakan oleh aplikasi yang berbeza.Ini mungkin bermakna perubahan dari format data disimpan dalam format yang diperlukan oleh aplikasi yang akan menggunakan data tersebut. Proses ini juga termasuk arahan pemetaan supaya aplikasi diberitahu bagaimana untuk mendapatkan data yang mereka perlukan untuk diproses.

Proses transformasi data dibuat jauh lebih kompleks kerana pertumbuhan yang mengejutkan dalam jumlah data tidak terstruktur. Aplikasi perniagaan seperti pengurusan hubungan pelanggan mempunyai keperluan khusus untuk bagaimana data harus disimpan. Data tersebut mungkin berstruktur dalam baris dan lajur yang teratur dalam pangkalan data relasi. Data adalah separuh berstruktur atau tidak berstruktur jika tidak mengikut keperluan format yang tegar.

Maklumat yang terkandung dalam mesej e-mel dianggap tidak terstruktur, misalnya. Sebahagian daripada maklumat penting syarikat adalah dalam bentuk tidak terstruktur dan separuh berstruktur seperti dokumen, mesej e-mel, format pesanan kompleks, interaksi sokongan pelanggan, urus niaga, dan maklumat yang datang dari aplikasi yang dibungkus seperti ERP dan CRM.

Alat transformasi data tidak direka untuk berfungsi dengan baik dengan data tidak berstruktur. Akibatnya, syarikat-syarikat yang memerlukan untuk memasukkan maklumat yang tidak tersusun ke dalam proses membuat keputusan perniagaan telah dihadapi dengan banyak pengekodan manual untuk mencapai integrasi data yang diperlukan.

Memandangkan pertumbuhan dan kepentingan data tak berstruktur untuk membuat keputusan, penyelesaian ETL dari vendor utama mula menawarkan pendekatan yang standard untuk mengubah data yang tidak tersusun supaya dapat lebih mudah diintegrasikan dengan data berstruktur operasi.

Peranan ETL Tradisional dalam Big Data - dummies

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...