Video: Microsoft on Trust, Privacy and the GDPR 2024
Banyak kombinasi model penempatan dan penghantaran ada untuk data besar di awan. Sebagai contoh, anda boleh menggunakan awan awam IaaS atau awan peribadi IaaS. Jadi, apakah maksudnya untuk data besar dan mengapa awan itu sesuai untuknya? Nah, data besar memerlukan kluster teragih kuasa pengiraan, iaitu bagaimana awan diwarisi.
Malah, beberapa ciri awan menjadikannya sebahagian penting ekosistem data besar:
-
Skalabilitas: Skalabiliti berkaitan dengan perkakasan merujuk kepada keupayaan untuk pergi dari kecil ke besar kuasa pemprosesan dengan seni bina yang sama. Berkenaan dengan perisian, ia merujuk kepada konsistensi prestasi per unit kuasa sebagai sumber perkakasan meningkat. Awan boleh skala kepada jumlah data yang besar.
Pengkomputeran yang diagihkan, bahagian integral dari model awan, benar-benar berfungsi pada pelan "membahagikan dan menaklukkan". Jadi, jika anda mempunyai jumlah data yang besar, mereka boleh dibahagikan di seluruh pelayan awan. Ciri penting IaaS ialah skala dinamik. Ini bermakna bahawa jika anda menghidupkan memerlukan lebih banyak sumber daripada yang diharapkan, anda boleh mendapatkannya. Hubungan ini menjadi konsep keanjalan.
-
Keanjalan: Keanjalan merujuk kepada keupayaan untuk mengembangkan atau menyusut permintaan sumber pengkomputeran dalam masa nyata, berdasarkan keperluan. Salah satu faedah awan ialah pelanggan mempunyai potensi untuk mengakses sebanyak satu perkhidmatan yang mereka perlukan. Ini boleh membantu projek data besar di mana anda perlu memperluas jumlah sumber pengkomputeran yang anda perlukan untuk menangani data.
-
Pengumpulan sumber: Arsitektur awan membolehkan penciptaan kumpulan sumber yang dikongsi dengan efisien yang menjadikan awan secara ekonomi berdaya maju.
-
Sendiri: Dengan layan diri, pengguna sumber awan boleh menggunakan pelayar atau antara muka portal untuk memperoleh sumber yang diperlukan, katakan, untuk menjalankan ramalan yang besar model. Ini secara dramatik berbeza daripada cara anda memperoleh sumber dari pusat data, di mana anda perlu meminta sumber dari operasi IT.
-
Sering kali kos pendahuluan rendah: Jika anda menggunakan pembekal awan, kos terdepan sering dapat dikurangkan kerana anda tidak membeli sejumlah besar perkakasan atau memajak ruang baru untuk menangani data besar anda. Dengan mengambil kesempatan daripada skala ekonomi yang berkaitan dengan persekitaran awan, awan boleh kelihatan menarik.
-
Bayar seperti yang anda pergi: Pilihan pengebilan tipikal untuk pembekal awan ialah Pay as You Go, yang bermaksud bahawa anda dibilkan untuk sumber yang digunakan berdasarkan harga contoh.Ini berguna jika anda tidak pasti apa sumber yang anda perlukan untuk projek data besar anda.
-
Toleransi kesalahan: Penyedia perkhidmatan awan harus mempunyai toleransi kesalahan yang dibina dalam seni bina mereka, menyediakan perkhidmatan tanpa gangguan walaupun terdapat kegagalan satu atau lebih komponen sistem.
Jelas, sifat awan itu menjadikannya persekitaran pengkomputeran yang ideal untuk data besar. Jadi bagaimana mungkin anda menggunakan data besar bersama awan? Berikut adalah beberapa contoh:
-
IaaS dalam awan awam: Dalam senario ini, anda akan menggunakan infrastruktur penyedia awan awam untuk perkhidmatan data besar anda kerana anda tidak mahu menggunakan infrastruktur fizikal anda sendiri. IaaS boleh menyediakan penciptaan mesin maya dengan penyimpanan hampir tanpa had dan kuasa pengiraan. Anda boleh memilih sistem operasi yang anda mahu, dan anda mempunyai fleksibiliti untuk skala secara dinamik persekitaran untuk memenuhi keperluan anda.
-
PaaS dalam awan peribadi: PaaS adalah keseluruhan infrastruktur yang dibungkus supaya dapat digunakan untuk merancang, melaksanakan, dan menggunakan aplikasi dan perkhidmatan dalam persekitaran awan awam atau swasta. PaaS membolehkan organisasi memanfaatkan perkhidmatan middleware utama tanpa perlu berurusan dengan kerumitan menguruskan perkakasan dan elemen perisian individu.
PaaS vendor mula menggabungkan teknologi data besar seperti Hadoop dan MapReduce ke dalam penawaran PaaS mereka. Sebagai contoh, anda mungkin ingin membina aplikasi khusus untuk menganalisis sejumlah besar data perubatan. Permohonan itu akan menggunakan data masa nyata dan bukan masa nyata. Ia akan memerlukan Hadoop dan MapReduce untuk penyimpanan dan pemprosesan.
-
SaaS dalam awan hibrid: Di sini anda mungkin mahu menganalisis data "suara pelanggan" dari pelbagai saluran. Banyak syarikat telah menyedari bahawa salah satu sumber data yang paling penting adalah apa yang difikirkan dan dikatakan oleh pelanggan mengenai syarikat mereka. Mendapatkan akses kepada suara data pelanggan boleh memberikan pandangan yang tidak ternilai ke dalam tingkah laku dan tindakan. Semakin ramai pelanggan "bersuara" di laman awam.
Nilai input pelanggan boleh dipertingkatkan dengan memasukkan data awam ini ke dalam analisis anda.