Isi kandungan:
- Amazon Elastic Compute Cloud Compute untuk data besar
- Perkhidmatan data besar Google
- Microsoft Azure untuk data besar
- OpenStack untuk data besar
Video: Inilah 5 Layanan Penyimpanan File [Cloud Storage] Terbaik dan Gratis 2024
Penyedia awan datang dalam pelbagai bentuk dan saiz dan menawarkan banyak produk yang berbeza untuk data besar. Sesetengahnya adalah nama rumah tangga manakala yang lain baru muncul. Beberapa penyedia awan yang menawarkan perkhidmatan IaaS yang boleh digunakan untuk data besar termasuk Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM, dan Verizon / Terremark.
Amazon Elastic Compute Cloud Compute untuk data besar
Kini, salah satu pembekal perkhidmatan IaaS yang paling berprofil tinggi adalah Perkhidmatan web Amazon dengan Cloud Compute Elastic (Amazon EC2). Amazon tidak bermula dengan visi untuk membina perniagaan perkhidmatan infrastruktur yang besar.
Sebaliknya, syarikat itu membina infrastruktur besar-besaran untuk menyokong perniagaan runcitnya sendiri dan mendapati sumbernya tidak digunakan. Daripada membenarkan aset ini diletakkan terbiar, ia memutuskan untuk memanfaatkan sumber ini sambil menambah ke bawah. Perkhidmatan EC2 Amazon dilancarkan pada 2006 dan terus berkembang.
Amazon EC2 menawarkan skalabilitas di bawah kawalan pengguna, dengan pengguna membayar sumber daya pada jam itu. Penggunaan istilah elastik dalam penamaan Amazon EC2 adalah penting. Di sini, keanjalan merujuk kepada keupayaan pengguna EC2 untuk meningkatkan atau mengurangkan sumber infrastruktur yang ditugaskan untuk memenuhi keperluan mereka.
Amazon juga menawarkan perkhidmatan data besar yang lain kepada pelanggan perkhidmatan web Amazon. Ini termasuk yang berikut:
-
Amazon Elastic MapReduce: Sasaran untuk memproses jumlah data yang besar. Map EleganceReduce menggunakan kerangka Hadoop yang dihoskan berjalan pada EC2 dan Amazon Storage Simple Service (Amazon S3). Pengguna kini boleh menjalankan HBase.
-
Amazon DynamoDB: Perkhidmatan database SQL (NoSQL) yang diuruskan sepenuhnya. DynamoDB adalah perkhidmatan penyimpanan data yang sangat toleran, sangat mudah untuk menawarkan diri, skalabiliti yang telus, dan pentadbiran mudah. Ia dilaksanakan pada SSD (cakera keadaan pepejal) untuk kebolehpercayaan yang lebih tinggi dan prestasi tinggi.
-
Perkhidmatan Penyimpanan Mudah Alih Amazon (S3): Perkhidmatan skala web yang direka untuk menyimpan jumlah data. Kekuatan pusat reka bentuknya adalah prestasi dan kebolehan skalabilitas, jadi ia tidak seperti ciri yang sarat sebagai kedai data lain. Data disimpan dalam "baldi" dan anda boleh memilih satu atau lebih rantau global untuk penyimpanan fizikal untuk menangani keperluan latensi atau peraturan.
-
Amazon Computing Kinerja Tinggi: Ditala untuk tugas-tugas khusus, perkhidmatan ini menyediakan kumpulan pengkomputeran prestasi tinggi yang dipendam rendah. Paling sering digunakan oleh ahli sains dan ahli akademik, HPC memasuki aliran utama kerana menawarkan Amazon dan pembekal HPC yang lain.Kelompok HPC HPC adalah tujuan yang dibina untuk beban kerja tertentu dan boleh dikonfigurasi dengan mudah untuk tugas-tugas baru.
-
Amazon RedShift: Tersedia dalam pratonton terhad, RedShift adalah perkhidmatan pergudangan data petabyte yang dibina berdasarkan seni bina MPP yang boleh terbaca. Diuruskan oleh Amazon, ia menawarkan alternatif yang selamat dan boleh dipercayai kepada gudang data dalaman dan serasi dengan beberapa alat risikan perniagaan yang popular.
Perkhidmatan data besar Google
Google, gergasi carian Internet, juga menawarkan sejumlah perkhidmatan awan yang disasarkan untuk data besar. Ini termasuk berikut:
-
Enjin Pengiraan Google: Keupayaan berasaskan awan untuk pengkomputeran mesin maya, Google Compute Engine menawarkan persekitaran pengkomputeran yang fleksibel dan selamat dari pusat data cekap tenaga. Google juga menawarkan penyelesaian pengurusan beban kerja dari beberapa rakan teknologi yang telah mengoptimumkan produk mereka untuk Google Compute Engine.
-
Google Big Query: Membolehkan anda untuk menjalankan query seperti SQL pada kelajuan tinggi terhadap set data besar berpotensi berbilion-bilion baris. Walaupun ia baik untuk menanyakan data, data tidak dapat diubah suai setelah berada di dalamnya. Pertimbangkan Google Big Query sejenis sistem Pemprosesan Analitikal Dalam Talian (OLAP) untuk data besar. Ia baik untuk laporan ad hoc atau analisis penerokaan.
-
API Ramalan Google: Alat pembelajaran alat berasaskan awan untuk data yang banyak, Ramalan mampu mengenal pasti pola dalam data dan kemudian mengingati mereka. Ia boleh mengetahui lebih lanjut mengenai corak setiap kali ia digunakan. Corak boleh dianalisis untuk pelbagai tujuan, termasuk pengesanan penipuan, analisis churn, dan sentimen pelanggan.
Microsoft Azure untuk data besar
Berdasarkan abstraksi Windows dan SQL, Microsoft telah menghasilkan satu set alat pembangunan, sokongan mesin maya, pengurusan dan perkhidmatan media, dan perkhidmatan peranti mudah alih dalam penawaran PaaS. Bagi pelanggan yang mempunyai kepakaran mendalam dalam. Net, SQLServer, dan Windows, penggunaan PaaS berasaskan Azure adalah mudah.
Untuk menangani keperluan yang muncul untuk menyatukan data besar ke dalam penyelesaian Windows Azure, Microsoft juga telah menambah Windows Azure HDInsight. Dibina pada Platform Data Hortonworks (HDP), yang menurut Microsoft, menawarkan keserasian 100 peratus dengan Apache Hadoop, HDInsight menyokong sambungan dengan Microsoft Excel dan alat perisikan perniagaan (BI) yang lain. Selain Azure HDInsight juga boleh digunakan pada Windows Server.
OpenStack untuk data besar
Dimulakan oleh Rackspace dan NASA, OpenStack sedang melaksanakan platform awan terbuka yang bertujuan sama ada awan awam atau swasta. Walaupun organisasi itu dikendalikan dengan ketat oleh Rackspace, ia berpindah ke asas OpenStack berasingan. Walaupun syarikat boleh memanfaatkan OpenStack untuk mewujudkan pelaksanaan proprietari, penetapan OpenStack memerlukan kesesuaian dengan pelaksanaan standard perkhidmatan.
Matlamat OpenStack adalah untuk menyediakan spesifikasi awan secara besar-besaran, multitenan yang boleh dijalankan pada sebarang perkakasan. OpenStack sedang membina ekosistem rakan kongsi yang berminat untuk mengguna pakai platform awan, termasuk Dell, HP, Intel, Cisco, Red Hat, dan IBM, dan sekurang-kurangnya 100 orang lain yang menggunakan OpenStack sebagai asas untuk tawaran awan mereka.
Pada asasnya, OpenStack merupakan inisiatif open source IaaS yang dibina di Ubuntu, sebuah sistem operasi berdasarkan pengedaran Debian Linux. Ia juga boleh berjalan pada versi Linux Red Hat.
OpenStack menawarkan pelbagai perkhidmatan, termasuk pengiraan, storan objek, katalog dan repositori, papan pemuka, identiti dan rangkaian. Dari segi data besar, Rackspace dan Hortonworks (penyedia platform pengurusan data sumber terbuka berdasarkan Apache Hadoop) mengumumkan bahawa Rackspace akan melepaskan perkhidmatan Hadoop berasaskan awan awam OpenStack, yang akan disahkan dan disokong oleh Hortonworks dan akan membolehkan pelanggan untuk mewujudkan persekitaran data yang lebih pantas.