Isi kandungan:
Video: ETL dan Visualisasi Dashboard E - Commerce Brazil 2024
Penyimpanan dan mendapatkan data yang banyak dan melakukan begitu pantas adalah hebat, dan sebaik sahaja anda mempunyai data yang baru diuruskan di NoSQL, anda boleh melakukan perkara yang hebat.
Pengekstrakan dan pengayaan Entiti
Anda boleh menggunakan pencetus pangkalan data, tindakan amaran, dan sistem luaran untuk menganalisis data sumber. Mungkin teks itu kebanyakannya bebas tetapi menyebut subjek yang diketahui. Tindakan pencetus dan amaran ini boleh menyerlahkan teks sebagai Orang atau Pertubuhan, dengan berkesan menandakan kandungan itu sendiri, dan dokumen yang dibentangkan dalamnya.
Contoh yang baik adalah kandungan dalam artikel berita. Anda boleh menggunakan alat seperti Apache Stanbol atau OpenCalais untuk mengenal pasti istilah utama. Alat ini mungkin melihat "Presiden Putin" dan memutuskan ini berkaitan dengan seseorang yang dipanggil Vladimir Putin, yang merupakan Rusia, dan kini presiden Persekutuan Rusia.
Contoh lain termasuk nama penyakit dan ubat, organisasi, topik perbualan, produk yang disebutkan, dan sama ada ulasan positif atau negatif.
Ini adalah semua contoh pengekstrakan entiti (yang merupakan proses secara automatik mengekstrak jenis objek dari nama teks mereka) . Dengan mengenal pasti istilah utama, anda boleh menandai atau membungkusnya dalam elemen XML, yang membantu anda mencari kandungan dengan lebih berkesan.
Pengayaan entiti bermaksud menambahkan maklumat berdasarkan teks asal selain mengenalpastinya. Dalam contoh Putin, anda boleh mengubah perkataan teks kosong "Putin" menjadi Presiden Putin. Sebagai alternatif, anda boleh menghidupkan "London" ke London.
Anda boleh menunjukkan data ini dalam antara muka pengguna sebagai teks yang diserlahkan dengan pautan ke maklumat lanjut mengenai setiap subjek.
Anda boleh menyediakan pengayaan dengan menggunakan carian teks percuma, mengingatkan, pencetus pangkalan data, dan pengintegrasian kepada perisian luaran seperti TEMIS Luxid dan SmartLogic.
Cari dan isyarat
Setelah menyimpan maklumat anda, anda mungkin ingin mencarinya. Carian teks percuma adalah mudah, tetapi setelah melakukan pengekstrakan entiti, anda mempunyai lebih banyak pilihan. Anda boleh mencari secara khusus untuk orang yang bernama "Orange" (seperti dalam William of Orange) dan bukan rekod carian yang menyebut istilah oren - yang sememangnya juga warna dan buah.
Melakukannya menghasilkan carian yang lebih terperinci. Ia juga membolehkan navigasi beralih. Jika anda pergi ke Amazon dan cari Harry Potter, anda akan melihat kategori untuk buku, filem, permainan, dan sebagainya. Kategori produk adalah contoh dari facet , yang menunjukkan kepada anda aspek data dalam hasil carian - iaitu nilai yang paling umum bagi setiap aspek dalam semua hasil carian, walaupun yang bukan pada halaman semasa.
Antara muka pengguna boleh menyokong penerokaan yang kaya ke dalam data (serta pencarian asas Google-esque). Pengguna juga boleh menggunakannya untuk menyimpan dan memuatkan carian sebelumnya.
Anda boleh menyediakan kriteria carian yang disimpan supaya isyarat diaktifkan apabila rekod yang baru ditambahkan sepadan dengan kriteria tersebut. Jadi, jika rekod baru tiba yang sepadan dengan kriteria carian anda, tindakan berlaku. Mungkin "Putin" menjadi Putin
Tidak semua enjin carian mampu membuat setiap kata laluan menjadi amaran. Ada yang terhad kepada medan teks; yang lain tidak boleh melakukan kriteria geospatial. Pastikan anda boleh mengendalikan amaran yang perlu anda konfigurasikan.
Fungsi agregat
Sebaik sahaja anda mencari maklumat yang relevan, anda mungkin ingin menggali lebih mendalam. Bergantung pada sumber, anda mungkin bertanya berapa banyak negara mempunyai KDNK yang melebihi $ 400 bilion, atau berapa umur purata semua ahli dalam pokok keluarga anda, atau di mana gigitan ular yang paling banyak berlaku di Australia. Contoh-contoh ini menggambarkan bagaimana analitinya dilakukan dalam satu set hasil carian. Ini adalah kiraan, purata rata-rata, dan pengiraan peta haba geospatial.
Mampu membuat pengiraan seperti di sebelah data menawarkan beberapa kelebihan. Kelebihan pertama ialah anda boleh menggunakan indeks untuk mempercepatkan perkara. Kedua, indeks ini cenderung di-cache dalam memori, menjadikannya lebih cepat. Ketiga, dalam indeks memori sangat berguna untuk pangkalan data NoSQL menggunakan penyimpanan Sistem Hadoop File (HDFS). HDFS tidak melakukan pengindeksan asli atau kedai lajur dalam memori untuk pengiraan agregasi cepat itu sendiri - ia memerlukan pangkalan data NoSQL di atas untuk melakukan ini.
Navigasi facetted adalah contoh agregasi berdasarkan kiraan ke atas hasil carian yang dipaparkan dalam antara muka pengguna. Perkara yang sama berlaku untuk garis masa yang menunjukkan bilangan rekod yang menyebutkan titik tertentu dalam masa. Sebagai contoh, adakah anda ingin menunjukkan hasil dari tahun ini, bulan ini, atau jam ini?
Jika anda mahukan fungsi ini, pastikan pangkalan data anda mempunyai keupayaan untuk mengira agregat dengan cekap di sebelah data. Kebanyakan pangkalan data NoSQL lakukan, tetapi ada yang tidak.
Penandaan dan kecerdasan perniagaan
Sambungan antara muka pengguna yang jelas sekali lagi melibatkan pencatatan dan melihat ringkasan jadual untuk maklumat pengurusan hidup dan analisis risikan perniagaan sejarah.
Kebanyakan pangkalan data NoSQL menyediakan REST API yang mudah diintegrasikan di dalam pangkalan data mereka. Ini bermakna anda boleh memalam dalam pelbagai tier aplikasi, atau bahkan menyambung aplikasi JavaScript secara langsung ke pangkalan data ini. Pelbagai perpustakaan carta yang sangat baik tersedia untuk JavaScript. Anda juga boleh menggunakan Ecosystem R untuk membuat carta berdasarkan data yang disimpan dalam pangkalan data ini, setelah memasang penyambung pangkalan data yang sesuai.
Beberapa pangkalan data NoSQL bahkan menyediakan pemalam pangkalan data hubungan ODBC atau JDBC. Mewujudkan indeks dalam rekod yang diberikan dan memperlihatkannya sebagai pandangan-pandangan adalah cara yang kemas untuk menjadikan data yang tidak tersusun dalam pangkalan data dokumen NoSQL ke dalam data yang boleh dianalisis dengan alat perisikan perniagaan.
Periksa sama ada vendor pangkalan data NoSQL anda menyediakan alat visualisasi atau mempunyai rakan kongsi perniagaan dengan alat daripada boleh menyambung ke pangkalan data ini. Alat-alat yang bergaya termasuk Tableau Server, yang merupakan pelayan-intelek perniagaan yang dikongsi bersama moden yang menyokong penerbitan laporan interaktif melalui data dalam pelbagai pangkalan data, termasuk pangkalan data NoSQL.