Rumah Kewangan Peribadi Memvisualkan NoSQL - dummies

Memvisualkan NoSQL - dummies

Isi kandungan:

Video: ETL dan Visualisasi Dashboard E - Commerce Brazil 2024

Video: ETL dan Visualisasi Dashboard E - Commerce Brazil 2024
Anonim

Penyimpanan dan mendapatkan data yang banyak dan melakukan begitu pantas adalah hebat, dan sebaik sahaja anda mempunyai data yang baru diuruskan di NoSQL, anda boleh melakukan perkara yang hebat.

Pengekstrakan dan pengayaan Entiti

Anda boleh menggunakan pencetus pangkalan data, tindakan amaran, dan sistem luaran untuk menganalisis data sumber. Mungkin teks itu kebanyakannya bebas tetapi menyebut subjek yang diketahui. Tindakan pencetus dan amaran ini boleh menyerlahkan teks sebagai Orang atau Pertubuhan, dengan berkesan menandakan kandungan itu sendiri, dan dokumen yang dibentangkan dalamnya.

Contoh yang baik adalah kandungan dalam artikel berita. Anda boleh menggunakan alat seperti Apache Stanbol atau OpenCalais untuk mengenal pasti istilah utama. Alat ini mungkin melihat "Presiden Putin" dan memutuskan ini berkaitan dengan seseorang yang dipanggil Vladimir Putin, yang merupakan Rusia, dan kini presiden Persekutuan Rusia.

Contoh lain termasuk nama penyakit dan ubat, organisasi, topik perbualan, produk yang disebutkan, dan sama ada ulasan positif atau negatif.

Ini adalah semua contoh pengekstrakan entiti (yang merupakan proses secara automatik mengekstrak jenis objek dari nama teks mereka) . Dengan mengenal pasti istilah utama, anda boleh menandai atau membungkusnya dalam elemen XML, yang membantu anda mencari kandungan dengan lebih berkesan.

Pengayaan entiti bermaksud menambahkan maklumat berdasarkan teks asal selain mengenalpastinya. Dalam contoh Putin, anda boleh mengubah perkataan teks kosong "Putin" menjadi Presiden Putin. Sebagai alternatif, anda boleh menghidupkan "London" ke London.

Anda boleh menunjukkan data ini dalam antara muka pengguna sebagai teks yang diserlahkan dengan pautan ke maklumat lanjut mengenai setiap subjek.

Anda boleh menyediakan pengayaan dengan menggunakan carian teks percuma, mengingatkan, pencetus pangkalan data, dan pengintegrasian kepada perisian luaran seperti TEMIS Luxid dan SmartLogic.

Cari dan isyarat

Setelah menyimpan maklumat anda, anda mungkin ingin mencarinya. Carian teks percuma adalah mudah, tetapi setelah melakukan pengekstrakan entiti, anda mempunyai lebih banyak pilihan. Anda boleh mencari secara khusus untuk orang yang bernama "Orange" (seperti dalam William of Orange) dan bukan rekod carian yang menyebut istilah oren - yang sememangnya juga warna dan buah.

Melakukannya menghasilkan carian yang lebih terperinci. Ia juga membolehkan navigasi beralih. Jika anda pergi ke Amazon dan cari Harry Potter, anda akan melihat kategori untuk buku, filem, permainan, dan sebagainya. Kategori produk adalah contoh dari facet , yang menunjukkan kepada anda aspek data dalam hasil carian - iaitu nilai yang paling umum bagi setiap aspek dalam semua hasil carian, walaupun yang bukan pada halaman semasa.

Antara muka pengguna boleh menyokong penerokaan yang kaya ke dalam data (serta pencarian asas Google-esque). Pengguna juga boleh menggunakannya untuk menyimpan dan memuatkan carian sebelumnya.

Anda boleh menyediakan kriteria carian yang disimpan supaya isyarat diaktifkan apabila rekod yang baru ditambahkan sepadan dengan kriteria tersebut. Jadi, jika rekod baru tiba yang sepadan dengan kriteria carian anda, tindakan berlaku. Mungkin "Putin" menjadi Putin

Tidak semua enjin carian mampu membuat setiap kata laluan menjadi amaran. Ada yang terhad kepada medan teks; yang lain tidak boleh melakukan kriteria geospatial. Pastikan anda boleh mengendalikan amaran yang perlu anda konfigurasikan.

Fungsi agregat

Sebaik sahaja anda mencari maklumat yang relevan, anda mungkin ingin menggali lebih mendalam. Bergantung pada sumber, anda mungkin bertanya berapa banyak negara mempunyai KDNK yang melebihi $ 400 bilion, atau berapa umur purata semua ahli dalam pokok keluarga anda, atau di mana gigitan ular yang paling banyak berlaku di Australia. Contoh-contoh ini menggambarkan bagaimana analitinya dilakukan dalam satu set hasil carian. Ini adalah kiraan, purata rata-rata, dan pengiraan peta haba geospatial.

Mampu membuat pengiraan seperti di sebelah data menawarkan beberapa kelebihan. Kelebihan pertama ialah anda boleh menggunakan indeks untuk mempercepatkan perkara. Kedua, indeks ini cenderung di-cache dalam memori, menjadikannya lebih cepat. Ketiga, dalam indeks memori sangat berguna untuk pangkalan data NoSQL menggunakan penyimpanan Sistem Hadoop File (HDFS). HDFS tidak melakukan pengindeksan asli atau kedai lajur dalam memori untuk pengiraan agregasi cepat itu sendiri - ia memerlukan pangkalan data NoSQL di atas untuk melakukan ini.

Navigasi facetted adalah contoh agregasi berdasarkan kiraan ke atas hasil carian yang dipaparkan dalam antara muka pengguna. Perkara yang sama berlaku untuk garis masa yang menunjukkan bilangan rekod yang menyebutkan titik tertentu dalam masa. Sebagai contoh, adakah anda ingin menunjukkan hasil dari tahun ini, bulan ini, atau jam ini?

Jika anda mahukan fungsi ini, pastikan pangkalan data anda mempunyai keupayaan untuk mengira agregat dengan cekap di sebelah data. Kebanyakan pangkalan data NoSQL lakukan, tetapi ada yang tidak.

Penandaan dan kecerdasan perniagaan

Sambungan antara muka pengguna yang jelas sekali lagi melibatkan pencatatan dan melihat ringkasan jadual untuk maklumat pengurusan hidup dan analisis risikan perniagaan sejarah.

Kebanyakan pangkalan data NoSQL menyediakan REST API yang mudah diintegrasikan di dalam pangkalan data mereka. Ini bermakna anda boleh memalam dalam pelbagai tier aplikasi, atau bahkan menyambung aplikasi JavaScript secara langsung ke pangkalan data ini. Pelbagai perpustakaan carta yang sangat baik tersedia untuk JavaScript. Anda juga boleh menggunakan Ecosystem R untuk membuat carta berdasarkan data yang disimpan dalam pangkalan data ini, setelah memasang penyambung pangkalan data yang sesuai.

Beberapa pangkalan data NoSQL bahkan menyediakan pemalam pangkalan data hubungan ODBC atau JDBC. Mewujudkan indeks dalam rekod yang diberikan dan memperlihatkannya sebagai pandangan-pandangan adalah cara yang kemas untuk menjadikan data yang tidak tersusun dalam pangkalan data dokumen NoSQL ke dalam data yang boleh dianalisis dengan alat perisikan perniagaan.

Periksa sama ada vendor pangkalan data NoSQL anda menyediakan alat visualisasi atau mempunyai rakan kongsi perniagaan dengan alat daripada boleh menyambung ke pangkalan data ini. Alat-alat yang bergaya termasuk Tableau Server, yang merupakan pelayan-intelek perniagaan yang dikongsi bersama moden yang menyokong penerbitan laporan interaktif melalui data dalam pelbagai pangkalan data, termasuk pangkalan data NoSQL.

Memvisualkan NoSQL - dummies

Pilihan Editor

Cara Laporkan Spam ke Enjin Carian Utama - patung

Cara Laporkan Spam ke Enjin Carian Utama - patung

Dunia pengoptimuman enjin carian adalah tempat yang lebih baik, dan pencari di seluruh dunia mendapat hasil yang lebih baik. Melawan spam adalah keutamaan untuk enjin carian, dan anda harus melaporkannya apabila anda melihatnya. Semua enjin carian utama - Google, Yahoo! , Carian Microsoft Live, dan Tanya. com - ...

Bagaimana Mengenali Spam Search Engine - dummies

Bagaimana Mengenali Spam Search Engine - dummies

Spam adalah percubaan untuk menipu enjin carian ke peringkat laman web apabila ia tidak layak untuk disenaraikan. Jenis spam termasuk teks tersembunyi dan pautan, halaman pintu masuk, pengalihan menipu, cloaking, kata kunci yang tidak berkaitan, pemadat kata kunci dan ladang pautan. Teks tersembunyi / pautan Salah satu cara yang lebih jelas untuk spam laman web ...

Pilihan Editor

Menggunakan Data Sendiri Organisasi untuk Perlombongan Data - dummies

Menggunakan Data Sendiri Organisasi untuk Perlombongan Data - dummies

Penambang data tidak mempunyai apa-apa tanpa data. Dan jika anda bekerja dalam organisasi besar, anda akan mempunyai beratus-ratus, mungkin beribu-ribu sumber data yang sedia ada yang berpotensi tersedia untuk perlombongan data. Setiap aktiviti menghasilkan rekod, dan rekod tersebut boleh menjadi bahan mentah anda. Jadual menunjukkan pelbagai data yang biasa dikumpulkan dalam beberapa perniagaan ...

Memvisualkan NoSQL - dummies

Memvisualkan NoSQL - dummies

Menyimpan dan mengambil semula data yang banyak dan melakukan begitu pantas, dan sekali anda mempunyai data yang baru diurus dalam NoSQL, anda boleh melakukan perkara yang hebat. Pengekstraksi dan pengayaan entiti Anda boleh menggunakan pencetus pangkalan data, tindakan amaran, dan sistem luaran untuk menganalisis data sumber. Mungkin teks itu kebanyakannya bebas tetapi menyebut subjek yang diketahui. ...

Membina Laman Utama Airbnb untuk Amalan Bootstrap - dummies

Membina Laman Utama Airbnb untuk Amalan Bootstrap - dummies

Praktik Bootstrap dalam talian menggunakan laman web Codecademy. Codecademy adalah laman web percuma yang dicipta pada tahun 2011 untuk membolehkan sesiapa sahaja belajar cara mengodkan hak dalam pelayar tanpa memasang atau memuat turun sebarang perisian. Tag amalan dengan mengikuti langkah-langkah berikut: Pergi ke Dummies. com Coding All-in-One halaman, dan klik pautan ke Codecademy. Jika anda mempunyai ...

Pilihan Editor

Menetapkan Mod Pendedahan Lanjutan pada DSLR Nikon - dummies

Menetapkan Mod Pendedahan Lanjutan pada DSLR Nikon - dummies

Dalam mod penangkapan automatik yang tersedia untuk anda pada Nikon D3100, D5100, atau D7000 anda mempunyai kawalan yang sangat sedikit terhadap pendedahan. Anda boleh memilih dari satu atau dua mod Flash, dan anda boleh melaraskan ISO dalam mod Pemandangan. Tetapi untuk mendapatkan kawalan penuh ke atas pendedahan, tetapkan Mod mod ...

Menetapkan Mod Pelepasan pada Nikon D3400 - dummies

Menetapkan Mod Pelepasan pada Nikon D3400 - dummies

Dengan menggunakan tetapan Mod Rilis pada Nikon D3400 , anda menetapkan kamera sama ada untuk menangkap imej tunggal setiap kali anda menekan butang pengatup (mod Single Frame); untuk merakam pecah foto selagi anda menahan butang pengatup (Mod berterusan); atau untuk menunda pengambilan gambar sehingga ...