Fasa 5 Model Proses CRISP-DM: Evaluasi - patung
Dalam empat fasa Model Proses Perindustrian Standard untuk Model Perlombongan Data (CRISP-DM), anda telah meneroka data dan anda telah menemui corak, dan kini anda perlu bertanya: Adakah hasilnya bagus? Anda akan menilai bukan hanya model yang anda buat tetapi juga proses yang anda gunakan untuk menghasilkannya, dan potensi mereka ...
NoSQL Terms and Definitions - dummies
Mendapatkan kepala anda di sekitar NoSQL boleh agak sukar. Jika anda mempelajari pangkalan data di sekolah, anda mungkin telah diindoktrinasi dalam cara pemikiran yang relasional. Katakan pangkalan data kepada kebanyakan orang, dan mereka fikir sistem pengurusan pangkalan data relasi. Ini adalah semulajadi kerana selama 30 tahun yang lalu, RDBMS telah begitu dominan. Untuk ...
NoSQL For Dummies Cheat Sheet - dummies
Sebagai pemaju NoSQL, memilih kategori produk yang tepat dan produk yang tepat adalah langkah pertama. Panduan ini membandingkan ciri-ciri yang paling penting dalam beberapa pangkalan data NoSQL yang paling popular.
Untuk Memastikan Tadbir Urus Data Besar - dummies
Dengan cabaran tadbir urus yang dibentangkan oleh data besar, adalah bijak dan mutlak perlu mempunyai amalan untuk memastikan bahawa anda melindungi maklumat anda. Walaupun tahap yang anda lakukan ini berbeza-beza bergantung kepada perniagaan anda, pastikan anda mengambil langkah berjaga-jaga yang diperlukan. Audit proses data besar anda Di ...
Meletakkan Asas Pemodelan Maklumat Bangunan di Place - dummies
Tetapi mendapat hak fundamental adalah semua dalam penyediaan. BIM membolehkan anda membuat proses dan alur kerja baru dan bekerja secara kolaboratif dengan projek anda. BIM berguna sepanjang tempoh projek keseluruhan dari peringkat konsep, pembinaan, dan seterusnya ...
Meletakkan Data Big Anda Bersama - dummies
Bagaimana anda akan tahu bagaimana untuk meletakkan semua data anda bersama? Dengan projek data besar, apa yang anda ingin lakukan dengan data terstruktur dan tidak tersirat ini menunjukkan mengapa anda boleh memilih satu teknologi daripada yang lain. Ia juga menentukan keperluan untuk memahami struktur data masuk untuk meletakkan data ini ...
Fasa 6 Model Proses CRISP-DM: Penyebaran - dummies
Di mana data perlombongan membayar balik. Pada fasa terakhir proses Standard Industri Cross-Industry untuk Data Mining (CRISP-DM), tidak kira betapa cemerlangnya penemuan anda, atau seberapa sempurna model anda sesuai dengan data, jika anda tidak menggunakannya perkara untuk memperbaiki cara anda menjalankan perniagaan. Penyebaran ...
Fasa 4 Model Proses CRISP-DM: Modeling - dummies
Model Proses Perindustrian Standard Cross-Industry untuk Data Perlombongan (CRISP-DM) yang paling banyak pelombong data seperti yang terbaik. Data anda sudah dalam keadaan baik, dan sekarang anda boleh mencari corak yang berguna dalam data anda. Fasa pemodelan merangkumi empat tugas. Ini adalah memilih teknik pemodelan Merancang ujian (s) Model bangunan (s) Menilai ...
Fasa 1 Model Proses CRISP-DM: Pengertian Perniagaan - dummies
-Proses Standard Industri untuk Perlombongan Data (CRISP-DM) adalah kerangka proses dominan untuk perlombongan data. Dalam fasa pertama projek penambangan data, sebelum anda mendekati data atau alat, anda menentukan apa yang anda lakukan untuk mencapai da
Meletakkan Struktur Organisasi Data Big Hak di Tempat - orang biasa
Data dengan memulakan dengan eksperimen organisasi untuk melihat sama ada data besar boleh memainkan peranan penting dalam menentukan dan memberi kesan kepada strategi perniagaan. Walau bagaimanapun, selepas menjadi jelas bahawa data besar akan mempunyai peranan strategik sebagai sebahagian daripada persekitaran pengurusan maklumat, anda perlu memastikan ...
Fasa 2 Model Proses CRISP-DM: Memahami Data - dummies
Dalam fasa kedua Model Proses Perindustrian Data Perindustrian (CRISP-DM), anda memperoleh data dan mengesahkan bahawa ia sesuai untuk keperluan anda. Anda mungkin mengenal pasti isu yang menyebabkan anda kembali ke pemahaman perniagaan dan menyemak semula pelan anda. Anda juga mungkin mendapati kekurangan dalam pemahaman perniagaan anda, satu lagi sebab untuk ...
Mengurangkan Masa untuk Nilai dalam NoSQL - dummies
Masa untuk menilai adalah jumlah masa yang diperlukan untuk memulakan projek IT untuk dapat merealisasikan manfaat perniagaan. Ini boleh menjadi manfaat nyata dalam pengurangan kos atau keupayaan untuk berurus niaga baru, atau faedah tidak ketara seperti menyediakan perkhidmatan atau produk pelanggan yang lebih baik. Kedai nilai-kunci adalah pangkalan data NoSQL yang paling mudah berkaitan dengan ...
Menyelidik Data Sendiri - dummies
Sekarang bahawa anda adalah penambang data, anda juga seorang penyelidik utama. Bunyi lebih saintifik, bukan? Penyelidikan anda adalah utama kerana anda akan bermula dari data mentah (asas, tidak diproses) dan menganalisisnya untuk menambah sesuatu yang baru kepada pengetahuan dunia. Anda mungkin juga mengintegrasikan beberapa penyelidikan menengah ke dalam kerja anda. Dengan kata lain, anda akan ...
Kawalan Akses berasaskan peranan dalam NoSQL - dummies
Salah satu kaedah yang paling biasa dalam mendapatkan data dalam NoSQL adalah untuk memberikan setiap rekod (atau dokumen atau graf, bergantung kepada jenis pangkalan data anda) dengan satu set kebenaran yang berkaitan dengan peranan. Ini adalah kawalan akses berasaskan peranan, atau RBAC untuk jangka pendek. Pertimbangkan pelepasan berita untuk laman web yang sedang disimpan di ...
Scaling NoSQL - dummies
Satu ciri umum sistem NoSQL adalah kemampuan mereka untuk merentasi banyak pelayan komoditi. Platform yang agak murah ini bermakna anda boleh meningkatkan pangkalan data dengan menambahkan pelayan baru dan bukan mengganti perkakasan lama dengan perkakasan baru yang lebih kuat dalam satu pukulan. Terdapat banyak kes penggunaan yang dapat memaksa anda ...
Spreadsheet, XML, dan Format Data Khas - dummies
Anda mungkin perlu menggunakan data yang ada dalam spreadsheet , XML (bahasa markup extensible), atau mana-mana berpuluh-puluh format kurang biasa. Persoalan utama akan selalu: Adakah data import permohonan data perlombongan anda dalam format itu? Selagi aplikasi penambangan data anda mempunyai alat untuk membaca format data yang anda perlukan, proses ...
Tetapkan Yayasan Kanan untuk Big Data - dummies
Jadi, bagaimana anda memulakan perjalanan anda untuk membuat persekitaran yang betul supaya anda bersedia untuk kedua-duanya bereksperimen dengan data besar dan bersedia untuk memperluaskan penggunaan data besar apabila anda siap? Adakah anda perlu melabur dalam teknologi baru untuk pusat data anda? Bolehkah anda memanfaatkan awan ...
Keselamatan Pertimbangan dengan Big Data - dummies
Manakala syarikat sangat prihatin terhadap keselamatan dan pentadbiran data mereka pada umumnya, inisiatif data besar datang dengan kerumitan tertentu dan isu-isu yang tidak diduga yang banyak syarikat tidak bersedia untuk menangani. Sering kali analisis data besar dijalankan dengan pelbagai sumber data yang mungkin datang dari banyak sumber yang tidak terkira. Selain itu, anda ...
Simulasi Menggunakan Mesin Abstrak dengan Algoritma - dummies
Semakin banyak operasi yang memerlukan algoritma, semakin kompleksnya. Kompleksiti adalah ukuran kecekapan algoritma dari segi penggunaan masa kerana setiap operasi mengambil sedikit masa. Memandangkan masalah yang sama, algoritma kompleks umumnya tidak menggalakkan daripada algoritma mudah kerana algoritma kompleks memerlukan lebih banyak masa. Fikirkan tentang masa-masa ketika kelajuan ...
Menyaring Data yang Anda Perlukan - dummies
Ketika Anda adalah penambangan data, kadangkala Anda akan memiliki lebih banyak data daripada anda perlukan projek yang diberikan. Berikut adalah cara untuk mengurangkan apa yang anda perlukan. Menyempitkan medan Apabila anda mempunyai banyak pemboleh ubah dalam dataset, sukar untuk mencari atau melihat orang yang menarik minat anda. Dan jika dataset anda ...
Mengapa Penyusun Data Penting untuk Algoritma - dummies
Bayangkan cuba mencari item dalam senarai tanpa menyusunnya pertama. Setiap carian menjadi carian berturut-turut yang memakan masa. Tetapi, satu kes boleh dibuat kerana tidak menyusun data untuk algoritma. Lagipun, data masih boleh diakses, walaupun anda tidak menyusunnya - dan penyortiran mengambil masa. Sudah tentu, masalah dengan ...
Store Big Data dengan HBase - dummies
HBase adalah pangkalan data yang tidak diedar (kolumnar) yang menggunakan HDFS sebagai kegigihannya menyimpan untuk projek data besar. Ia dimodelkan selepas Google BigTable dan mampu menganjurkan meja yang sangat besar (berbilion tiang / baris) kerana ia berlapis pada cluster Hadoop perkakasan komoditi. HBase menyediakan akses baca / tulis secara rawak, masa nyata kepada data besar. HBase ...
Streaming Algoritma dan Penapis Kembang - patung
Di tengah-tengah banyak algoritma penstriman adalah penapis Bloom. Dicipta hampir 50 tahun yang lalu oleh Burton H. Bloom, ketika sains komputer masih muda, maksud asal pencipta algoritma ini adalah untuk perdagangan ruang (memori) dan / atau masa (kerumitan) terhadap apa yang dipanggilnya kesalahan yang dibenarkan. Kertas asalnya bertajuk ...
Menyimpan Data dalam Bigtables - dummies
Bigtable mempunyai jadual seperti RDBMS, tetapi tidak seperti RDBMS, umumnya tidak mempunyai hubungan dengan jadual lain. Sebaliknya, data kompleks dikumpulkan ke dalam satu jadual. Jadual dalam Bigtable terdiri daripada kumpulan lajur, yang dikenali sebagai keluarga lajur, dan kunci baris. Ini bersama-sama membolehkan carian cepat ...
Aliran aliran - dummies
Apabila data mengalir dalam jumlah yang besar, menyimpan semuanya mungkin sukar atau bahkan mustahil. Malah, menyimpan semuanya mungkin tidak berguna. Berikut ialah beberapa angka yang hanya boleh dijangka berlaku dalam satu minit di Internet: 150 juta e-mel menghantar 350,000 tweet baru dihantar ...
Penstrukturan Data untuk Mendapatkan Penyelesaian - monyet
Manusia memikirkan data dalam cara yang tidak spesifik dan menggunakan pelbagai peraturan untuk sama data untuk memahami dengan cara yang komputer tidak boleh. Pandangan data komputer adalah berstruktur, mudah, tidak kompromi, dan paling pasti tidak kreatif. Apabila manusia menyediakan data untuk komputer untuk digunakan, data sering berinteraksi dengan algoritma ...
Mengambil Kelebihan Flash Storage di NoSQL - dummies
Ketika anda memerlukan menulis yang sangat cepat, penyimpanan flash dipanggil untuk (bertentangan dengan memanggil Flash Gordon). Ini datang dengan kos menggunakan ruang RAM, sudah tentu. Menulis ke RAM akan membawa anda, dengan baik, sejauh sejauh RAM anda. Jadi mempunyai pilihan storan sangat laju segera di belakang ...
Berbincang Data Perlombongan dengan Eksekutif - monyet
Anda tidak masuk ke pertambangan data hanya untuk bersenang-senang bermain dengan nombor . Anda mahu tindakan. Anda ingin melihat perkara yang dilakukan dengan betul, dan anda memahami bahawa penting untuk membuat keputusan perniagaan berdasarkan bukti kukuh dari data. Tetapi anda bukan orang yang berkuasa untuk membuat keputusan. Jadi anda perlu ...
Ekonomi Big Data - dummies
Cara terbaik untuk memahami ekonomi data besar adalah melihat pelbagai kaedah untuk meletakkan data besar untuk berfungsi untuk organisasi anda. Walaupun kos khusus mungkin berbeza-beza kerana saiz organisasi anda, kuasa beli, hubungan vendor, dan sebagainya, kelas perbelanjaan adalah agak konsisten. Data besar ...
Cabaran Tadbir Urus Data Big - dummies
Tadbir urus data adalah penting kepada syarikat anda tidak kira apa sumber data besar anda atau bagaimana ia diuruskan. Di dalam dunia tradisional gudang data atau pengurusan pangkalan data hubungan, kemungkinan besar syarikat anda memahami peraturan tentang bagaimana data perlu dilindungi. Sebagai contoh, dalam dunia penjagaan kesihatan, ia adalah ...
Portal Data Persekutuan: Data. gov - dummies
Jika anda mencari data yang mungkin ada di kerajaan persekutuan, tetapi anda tidak pasti agensi mana yang terlibat, mulailah carian anda di portal data persekutuan. Di sana anda akan menemui katalog data yang boleh dicari dari semua agensi persekutuan. Anda boleh mencari dataset dengan kata kunci dan mendapatkan maklumat tentang apa yang tersedia, sumber ...
Batasan Survei untuk Data Mining - dummies
Walaupun banyak aspek penyelidikan survei yang diinginkan, batasan. Sukar untuk mendapatkan data yang baik apabila subjek adalah orang, tidak kira bagaimana anda pergi mengenainya. Malah penyelidik saintifik, yang berusaha untuk menjalankan kajian terkawal, tidak dapat mengawal keadaan eksperimen dengan subjek manusia seperti yang dilakukannya dengan haiwan makmal. Mencapai ...
Sepuluh Big Data Do and Don'ts - dummies
Banyak syarikat yang memulakan penjelajahan data besar mereka berada di peringkat awal pelaksanaan. Pertimbangkan perkara ini dan tidak boleh dilakukan sebagai sebahagian daripada strategi anda. Kebanyakan syarikat bereksperimen dengan juruterbang untuk melihat sama ada mereka boleh memanfaatkan sumber data besar untuk mengubah keputusan membuat keputusan. Mudah untuk membuat kesilapan yang boleh menyebabkan ...
Triple Store and Graph Ciri-ciri Pangkalan Data NoSQL - dummies
Anda boleh menggunakan pangkalan data tiga atau grafik NoSQL database jika anda mempunyai web data yang saling berkaitan, atau anda boleh menandakan data anda dan merujuk perhubungan mengikut rekod yang berkongsi tag yang sama. Produk pangkalan data ini menyokong ciri-ciri penting ini. Ciri-ciri AllegroGraph Server MarkLogic Neo4j OrientDB ACID atau BASE ACID, ...
Memahami Data Besar dan Internet Perkara - patologi
Bagaimana Internet of Things berkaitan dengan data besar ? Internet of Things menggambarkan fakta bahawa banyak objek sehari-hari, dari lampin ke kereta memandu sendiri, mempunyai (atau tidak lama lagi akan mempunyai) keupayaan untuk menghantar dan menerima data melalui Internet. Anda boleh mengetahui lebih lanjut mengenai Internet Perkara dan letupan ...
Masa untuk Data Big - dummies
Pertimbangan utama ketika melakukan suatu projek besar data adalah jumlah yang diproyeksikan masa dan bukan masa nyata yang diperlukan untuk melaksanakan inisiatif anda. Data besar sering melakukan perkara-perkara yang tidak mungkin kerana teknologi itu tidak mencukupi atau kosnya mahal. Perubahan besar yang berlaku dengan data besar adalah keupayaan ...
Orang yang terlibat dalam Perlombongan Data - dummies
Sebagai penambang data, tempat Anda dalam carta organisasi mungkin berada di kumpulan khas yang ditumpukan kepada analisis, atau dalam mana-mana unit perniagaan konvensional. Tidak kira di mana anda diletakkan, sama ada anda sedang melabur dalam perlombongan data atau membuat kerja sepenuh masa, anda akan menjadi lebih produktif jika anda sudah biasa dengan peranan ...
Triple dan Kedai Grafik di NoSQL - dummies
Walaupun sekarang kini menjadi terkenal, sejak tahun 1998, terima kasih kepada World Wide Web Consortium (W3C) dan Sir Tim Berners-Lee. jika anda berpengalaman dengan LinkedIn atau Facebook, anda mungkin biasa dengan istilah graf sosial. Di bawah kepimpinan pendekatan ini adalah konsep yang mudah: setiap fakta (atau ...