Rumah Kewangan Peribadi K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

Video: Graph Clustering Algorithms (September 28, 2017) 2024

Video: Graph Clustering Algorithms (September 28, 2017) 2024
Anonim

Pembelajaran tanpa pengawasan mempunyai banyak cabaran untuk analisis ramalan - termasuk tidak mengetahui apa yang diharapkan apabila anda menjalankan algoritma. Setiap algoritma akan menghasilkan hasil yang berbeza; anda tidak akan pasti sama ada satu keputusan adalah lebih baik daripada yang lain - atau sama ada hasilnya adalah apa-apa nilai.

Apabila anda tahu hasilnya, anda boleh tweak algoritma untuk menghasilkan hasil yang diinginkan. Dalam dataset dunia sebenar, anda tidak akan mempunyai kemewahan ini. Anda perlu bergantung kepada beberapa pengetahuan terdahulu tentang data - atau intuisi - untuk menentukan parameter inisialisasi dan algoritma yang digunakan semasa membuat model anda.

Walau bagaimanapun, dalam tugas pembelajaran tanpa pengawasan yang sebenar, pengetahuan terdahulu tidak tersedia dan hasil yang diinginkan sukar dicari. Memilih bilangan kluster yang betul adalah masalah utama. Sekiranya anda tersandung pada bilangan kluster yang betul, data anda akan memberi gambaran yang anda boleh membuat ramalan yang sangat tepat. Di sisi lain, meneka bilangan kluster yang salah boleh menghasilkan hasil yang rendah.

Algoritma K-berarti adalah pilihan yang baik untuk dataset yang mempunyai sejumlah kecil kluster dengan saiz berkadar dan data yang boleh dipisah secara linear - dan anda boleh meningkatkannya menggunakan algoritma pada dataset yang sangat besar.

Fikirkan data secara linear yang boleh dipisahkan sebagai sekumpulan mata dalam graf yang boleh dipisahkan dengan menggunakan garis lurus. Sekiranya data tidak boleh dipisahkan secara linear, maka versi K-means yang lebih canggih perlu digunakan - yang akan menjadi pengkomputeran yang lebih mahal dan mungkin tidak sesuai untuk dataset yang sangat besar. Dalam pelaksanaan standardnya, kerumitan untuk mengira pusat kluster dan jarak adalah rendah.

K-means digunakan secara meluas untuk menyelesaikan masalah data besar kerana ia mudah digunakan, berkesan, dan sangat berskala. Tidak hairanlah kebanyakan vendor komersil menggunakan algoritma K-berarti sebagai komponen utama bagi pakej analisis ramalan mereka.

Pelaksanaan dalam DBSCAN (Clustering Spatial Based Density Based Applications with Noise) dalam scikit-learn tidak memerlukan parameter inisialisasi yang ditetapkan oleh pengguna untuk membuat contoh. Anda boleh menindih parameter lalai semasa permulaan jika anda mahu. Malangnya, jika anda menggunakan parameter lalai, algoritma tidak dapat menyediakan padanan dekat dengan hasil yang diinginkan.

DBSCAN lebih sesuai untuk dataset yang mempunyai saiz cluster yang tidak seimbang, dan datanya boleh dipisahkan dalam cara yang tidak linear.Seperti K-means, DBSCAN adalah berskala, tetapi menggunakannya dalam dataset yang sangat besar memerlukan lebih banyak memori dan kuasa pengkomputeran.

K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...