Rumah Kewangan Peribadi K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

Video: Graph Clustering Algorithms (September 28, 2017) 2024

Video: Graph Clustering Algorithms (September 28, 2017) 2024
Anonim

Pembelajaran tanpa pengawasan mempunyai banyak cabaran untuk analisis ramalan - termasuk tidak mengetahui apa yang diharapkan apabila anda menjalankan algoritma. Setiap algoritma akan menghasilkan hasil yang berbeza; anda tidak akan pasti sama ada satu keputusan adalah lebih baik daripada yang lain - atau sama ada hasilnya adalah apa-apa nilai.

Apabila anda tahu hasilnya, anda boleh tweak algoritma untuk menghasilkan hasil yang diinginkan. Dalam dataset dunia sebenar, anda tidak akan mempunyai kemewahan ini. Anda perlu bergantung kepada beberapa pengetahuan terdahulu tentang data - atau intuisi - untuk menentukan parameter inisialisasi dan algoritma yang digunakan semasa membuat model anda.

Walau bagaimanapun, dalam tugas pembelajaran tanpa pengawasan yang sebenar, pengetahuan terdahulu tidak tersedia dan hasil yang diinginkan sukar dicari. Memilih bilangan kluster yang betul adalah masalah utama. Sekiranya anda tersandung pada bilangan kluster yang betul, data anda akan memberi gambaran yang anda boleh membuat ramalan yang sangat tepat. Di sisi lain, meneka bilangan kluster yang salah boleh menghasilkan hasil yang rendah.

Algoritma K-berarti adalah pilihan yang baik untuk dataset yang mempunyai sejumlah kecil kluster dengan saiz berkadar dan data yang boleh dipisah secara linear - dan anda boleh meningkatkannya menggunakan algoritma pada dataset yang sangat besar.

Fikirkan data secara linear yang boleh dipisahkan sebagai sekumpulan mata dalam graf yang boleh dipisahkan dengan menggunakan garis lurus. Sekiranya data tidak boleh dipisahkan secara linear, maka versi K-means yang lebih canggih perlu digunakan - yang akan menjadi pengkomputeran yang lebih mahal dan mungkin tidak sesuai untuk dataset yang sangat besar. Dalam pelaksanaan standardnya, kerumitan untuk mengira pusat kluster dan jarak adalah rendah.

K-means digunakan secara meluas untuk menyelesaikan masalah data besar kerana ia mudah digunakan, berkesan, dan sangat berskala. Tidak hairanlah kebanyakan vendor komersil menggunakan algoritma K-berarti sebagai komponen utama bagi pakej analisis ramalan mereka.

Pelaksanaan dalam DBSCAN (Clustering Spatial Based Density Based Applications with Noise) dalam scikit-learn tidak memerlukan parameter inisialisasi yang ditetapkan oleh pengguna untuk membuat contoh. Anda boleh menindih parameter lalai semasa permulaan jika anda mahu. Malangnya, jika anda menggunakan parameter lalai, algoritma tidak dapat menyediakan padanan dekat dengan hasil yang diinginkan.

DBSCAN lebih sesuai untuk dataset yang mempunyai saiz cluster yang tidak seimbang, dan datanya boleh dipisahkan dalam cara yang tidak linear.Seperti K-means, DBSCAN adalah berskala, tetapi menggunakannya dalam dataset yang sangat besar memerlukan lebih banyak memori dan kuasa pengkomputeran.

K-Means dan Model Clustering DBSCAN untuk Analisis Prediktif - dummies

Pilihan Editor

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Kotak dan Sempadan Sifat Cascading Style Sheets (CSS) - dummies

Sifat kotak, anda boleh meletakkan objek gaya di mana saja di dalam tetingkap penyemak imbas, objek kedudukan berbanding dengan objek lain pada halaman, dan gunakan peraturan gaya padding dan margin kotak secara selektif untuk mana-mana atau semua empat objek gaya sebagai kiri dan bawah atau atas, kiri, dan ...

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Mengira Kadar Terbuka untuk Kempen Pemasaran E-Mail Anda - dummies

Kadar adalah salah satu istilah pemasaran yang paling mengelirukan dari e-mel. Ia sebenarnya mengukur bilangan interaksi tertentu dengan pelayan e-mel selepas e-mel dihantar dinyatakan sebagai peratusan jumlah tidak melantun. E-mel anda tidak dikira sebagai terbuka sehingga salah satu daripada interaksi berikut berlaku: Penerima membolehkan imej ...

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress For Dummies Cheat Sheet - dummies

BuddyPress adalah perisian bebas sumber terbuka yang dapat anda unduh, memasang, dan gunakan untuk membina komuniti sosial anda sendiri di laman web anda yang berkuasa WordPress. Untuk melakukan ini, anda memerlukan pemahaman asas tentang ciri dan terminologi BuddyPress. Mencipta komuniti sosial anda sendiri mudah dilakukan dengan BuddyPress, tetapi jika anda memerlukan bantuan, anda boleh bertanya ...

Pilihan Editor

Menikmati Magic of Mindful Movies - dummies

Menikmati Magic of Mindful Movies - dummies

Tidak ada cara yang lebih baik untuk mengembangkan pengalaman pemikiran anda melampaui batas fizikal United Kingdom dan mengembangkan wawasan anda daripada menikmati filem yang cenderung berfikiran. Filem untuk kanak-kanak: Kung Fu Panda (Mark Osborne, John Stevenson, 2008). Filem animasi moden ini sering merujuk kepada kuasa yang datang dari ...

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Memperluaskan Kesedaran Anda dengan Mendengarkan CD - manisan

Kadang-kadang, hanya apa yang anda perlukan untuk pengalaman pemikiran yang mendalam. Mendengarkan CD berkualiti boleh memindahkan anda ke luar United Kingdom dan benar-benar membuka fikiran anda kepada idea-idea. CD berikut disyorkan: Meditasi Berpandu: Untuk Ketenangan, Kesedaran dan Cinta oleh Bodhipaksa. A ...

Freemason yang terkenal - orang-orang buatan

Freemason yang terkenal - orang-orang buatan

Yang hebat dan paling cemerlang di dunia atau Freemason. Kumpulan-kumpulan ini memberikan anda jauh dari senarai komprehensif - mereka hanya contoh: Bapa pengasas: Freemason yang paling terkenal di Amerika, George Washington telah dimulakan pada tahun 1752, di Fredericksburg, Virginia. Bapa pengasas lain yang juga Mason termasuk Benjamin Franklin, Marquis de ...

Pilihan Editor

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Rakaman Portraits dengan Canon EOS Rebel T1i / 500D - patung

Subjek tertumpukan tajam dan latar belakang yang lembut dan kabur. Ikuti langkah-langkah ini untuk mengambil potret seperti Canon Rebel Digital anda.

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

Menukar Canon EOS Rebel T7i / 800D ke Mod Live View - dummies

DSLR yang dijual hari ini, kamera Canon EOS Rebel T7i / 800D menawarkan Live View, yang menyahdayakan pemidang tilik dan sebaliknya memaparkan pratonton langsung subjek anda pada monitor kamera. Senarai berikut menerangkan asas penggunaan Live View: Switch to Live View for photography: Tekan butang Live View untuk beralih dari ...