Video: Memahami Vektor pada Kinematika (1/16) 2024
Mesin vektor sokongan (SVM) adalah algoritma klasifikasi klasifikasi data yang memberikan predikat baru elemen data kepada salah satu kategori berlabel. SVM adalah, dalam kebanyakan kes, pengelas binary ; ia menganggap bahawa data yang berkenaan mengandungi dua nilai sasaran yang mungkin.
Satu lagi versi algoritma SVM, multiclass SVM, menambah SVM untuk digunakan sebagai pengelas pada dataset yang mengandungi lebih daripada satu kelas (pengelompokan atau kategori). SVM telah berjaya digunakan dalam banyak aplikasi seperti pengenalan imej, diagnosis perubatan, dan analisis teks.
Anggap anda sedang merekabentuk model analitik ramalan yang secara automatik akan mengenali dan meramalkan nama sesuatu objek dalam gambar. Ini pada dasarnya adalah masalah pengenalan imej - atau, lebih khusus, pengenalan wajah: Anda mahu pengelas mengiktiraf nama seseorang dalam foto.
Nah, sebelum menangani tahap kerumitan ini, pertimbangkan versi yang lebih mudah dari masalah yang sama: Katakan anda mempunyai gambar buah-buahan individu dan anda ingin pengelas anda meramalkan apa jenis buah yang muncul dalam gambar. Andaikan anda hanya mempunyai dua jenis buah: epal dan pir, satu demi satu.
Memandangkan gambar baru, anda ingin meramalkan sama ada buah adalah epal atau pir - tanpa melihat gambar. Anda mahu SVM mengklasifikasikan setiap gambar sebagai epal atau pir. Seperti semua algoritma lain, langkah pertama ialah melatih pengelas.
Anggap anda mempunyai 200 gambar epal yang berbeza, dan 200 gambar pear. Langkah pembelajaran terdiri daripada memberi makan gambar-gambar tersebut kepada pengelas supaya ia mengetahui apa yang kelihatan seperti epal dan apa yang kelihatan seperti pir. Sebelum masuk ke langkah pertama ini, anda perlu mengubah setiap imej ke dalam matriks data, dengan menggunakan pakej statistik R (misalnya).
Cara mudah untuk mewakili imej sebagai nombor dalam matriks ialah mencari bentuk geometri dalam imej (seperti kalangan, baris, petak, atau segi empat tepat) dan juga kedudukan setiap contoh setiap bentuk geometri. Nombor-nombor itu juga boleh mewakili koordinat objek-objek dalam imej, seperti yang diplot dalam sistem koordinat.
Seperti yang anda bayangkan, mewakili imej sebagai matriks nombor bukanlah satu tugas yang mudah. Seluruh bidang penyelidikan yang berbeza ditumpukan kepada perwakilan imej.
Berikut menunjukkan cara mesin vektor sokongan dapat meramalkan kelas buah (pelabelan secara matematik sebagai epal atau pir ), berdasarkan algoritme yang telah dipelajari pada masa lalu.
Anggap anda telah menukar semua imej ke dalam matriks data. Kemudian mesin vektor sokongan mengambil dua input utama:
-
Data sebelum (latihan): Matriks ini sepadan dengan imej epal dan pir yang dilihat sebelumnya.
-
Data baru (tidak kelihatan) terdiri daripada imej yang ditukar kepada matriks. Tujuannya adalah untuk meramalkan secara automatik apa yang terdapat dalam gambar - epal atau pir.
Vektor sokongan menggunakan fungsi matematik, sering dipanggil fungsi kernel yang merupakan fungsi matematik yang sepadan dengan data baru kepada imej terbaik dari data latihan untuk meramalkan label gambar yang tidak diketahui (epal atau pir).
Berbanding dengan pengelas lain, mesin vektor sokongan menghasilkan ramalan yang mantap, tepat, paling kurang dipengaruhi oleh data bising, dan kurang terdedah kepada overfitting. Perlu diingat, bagaimanapun, bahawa mesin vektor sokongan paling sesuai untuk klasifikasi binari - apabila anda hanya mempunyai dua kategori (seperti epal atau pir).