Rumah Kewangan Peribadi Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Video: Belajar Memperbaiki Power Supply VLOG14 2024

Video: Belajar Memperbaiki Power Supply VLOG14 2024
Anonim

Pembelajaran mesin bergantung kepada data dalam sampel. Bahagian data anda adalah penting kerana anda ingin menemui sudut pandangan dunia, dan seperti semua sudut pandang, ia boleh salah, diputarbelitkan, atau hanya sebahagiannya. Anda juga tahu bahawa anda memerlukan contoh contoh untuk memeriksa sama ada proses pembelajaran berfungsi. Walau bagaimanapun, aspek ini hanya membentuk sebahagian daripada gambar.

Apabila anda membuat algoritma pembelajaran mesin pada data untuk meneka tindak balas tertentu, anda secara efektif mengambil judi, dan perjudian itu bukan hanya kerana sampel yang anda gunakan untuk belajar. Ada lagi. Buat masa ini, bayangkan bahawa anda secara bebas mempunyai akses kepada data yang sesuai, tidak berat sebelah, dalam sampel, jadi data bukanlah masalah. Sebaliknya anda perlu memberi tumpuan kepada kaedah pembelajaran dan ramalan.

Pertama, anda mesti mempertimbangkan bahawa anda bertaruh bahawa algoritma boleh meneka dengan tepat. Anda tidak boleh selalu membuat anggapan ini kerana memikirkan jawapan tertentu tidak mungkin tidak kira apa yang anda tahu terlebih dahulu.

Sebagai contoh, anda tidak boleh sepenuhnya menentukan tingkah laku manusia dengan mengetahui sejarah dan tingkah laku mereka sebelum ini. Mungkin kesan rawak terlibat dalam proses generalisasi tingkah laku kita (bahagian yang tidak rasional kita, misalnya), atau mungkin isu ini akan menjadi kehendak bebas (masalah itu juga adalah falsafah / agama, dan terdapat banyak pendapat yang tidak menonjol). Oleh itu, anda boleh meneka hanya beberapa jenis tindak balas, dan untuk kebanyakan orang lain, seperti ketika anda cuba meramal tingkah laku orang, anda harus menerima tahap ketidakpastian tertentu yang, dengan nasib, dapat diterima untuk tujuan anda.

Kedua, anda harus mempertimbangkan bahawa anda bertaruh bahawa hubungan antara maklumat yang anda miliki dan respons yang anda mahu ramalkan boleh dinyatakan sebagai formula matematik semacam, dan pembelajaran komputer anda algoritma sebenarnya mampu meneka formula itu. Kapasiti algoritma anda untuk meneka formula matematik di sebalik tindak balas tertanam secara intrinsik dalam kacang dan bolt algoritma.

Sesetengah algoritma boleh meneka hampir segala-galanya; yang lain sebenarnya mempunyai satu set pilihan terhad. Pelbagai rumusan matematik yang boleh ditakrifkan oleh algoritma adalah set hipotesis yang mungkin. Akibatnya, hipotesis adalah satu algoritma tunggal, yang dinyatakan dalam semua parameternya dan oleh itu mampu membentuk satu, spesifik tertentu.

Matematik adalah hebat. Ia boleh menggambarkan sebahagian besar dunia nyata dengan menggunakan beberapa notasi ringkas, dan ia adalah inti pembelajaran mesin kerana apa-apa algoritma pembelajaran mempunyai keupayaan tertentu untuk mewakili suatu perumusan matematik.Sesetengah algoritma, seperti regresi linear, secara jelas menggunakan rumusan matematik tertentu untuk mewakili bagaimana tindak balas (contohnya, harga rumah) berkaitan dengan satu set maklumat ramalan (seperti maklumat pasaran, lokasi rumah, permukaan estet, dan sebagainya).

Sesetengah formulasi sangat rumit dan rumit yang walaupun mewakili mereka di atas kertas adalah mungkin, berbuat demikian terlalu sukar dalam segi praktikal. Beberapa algoritma canggih yang lain, seperti pokok keputusan, tidak mempunyai formulasi matematik yang jelas, tetapi begitu mudah disesuaikan supaya mereka dapat menetapkan anggaran rumusan yang besar dengan mudah. Sebagai contoh, pertimbangkan rumusan yang mudah dan mudah dijelaskan. Regresi linear hanyalah garis dalam koordinat ruang yang diberikan oleh respons dan semua prediktor. Dalam contoh yang paling mudah, anda boleh mempunyai respons, y, dan peramal tunggal, x, dengan perumusan

y = β 1 x 1 + β 0

Dalam keadaan mudah tindak balas yang diramalkan oleh satu ciri tunggal, model sedemikian sempurna ketika data anda mengatur dirinya sebagai garis. Walau bagaimanapun, apa yang berlaku jika ia tidak dan sebaliknya membentuk dirinya seperti lengkung? Untuk mewakili keadaan, hanya perhatikan perwakilan bidimensional berikut.

Contoh model linier bergelut untuk memetakan fungsi lengkung.

Apabila mata menyerupai garis atau awan, terdapat ralat apabila anda memikirkan bahawa hasilnya adalah garis lurus; oleh itu pemetaan yang disediakan oleh formulasi sebelumnya entah bagaimana tidak tepat. Walau bagaimanapun, ralat tidak muncul secara sistematik tetapi secara rawak kerana beberapa titik berada di atas garis yang dipetakan dan yang lainnya berada di bawahnya. Keadaan dengan awan titik melengkung, berbentuk berbeza, kerana kali ini, garis kadang-kadang tepat tetapi pada masa lain secara sistematik salah. Kadang-kadang mata sentiasa berada di atas garis; kadang-kadang mereka berada di bawahnya.

Memandangkan kesederhanaan pemetaan respon, algoritma anda cenderung secara sistematik menaksir atau memandang rendah peraturan sebenar di belakang data, yang mewakili kecenderungannya. Bias adalah ciri algoritma mudah yang tidak dapat menyatakan formulasi matematik yang rumit.

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Pilihan Editor

Merasakan Kebahagiaan - kesetiaan

Merasakan Kebahagiaan - kesetiaan

Semua manfaat dan penghargaan dari makanan yang penuh perhatian yang tercantum dalam Lembaran Menipu ini. Memberi perhatian semasa makan mungkin menggalakkan anda untuk makan kurang, yang boleh menyebabkan manfaat penurunan berat badan, yang kemudian dapat mencegah penyakit berkaitan obesiti seperti diabetes jenis II. Menala ke dalam badan anda membolehkan ...

Kesedaran untuk Meditasi untuk Kanak-kanak - para pemalu

Kesedaran untuk Meditasi untuk Kanak-kanak - para pemalu

Seperti apa-apa lagi, belajar melakukan sesuatu seperti kanak-kanak lebih mudah dan membantu menetapkan amalan yang sihat untuk hidup. Meditasi kasih sayang Ini adalah latihan yang kuat untuk berlatih dengan anak-anak anda. Jika anak-anak anda benar-benar suka senaman, mereka ...

Mengatasi Insomnia dengan Kesadaran - para penyihir

Mengatasi Insomnia dengan Kesadaran - para penyihir

Tidur. Jika ia datang secara semula jadi kepada anda, anda orang yang bertuah. Tidur malam yang baik adalah sangat mudah untuk diterima. Bagi ramai orang, insomnia adalah sesuatu yang mereka perjuangkan setiap malam. Sekiranya anda mengalami insomnia, mulailah dengan mencuba yang berikut: Elakkan menonton televisyen atau berada di komputer pada lewat petang. ...

Pilihan Editor

Cara Tambah Video ke Slaid PowerPoint 2007 - monyet

Cara Tambah Video ke Slaid PowerPoint 2007 - monyet

Bahagian paling sukar untuk menggunakan video dalam Persembahan PowerPoint sedang mencari penampilan bernilai video. PowerPoint dilengkapi dengan filem dalam Galeri Media, dan Microsoft mempunyai mereka dalam Galeri Media dalam talian. Anda juga boleh mencari pelbagai klip video yang tersedia untuk dimuat turun di Web. Ikut langkah-langkah ini untuk menambah ...

Cara Tambah Video ke Slide PowerPoint 2013 anda - dummies

Cara Tambah Video ke Slide PowerPoint 2013 anda - dummies

Menambahkan klip gerakan filem ke PowerPoint Slaid 2013 sama dengan menambah klip bunyi. Walau bagaimanapun, terdapat perbezaan penting antara klip gerakan dan gigitan bunyi: Video dimaksudkan untuk dilihat (dan kadangkala didengar). Klip gerak yang dimasukkan harus diberi ruang yang mencukupi pada slaid anda. Langkah-langkah berikut menunjukkan cara ...

Pilihan Editor

Cara Tambah Hyperlink ke Excel 2016 Worksheet - dummies

Cara Tambah Hyperlink ke Excel 2016 Worksheet - dummies

Hyperlink mengautomasikan Excel 2016 lembaran kerja dengan membuat pembukaan dokumen Office lain dan buku kerja Excel dan lembaran kerja hanya klik mouse. Tidak kira sama ada dokumen ini terletak pada cakera keras anda, pelayan di LAN anda (Rangkaian Kawasan Setempat), atau laman web di Internet atau intranet syarikat. Anda boleh ...

Cara Tambah Rekod ke Senarai Data dalam Excel 2016 - dummies

Cara Tambah Rekod ke Senarai Data dalam Excel 2016 - dummies

Setelah mencipta bidang nama dan satu rekod senarai data dan memformatkannya sebagai jadual, anda sudah bersedia untuk memasuki data yang lain sebagai rekod dalam baris seterusnya dalam senarai. Cara yang paling langsung untuk melakukan ini adalah dengan menekan kekunci Tab apabila kursor sel berada di ...

Cara Memohon Format Peratus Percent di Excel 2010 - dummies

Cara Memohon Format Peratus Percent di Excel 2010 - dummies

Banyak lembaran Excel 2010 menggunakan peratusan dalam bentuk kadar faedah, kadar pertumbuhan, kadar inflasi, dan sebagainya. Apabila anda menggunakan format Percent Style kepada nilai yang telah dimasukkan dalam sel, Excel melipatgandakan nilai sebanyak 100 dan memaparkan hasilnya dengan tanda peratus. Untuk memasukkan peratusan ...