Rumah Kewangan Peribadi Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Video: Belajar Memperbaiki Power Supply VLOG14 2025

Video: Belajar Memperbaiki Power Supply VLOG14 2025
Anonim

Pembelajaran mesin bergantung kepada data dalam sampel. Bahagian data anda adalah penting kerana anda ingin menemui sudut pandangan dunia, dan seperti semua sudut pandang, ia boleh salah, diputarbelitkan, atau hanya sebahagiannya. Anda juga tahu bahawa anda memerlukan contoh contoh untuk memeriksa sama ada proses pembelajaran berfungsi. Walau bagaimanapun, aspek ini hanya membentuk sebahagian daripada gambar.

Apabila anda membuat algoritma pembelajaran mesin pada data untuk meneka tindak balas tertentu, anda secara efektif mengambil judi, dan perjudian itu bukan hanya kerana sampel yang anda gunakan untuk belajar. Ada lagi. Buat masa ini, bayangkan bahawa anda secara bebas mempunyai akses kepada data yang sesuai, tidak berat sebelah, dalam sampel, jadi data bukanlah masalah. Sebaliknya anda perlu memberi tumpuan kepada kaedah pembelajaran dan ramalan.

Pertama, anda mesti mempertimbangkan bahawa anda bertaruh bahawa algoritma boleh meneka dengan tepat. Anda tidak boleh selalu membuat anggapan ini kerana memikirkan jawapan tertentu tidak mungkin tidak kira apa yang anda tahu terlebih dahulu.

Sebagai contoh, anda tidak boleh sepenuhnya menentukan tingkah laku manusia dengan mengetahui sejarah dan tingkah laku mereka sebelum ini. Mungkin kesan rawak terlibat dalam proses generalisasi tingkah laku kita (bahagian yang tidak rasional kita, misalnya), atau mungkin isu ini akan menjadi kehendak bebas (masalah itu juga adalah falsafah / agama, dan terdapat banyak pendapat yang tidak menonjol). Oleh itu, anda boleh meneka hanya beberapa jenis tindak balas, dan untuk kebanyakan orang lain, seperti ketika anda cuba meramal tingkah laku orang, anda harus menerima tahap ketidakpastian tertentu yang, dengan nasib, dapat diterima untuk tujuan anda.

Kedua, anda harus mempertimbangkan bahawa anda bertaruh bahawa hubungan antara maklumat yang anda miliki dan respons yang anda mahu ramalkan boleh dinyatakan sebagai formula matematik semacam, dan pembelajaran komputer anda algoritma sebenarnya mampu meneka formula itu. Kapasiti algoritma anda untuk meneka formula matematik di sebalik tindak balas tertanam secara intrinsik dalam kacang dan bolt algoritma.

Sesetengah algoritma boleh meneka hampir segala-galanya; yang lain sebenarnya mempunyai satu set pilihan terhad. Pelbagai rumusan matematik yang boleh ditakrifkan oleh algoritma adalah set hipotesis yang mungkin. Akibatnya, hipotesis adalah satu algoritma tunggal, yang dinyatakan dalam semua parameternya dan oleh itu mampu membentuk satu, spesifik tertentu.

Matematik adalah hebat. Ia boleh menggambarkan sebahagian besar dunia nyata dengan menggunakan beberapa notasi ringkas, dan ia adalah inti pembelajaran mesin kerana apa-apa algoritma pembelajaran mempunyai keupayaan tertentu untuk mewakili suatu perumusan matematik.Sesetengah algoritma, seperti regresi linear, secara jelas menggunakan rumusan matematik tertentu untuk mewakili bagaimana tindak balas (contohnya, harga rumah) berkaitan dengan satu set maklumat ramalan (seperti maklumat pasaran, lokasi rumah, permukaan estet, dan sebagainya).

Sesetengah formulasi sangat rumit dan rumit yang walaupun mewakili mereka di atas kertas adalah mungkin, berbuat demikian terlalu sukar dalam segi praktikal. Beberapa algoritma canggih yang lain, seperti pokok keputusan, tidak mempunyai formulasi matematik yang jelas, tetapi begitu mudah disesuaikan supaya mereka dapat menetapkan anggaran rumusan yang besar dengan mudah. Sebagai contoh, pertimbangkan rumusan yang mudah dan mudah dijelaskan. Regresi linear hanyalah garis dalam koordinat ruang yang diberikan oleh respons dan semua prediktor. Dalam contoh yang paling mudah, anda boleh mempunyai respons, y, dan peramal tunggal, x, dengan perumusan

y = β 1 x 1 + β 0

Dalam keadaan mudah tindak balas yang diramalkan oleh satu ciri tunggal, model sedemikian sempurna ketika data anda mengatur dirinya sebagai garis. Walau bagaimanapun, apa yang berlaku jika ia tidak dan sebaliknya membentuk dirinya seperti lengkung? Untuk mewakili keadaan, hanya perhatikan perwakilan bidimensional berikut.

Contoh model linier bergelut untuk memetakan fungsi lengkung.

Apabila mata menyerupai garis atau awan, terdapat ralat apabila anda memikirkan bahawa hasilnya adalah garis lurus; oleh itu pemetaan yang disediakan oleh formulasi sebelumnya entah bagaimana tidak tepat. Walau bagaimanapun, ralat tidak muncul secara sistematik tetapi secara rawak kerana beberapa titik berada di atas garis yang dipetakan dan yang lainnya berada di bawahnya. Keadaan dengan awan titik melengkung, berbentuk berbeza, kerana kali ini, garis kadang-kadang tepat tetapi pada masa lain secara sistematik salah. Kadang-kadang mata sentiasa berada di atas garis; kadang-kadang mereka berada di bawahnya.

Memandangkan kesederhanaan pemetaan respon, algoritma anda cenderung secara sistematik menaksir atau memandang rendah peraturan sebenar di belakang data, yang mewakili kecenderungannya. Bias adalah ciri algoritma mudah yang tidak dapat menyatakan formulasi matematik yang rumit.

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Pilihan Editor

5 Perkara yang boleh dilakukan oleh GoPro Camera - dummies

5 Perkara yang boleh dilakukan oleh GoPro Camera - dummies

Apa yang boleh dilakukan oleh GoPro? Inilah soalan yang lebih relevan: Apa yang anda mahu lakukan? Meminta soalan ini lebih seperti menanyakan diri anda tentang keinginan dan hasrat anda sendiri untuk rakaman video yang unik. Apabila anda menentukan apa yang anda ingin tangkap, semua yang anda perlu lakukan ialah menyambungkan kamera ke gunung yang sesuai ...

Pengaturan & Pintasan dSLR Untuk Menipu Cheat Sheet - dummies

Pengaturan & Pintasan dSLR Untuk Menipu Cheat Sheet - dummies

Anda mempunyai refleks kanta tunggal digital yang besar (dSLR ) kamera dan mahu menangkap beberapa gambar indah masa-masa hidup anda. Untuk sepenuhnya menguasai dSLR anda dan membuat gambar yang menarik, anda mesti menceburkan diri ke dunia baru yang berani yang melibatkan membuat keputusan tentang mod penangkapan. Mengetahui panjang fokus apa yang digunakan dalam ...

Pilihan Editor

Bagaimana Menggunakan Lapisan Masker Gradient dan Brush Masker di Photoshop CS6 - lapisan masker

Bagaimana Menggunakan Lapisan Masker Gradient dan Brush Masker di Photoshop CS6 - lapisan masker

Lapisan lapisan di Photoshop CS6 membolehkan anda secara beransur-ansur berus dalam ketelusan dan kelegapan pada asas pixel selektif. Dua alat pelapis lapisan - Alat Gradien dan Brush - lebih kerap digunakan berbanding yang lain: Alat Gradien: Menetapkan alat ini kepada kecerunan linear hitam ke putih atau putih ke ...

Cara Menggunakan Kuler untuk Cari dan Kongsi Tema Warna di Photoshop CS6 - dummies

Cara Menggunakan Kuler untuk Cari dan Kongsi Tema Warna di Photoshop CS6 - dummies

Sumber yang tersedia untuk Adobe Photoshop Creative Suite 6 adalah luas. Kuler adalah komuniti dalam talian yang menyediakan tema warna untuk anda menyemak imbas, memuat turun, membuat, mengedit, dan memuat naik untuk berkongsi dengan orang lain. Gunakan tema ini apabila membuat projek cetak grafik atau laman web. Apa yang anda perlukan ialah sambungan Internet dan Adobe ID. Di sini ...

Cara Menggunakan Kata Kunci untuk Photoshop CS6 Files dalam Bridge - dummies

Cara Menggunakan Kata Kunci untuk Photoshop CS6 Files dalam Bridge - dummies

Kata kunci adalah label deskriptif yang anda lampirkan ke fail di Bridge. Mereka membantu untuk mengkategorikan imej Photoshop CS6 anda, membolehkan anda lebih cekap dan cepat mencari fail yang anda inginkan. Berikut adalah downside untuk membuat dan menggunakan kata kunci: Untuk membuat kata kunci baru (folder kategori yang mengandungi kata kunci): Klik ikon tanda tambah (+) ...

Pilihan Editor

Dengan Touch dengan Nota Reka bentuk - dummies

Dengan Touch dengan Nota Reka bentuk - dummies

Nota reka bentuk adalah sesuai untuk berkomunikasi dengan pemaju lain yang bekerja pada Laman web, tetapi tidak dalam jarak menjerit. Ciri Dreamweaver ini berfungsi seperti tag komen (kod HTML yang membolehkan anda memasukkan teks dalam halaman yang tidak akan dipaparkan dalam penyemak imbas) tetapi dengan privasi lebih banyak. Ramai pemaju menggunakan ...

Memenuhi Dreamweaver CS3 Common Insert Bar - dummies

Memenuhi Dreamweaver CS3 Common Insert Bar - dummies

Jangan berfikir bahawa toolbar Dreamweaver CS3 Common Insert biasa dan biasa. Ia hanya dipanggil "umum" kerana ia menawarkan perintah memasukkan yang paling kerap digunakan kerana ia adalah yang paling berguna. Dengan bilah alat yang ditunjukkan di sini, anda boleh memasukkan segala-galanya dari pautan e-mel kepada tarikh kepada mana-mana media yang ingin anda letakkan ...

Gambaran Keseluruhan Alignment Imej dalam Adobe CS5 Dreamweaver - dummies

Gambaran Keseluruhan Alignment Imej dalam Adobe CS5 Dreamweaver - dummies

Penjajaran imej dan teks bersebelahan mereka di Adobe Suite Creative 5 (Adobe CS5) Dreamweaver adalah mudah, tetapi pilihan yang ada mungkin membuat kelihatan terlalu rumit. Imej dan teks bersebelahan mereka duduk pada garis dasar yang sama sebagai lalai, memaksa teks berjalan dalam satu baris ke kanan imej. Untuk ...