Rumah Kewangan Peribadi Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Video: Belajar Memperbaiki Power Supply VLOG14 2024

Video: Belajar Memperbaiki Power Supply VLOG14 2024
Anonim

Pembelajaran mesin bergantung kepada data dalam sampel. Bahagian data anda adalah penting kerana anda ingin menemui sudut pandangan dunia, dan seperti semua sudut pandang, ia boleh salah, diputarbelitkan, atau hanya sebahagiannya. Anda juga tahu bahawa anda memerlukan contoh contoh untuk memeriksa sama ada proses pembelajaran berfungsi. Walau bagaimanapun, aspek ini hanya membentuk sebahagian daripada gambar.

Apabila anda membuat algoritma pembelajaran mesin pada data untuk meneka tindak balas tertentu, anda secara efektif mengambil judi, dan perjudian itu bukan hanya kerana sampel yang anda gunakan untuk belajar. Ada lagi. Buat masa ini, bayangkan bahawa anda secara bebas mempunyai akses kepada data yang sesuai, tidak berat sebelah, dalam sampel, jadi data bukanlah masalah. Sebaliknya anda perlu memberi tumpuan kepada kaedah pembelajaran dan ramalan.

Pertama, anda mesti mempertimbangkan bahawa anda bertaruh bahawa algoritma boleh meneka dengan tepat. Anda tidak boleh selalu membuat anggapan ini kerana memikirkan jawapan tertentu tidak mungkin tidak kira apa yang anda tahu terlebih dahulu.

Sebagai contoh, anda tidak boleh sepenuhnya menentukan tingkah laku manusia dengan mengetahui sejarah dan tingkah laku mereka sebelum ini. Mungkin kesan rawak terlibat dalam proses generalisasi tingkah laku kita (bahagian yang tidak rasional kita, misalnya), atau mungkin isu ini akan menjadi kehendak bebas (masalah itu juga adalah falsafah / agama, dan terdapat banyak pendapat yang tidak menonjol). Oleh itu, anda boleh meneka hanya beberapa jenis tindak balas, dan untuk kebanyakan orang lain, seperti ketika anda cuba meramal tingkah laku orang, anda harus menerima tahap ketidakpastian tertentu yang, dengan nasib, dapat diterima untuk tujuan anda.

Kedua, anda harus mempertimbangkan bahawa anda bertaruh bahawa hubungan antara maklumat yang anda miliki dan respons yang anda mahu ramalkan boleh dinyatakan sebagai formula matematik semacam, dan pembelajaran komputer anda algoritma sebenarnya mampu meneka formula itu. Kapasiti algoritma anda untuk meneka formula matematik di sebalik tindak balas tertanam secara intrinsik dalam kacang dan bolt algoritma.

Sesetengah algoritma boleh meneka hampir segala-galanya; yang lain sebenarnya mempunyai satu set pilihan terhad. Pelbagai rumusan matematik yang boleh ditakrifkan oleh algoritma adalah set hipotesis yang mungkin. Akibatnya, hipotesis adalah satu algoritma tunggal, yang dinyatakan dalam semua parameternya dan oleh itu mampu membentuk satu, spesifik tertentu.

Matematik adalah hebat. Ia boleh menggambarkan sebahagian besar dunia nyata dengan menggunakan beberapa notasi ringkas, dan ia adalah inti pembelajaran mesin kerana apa-apa algoritma pembelajaran mempunyai keupayaan tertentu untuk mewakili suatu perumusan matematik.Sesetengah algoritma, seperti regresi linear, secara jelas menggunakan rumusan matematik tertentu untuk mewakili bagaimana tindak balas (contohnya, harga rumah) berkaitan dengan satu set maklumat ramalan (seperti maklumat pasaran, lokasi rumah, permukaan estet, dan sebagainya).

Sesetengah formulasi sangat rumit dan rumit yang walaupun mewakili mereka di atas kertas adalah mungkin, berbuat demikian terlalu sukar dalam segi praktikal. Beberapa algoritma canggih yang lain, seperti pokok keputusan, tidak mempunyai formulasi matematik yang jelas, tetapi begitu mudah disesuaikan supaya mereka dapat menetapkan anggaran rumusan yang besar dengan mudah. Sebagai contoh, pertimbangkan rumusan yang mudah dan mudah dijelaskan. Regresi linear hanyalah garis dalam koordinat ruang yang diberikan oleh respons dan semua prediktor. Dalam contoh yang paling mudah, anda boleh mempunyai respons, y, dan peramal tunggal, x, dengan perumusan

y = β 1 x 1 + β 0

Dalam keadaan mudah tindak balas yang diramalkan oleh satu ciri tunggal, model sedemikian sempurna ketika data anda mengatur dirinya sebagai garis. Walau bagaimanapun, apa yang berlaku jika ia tidak dan sebaliknya membentuk dirinya seperti lengkung? Untuk mewakili keadaan, hanya perhatikan perwakilan bidimensional berikut.

Contoh model linier bergelut untuk memetakan fungsi lengkung.

Apabila mata menyerupai garis atau awan, terdapat ralat apabila anda memikirkan bahawa hasilnya adalah garis lurus; oleh itu pemetaan yang disediakan oleh formulasi sebelumnya entah bagaimana tidak tepat. Walau bagaimanapun, ralat tidak muncul secara sistematik tetapi secara rawak kerana beberapa titik berada di atas garis yang dipetakan dan yang lainnya berada di bawahnya. Keadaan dengan awan titik melengkung, berbentuk berbeza, kerana kali ini, garis kadang-kadang tepat tetapi pada masa lain secara sistematik salah. Kadang-kadang mata sentiasa berada di atas garis; kadang-kadang mereka berada di bawahnya.

Memandangkan kesederhanaan pemetaan respon, algoritma anda cenderung secara sistematik menaksir atau memandang rendah peraturan sebenar di belakang data, yang mewakili kecenderungannya. Bias adalah ciri algoritma mudah yang tidak dapat menyatakan formulasi matematik yang rumit.

Mengenali Had Bias dalam Pembelajaran Mesin - dummies

Pilihan Editor

Menyesuaikan Invois QuickBooks 2014 dengan Alat Pereka Layout - dummies

Menyesuaikan Invois QuickBooks 2014 dengan Alat Pereka Layout - dummies

Mungkin anda telah menggunakan QuickBooks 2014's Basic Kotak dialog penyesuaian untuk membuat beberapa perubahan pada penampilan invois anda, dan anda belum berpuas hati. Mungkin anda telah melebih-lebihkan batu dan mengamati dengan kotak dialog Penyesuaian Tambahan untuk membuat perubahan selanjutnya, dan mungkin juga yang tidak meninggalkan anda senang dengan rupa invois anda. ...

Nisbah Ekuiti hutang dalam QuickBooks 2012 - dummies

Nisbah Ekuiti hutang dalam QuickBooks 2012 - dummies

Nisbah ekuiti hutang adalah salah satu nisbah leverage yang anda boleh gunakan dalam QuickBooks 2012. Nisbah ekuiti hutang membandingkan hutang jangka panjang syarikat dengan ekuiti pemegang saham atau ekuiti pemilik. Pada asasnya, nisbah ekuiti hutang menyatakan hutang jangka panjang syarikat sebagai peratusan ekuiti pemiliknya. Ekuiti pemegang saham sinonim dengan pemilik ...

Nisbah Ekuiti dalam QuickBooks 2014 - dummies

Nisbah Ekuiti dalam QuickBooks 2014 - dummies

Anda boleh mengesan nisbah ekuiti hutang anda dalam QuickBooks. Nisbah ekuiti hutang membandingkan hutang jangka panjang firma dengan ekuiti pemegang saham atau ekuiti pemilik. Pada asasnya, nisbah ekuiti hutang menyatakan hutang jangka panjang syarikat sebagai peratusan ekuiti pemiliknya. Ekuiti pemegang saham adalah sinonim dengan ekuiti pemilik dan, dalam kes ...

Pilihan Editor

Menambah Kursus ke Profil LinkedIn anda - patung

Menambah Kursus ke Profil LinkedIn anda - patung

Jika anda mengambil kursus satu kali yang tidak menyampaikan sijil atau sebahagian daripada program ijazah yang lebih besar, bahagian Kursus LinkedIn adalah untuk anda. Di samping itu, semakin banyak pelajar menyertai LinkedIn, menyedari peluang besar untuk mencari rangkaian dan pekerjaan. Bahagian Kursus adalah di mana anda menyaksikan kursus terkini ...

10 BerkaitanIn Profil Do dan Larangan - dummies

10 BerkaitanIn Profil Do dan Larangan - dummies

Profil LinkedIn anda adalah identiti digital anda. Dari semua profil media sosial di luar sana, profil LinkedIn adalah yang paling mendalam dan memberikan gambaran menyeluruh anda sebagai seorang profesional. Apabila orang mencari nama anda dalam enjin carian, profil LinkedIn anda sering dikembalikan tinggi dalam hasil carian. Apabila ia datang ...

10 LinkedIn Do dan Larangan - dummies

10 LinkedIn Do dan Larangan - dummies

Rangkaian sosial memerlukan banyak kerja, masa dan usaha . Berikut adalah sepuluh perkara penting dan tidak perlu untuk membantu anda membina hubungan LinkedIn dan mendapatkan nilai yang paling banyak daripada masa anda. Pastikan profil anda lengkap dan terkini Walaupun LinkedIn mempunyai banyak ciri, profil anda masih merupakan salah satu sebab yang paling menarik ...

Pilihan Editor

Percetakan Kebenaran Pengguna dalam QuickBooks 2012 - dummies

Percetakan Kebenaran Pengguna dalam QuickBooks 2012 - dummies

Akauntan sering ingin melihat keizinan pengguna tertentu dalam QuickBooks 2012 Ini benar terutamanya jika anda diaudit oleh CPA anda sebagai sebahagian daripada penutupan tahunan. (Anda mungkin diaudit jika bank mahukan penyata kewangan yang telah diaudit.) QuickBooks 2012 tidak menyediakan cara untuk anda mencetak maklumat yang ditunjukkan ...

Bagaimana Menghasilkan Lembaran Kerja Inventori Fizikal dalam QuickBooks 2017 - dummies

Bagaimana Menghasilkan Lembaran Kerja Inventori Fizikal dalam QuickBooks 2017 - dummies

QuickBooks 2017 melakukan yang cukup baik kerja mengesan inventori, tetapi anda masih perlu kerap mengambil inventori fizikal lengkap tentang apa yang ada dalam stok anda. Kadang-kadang, anda perlu pergi ke segala-galanya dan mengiranya dengan tangan. Maaf. Anda tidak boleh mengelakkan tugas itu. QuickBooks boleh menghasilkan mudah ...

Rasio keuntungan dan QuickBooks 2012 - dummies

Rasio keuntungan dan QuickBooks 2012 - dummies

Nisbah keuntungan menganalisis keuntungan syarikat dan anda boleh menggunakannya dalam QuickBooks 2012. Dalam ertikata, nisbah keuntungan ini adalah nisbah paling penting yang boleh anda kirakan. Mereka biasanya memberikan pandangan berguna yang sangat berguna kepada betapa menguntungkan firma dan mengapa. Sebagai contoh, satu nisbah keuntungan yang penting ialah peratusan margin kasar, ...