Rumah Kewangan Peribadi Penipuan penipuan dengan Hadoop - dummies

Penipuan penipuan dengan Hadoop - dummies

Video: Pengesanan Awal Kanser Mulut: Lakukannya Sendiri! 2024

Video: Pengesanan Awal Kanser Mulut: Lakukannya Sendiri! 2024
Anonim

Jumlah urus niaga yang semata-mata menjadikannya lebih sukar untuk melihat penipuan kerana jumlah data, ironinya, cabaran yang sama dapat membantu mewujudkan model ramalan penipuan yang lebih baik - kawasan di mana Hadoop bersinar.

Di dunia yang saling berkaitan, jumlah dagangan dan kerumitan urus niaga menjadikannya lebih sukar daripada mencari penipuan. Apa yang biasa dipanggil "mencari jarum dalam rumput kering" telah menjadi tugas "mencari jarum khusus dalam susunan jarum. "

Pendekatan tradisional terhadap pencegahan penipuan tidak begitu berkesan. Sebagai contoh, pengurusan pembayaran yang tidak wajar sering diuruskan oleh penganalisis yang mengaudit apa jumlah sampel kecil tuntutan yang dipasangkan dengan meminta dokumentasi perubatan daripada penyerah yang disasarkan. Istilah industri untuk model ini adalah membayar dan mengejar: Tuntutan diterima dan dibayar dan proses mencari kelebihan pembayaran yang disengajakan atau tidak sengaja melalui peninjauan pasca pembayaran atas tuntutan tersebut.

Jadi, bagaimanakah pengesanan penipuan dilakukan sekarang? Kerana keterbatasan teknologi tradisional, model penipuan dibina oleh data persampelan dan menggunakan sampel untuk membina satu set model ramalan-dan ramalan-penipuan. Apabila anda membezakan model ini dengan jabatan penyelewengan berlabuh Hadoop yang menggunakan set data penuh - tiada sampel - untuk membina model, anda dapat melihat perbezaannya.

Tema berulang yang paling biasa yang anda lihat merentas kebanyakan kes penggunaan Hadoop ialah ia membantu perniagaan dalam memecahkan siling kaca pada jumlah dan pelbagai data yang boleh dimasukkan ke dalam analisis keputusan. Semakin banyak data yang anda miliki (dan lebih banyak sejarah yang anda simpan), semakin baik model anda dapat.

Mencampur bentuk data tanpa bentuk dengan set transaksi bersejarah anda boleh menjadikan model penipuan anda lebih mantap. Sebagai contoh, jika seorang pekerja membuat tuntutan pampasan pekerja untuk kembali buruk dari kejadian slip-dan-jatuh, mempunyai sekumpulan berjuta-juta kes hasil pesakit yang terperinci rawatan dan panjang pemulihan membantu mewujudkan corak pengesanan untuk penipuan.

Sebagai contoh bagaimana model ini boleh berfungsi, bayangkan cuba mencari sama ada pesakit di kawasan luar bandar pulih dengan lebih perlahan daripada orang-orang di kawasan bandar. Anda boleh mulakan dengan meninjau kedekatan dengan perkhidmatan fisioterapi. Adakah terdapat kaitan corak antara masa pemulihan dan lokasi geografi?

Jika jabatan penipuan anda menentukan bahawa kecederaan tertentu mengambil masa tiga minggu pemulihan tetapi seorang petani dengan diagnosis yang sama tinggal satu jam dari ahli fisioterapi dan pekerja pejabat mempunyai seorang pengamal di kantornya, itulah pembolehubah lain untuk menambah penipuan - corak pemasangan.

Apabila anda menuai data rangkaian sosial untuk pihak menuntut dan mencari pesakit yang mendakwa menderita whiplash berbangga tentang menyelesaikan siri peristiwa tahan lasak yang dikenal sebagai Tough Mudder, itu adalah contoh pencampuran jenis data baru dengan bentuk data tradisional untuk melihat penipuan.

Jika anda ingin menendang usaha pengesanan penipuan anda ke gear yang lebih tinggi, organisasi anda boleh bekerja untuk beralih dari pemodelan segmen pasaran dan bergerak ke arah model transaksi atau di peringkat orang.

Cukup mudah, membuat ramalan berdasarkan segmen sangat berguna, tetapi membuat keputusan berdasarkan maklumat tertentu mengenai transaksi individu (jelas) lebih baik. Untuk melakukan ini, anda membuat satu set data yang lebih besar daripada yang konvensional mungkin dalam pendekatan tradisional. Hanya (maksimum) 30 peratus daripada maklumat yang tersedia yang mungkin berguna untuk pemodelan penipuan sedang digunakan.

Untuk mencipta model pengesanan penipuan, Hadoop sangat sesuai untuk

  • Mengendalikan kelantangan: Ini bermakna memproses set data penuh - tiada persampelan data.

  • Menguruskan jenis data baru: Contoh adalah kemasukan perkhidmatan jarak dekat dan penjagaan sosial dan untuk menghiasi model penipuan.

  • Mengekalkan persekitaran yang tangkas: Membolehkan pelbagai jenis analisis dan perubahan kepada model sedia ada.

Pemalsu penipuan boleh menambah dan menguji pemboleh ubah baru kepada model tanpa perlu membuat cadangan kepada pasukan pentadbir pangkalan data anda dan kemudian menunggu beberapa minggu untuk meluluskan perubahan skema dan meletakkannya ke persekitaran mereka.

Proses ini adalah penting untuk pengesanan penipuan kerana persekitaran yang dinamik biasanya mempunyai pola penipuan kitaran yang datang dan pergi dalam jam, hari, atau minggu. Sekiranya data yang digunakan untuk mengenal pasti atau memperkuatkan model pengesanan penipuan baru tidak tersedia pada notis masa, pada saat anda menemukan corak baru ini, mungkin terlambat untuk mencegah kerusakan.

Menilai manfaat kepada perniagaan anda bukan sahaja membina model yang lebih komprehensif dengan lebih banyak jenis data tetapi juga dapat menyegarkan dan meningkatkan model-model tersebut lebih cepat berbanding sebelum ini. Syarikat yang dapat menyegarkan dan meningkatkan model harian akan lebih baik daripada yang membuatnya setiap suku tahun.

Anda mungkin percaya bahawa masalah ini mempunyai jawapan yang mudah - hanya meminta CIO untuk perbelanjaan operasi (OPEX) dan perbelanjaan modal (CAPEX) untuk mengakomodasi lebih banyak data untuk membuat model lebih baik dan memuatkan 70 peratus data yang lain ke dalam model keputusan.

Anda mungkin percaya bahawa pelaburan ini akan membayar sendiri dengan pengesanan penipuan yang lebih baik; Walau bagaimanapun, masalah dengan pendekatan ini adalah kos pendahuluan tinggi yang perlu ditenggelamkan ke dalam data tidak diketahui , di mana anda tidak tahu sama ada ia mengandungi apa-apa pandangan yang benar-benar berharga.

Pastinya, tiga kali ganda saiz gudang data anda, misalnya, akan memberi anda lebih banyak akses kepada data sejarah berstruktur untuk menyempurnakan model anda, tetapi mereka tidak dapat menampung pecahan media sosial. Teknologi tradisional tidak seperti tangkas, sama ada. Hadoop menjadikannya mudah untuk memperkenalkan pembolehubah baharu ke dalam model, dan jika mereka tidak menghasilkan peningkatan pada model, anda boleh membuang data dan teruskan.

Penipuan penipuan dengan Hadoop - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...