Rumah Kewangan Peribadi Penipuan penipuan dengan Hadoop - dummies

Penipuan penipuan dengan Hadoop - dummies

Video: Pengesanan Awal Kanser Mulut: Lakukannya Sendiri! 2024

Video: Pengesanan Awal Kanser Mulut: Lakukannya Sendiri! 2024
Anonim

Jumlah urus niaga yang semata-mata menjadikannya lebih sukar untuk melihat penipuan kerana jumlah data, ironinya, cabaran yang sama dapat membantu mewujudkan model ramalan penipuan yang lebih baik - kawasan di mana Hadoop bersinar.

Di dunia yang saling berkaitan, jumlah dagangan dan kerumitan urus niaga menjadikannya lebih sukar daripada mencari penipuan. Apa yang biasa dipanggil "mencari jarum dalam rumput kering" telah menjadi tugas "mencari jarum khusus dalam susunan jarum. "

Pendekatan tradisional terhadap pencegahan penipuan tidak begitu berkesan. Sebagai contoh, pengurusan pembayaran yang tidak wajar sering diuruskan oleh penganalisis yang mengaudit apa jumlah sampel kecil tuntutan yang dipasangkan dengan meminta dokumentasi perubatan daripada penyerah yang disasarkan. Istilah industri untuk model ini adalah membayar dan mengejar: Tuntutan diterima dan dibayar dan proses mencari kelebihan pembayaran yang disengajakan atau tidak sengaja melalui peninjauan pasca pembayaran atas tuntutan tersebut.

Jadi, bagaimanakah pengesanan penipuan dilakukan sekarang? Kerana keterbatasan teknologi tradisional, model penipuan dibina oleh data persampelan dan menggunakan sampel untuk membina satu set model ramalan-dan ramalan-penipuan. Apabila anda membezakan model ini dengan jabatan penyelewengan berlabuh Hadoop yang menggunakan set data penuh - tiada sampel - untuk membina model, anda dapat melihat perbezaannya.

Tema berulang yang paling biasa yang anda lihat merentas kebanyakan kes penggunaan Hadoop ialah ia membantu perniagaan dalam memecahkan siling kaca pada jumlah dan pelbagai data yang boleh dimasukkan ke dalam analisis keputusan. Semakin banyak data yang anda miliki (dan lebih banyak sejarah yang anda simpan), semakin baik model anda dapat.

Mencampur bentuk data tanpa bentuk dengan set transaksi bersejarah anda boleh menjadikan model penipuan anda lebih mantap. Sebagai contoh, jika seorang pekerja membuat tuntutan pampasan pekerja untuk kembali buruk dari kejadian slip-dan-jatuh, mempunyai sekumpulan berjuta-juta kes hasil pesakit yang terperinci rawatan dan panjang pemulihan membantu mewujudkan corak pengesanan untuk penipuan.

Sebagai contoh bagaimana model ini boleh berfungsi, bayangkan cuba mencari sama ada pesakit di kawasan luar bandar pulih dengan lebih perlahan daripada orang-orang di kawasan bandar. Anda boleh mulakan dengan meninjau kedekatan dengan perkhidmatan fisioterapi. Adakah terdapat kaitan corak antara masa pemulihan dan lokasi geografi?

Jika jabatan penipuan anda menentukan bahawa kecederaan tertentu mengambil masa tiga minggu pemulihan tetapi seorang petani dengan diagnosis yang sama tinggal satu jam dari ahli fisioterapi dan pekerja pejabat mempunyai seorang pengamal di kantornya, itulah pembolehubah lain untuk menambah penipuan - corak pemasangan.

Apabila anda menuai data rangkaian sosial untuk pihak menuntut dan mencari pesakit yang mendakwa menderita whiplash berbangga tentang menyelesaikan siri peristiwa tahan lasak yang dikenal sebagai Tough Mudder, itu adalah contoh pencampuran jenis data baru dengan bentuk data tradisional untuk melihat penipuan.

Jika anda ingin menendang usaha pengesanan penipuan anda ke gear yang lebih tinggi, organisasi anda boleh bekerja untuk beralih dari pemodelan segmen pasaran dan bergerak ke arah model transaksi atau di peringkat orang.

Cukup mudah, membuat ramalan berdasarkan segmen sangat berguna, tetapi membuat keputusan berdasarkan maklumat tertentu mengenai transaksi individu (jelas) lebih baik. Untuk melakukan ini, anda membuat satu set data yang lebih besar daripada yang konvensional mungkin dalam pendekatan tradisional. Hanya (maksimum) 30 peratus daripada maklumat yang tersedia yang mungkin berguna untuk pemodelan penipuan sedang digunakan.

Untuk mencipta model pengesanan penipuan, Hadoop sangat sesuai untuk

  • Mengendalikan kelantangan: Ini bermakna memproses set data penuh - tiada persampelan data.

  • Menguruskan jenis data baru: Contoh adalah kemasukan perkhidmatan jarak dekat dan penjagaan sosial dan untuk menghiasi model penipuan.

  • Mengekalkan persekitaran yang tangkas: Membolehkan pelbagai jenis analisis dan perubahan kepada model sedia ada.

Pemalsu penipuan boleh menambah dan menguji pemboleh ubah baru kepada model tanpa perlu membuat cadangan kepada pasukan pentadbir pangkalan data anda dan kemudian menunggu beberapa minggu untuk meluluskan perubahan skema dan meletakkannya ke persekitaran mereka.

Proses ini adalah penting untuk pengesanan penipuan kerana persekitaran yang dinamik biasanya mempunyai pola penipuan kitaran yang datang dan pergi dalam jam, hari, atau minggu. Sekiranya data yang digunakan untuk mengenal pasti atau memperkuatkan model pengesanan penipuan baru tidak tersedia pada notis masa, pada saat anda menemukan corak baru ini, mungkin terlambat untuk mencegah kerusakan.

Menilai manfaat kepada perniagaan anda bukan sahaja membina model yang lebih komprehensif dengan lebih banyak jenis data tetapi juga dapat menyegarkan dan meningkatkan model-model tersebut lebih cepat berbanding sebelum ini. Syarikat yang dapat menyegarkan dan meningkatkan model harian akan lebih baik daripada yang membuatnya setiap suku tahun.

Anda mungkin percaya bahawa masalah ini mempunyai jawapan yang mudah - hanya meminta CIO untuk perbelanjaan operasi (OPEX) dan perbelanjaan modal (CAPEX) untuk mengakomodasi lebih banyak data untuk membuat model lebih baik dan memuatkan 70 peratus data yang lain ke dalam model keputusan.

Anda mungkin percaya bahawa pelaburan ini akan membayar sendiri dengan pengesanan penipuan yang lebih baik; Walau bagaimanapun, masalah dengan pendekatan ini adalah kos pendahuluan tinggi yang perlu ditenggelamkan ke dalam data tidak diketahui , di mana anda tidak tahu sama ada ia mengandungi apa-apa pandangan yang benar-benar berharga.

Pastinya, tiga kali ganda saiz gudang data anda, misalnya, akan memberi anda lebih banyak akses kepada data sejarah berstruktur untuk menyempurnakan model anda, tetapi mereka tidak dapat menampung pecahan media sosial. Teknologi tradisional tidak seperti tangkas, sama ada. Hadoop menjadikannya mudah untuk memperkenalkan pembolehubah baharu ke dalam model, dan jika mereka tidak menghasilkan peningkatan pada model, anda boleh membuang data dan teruskan.

Penipuan penipuan dengan Hadoop - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...