Rumah Kewangan Peribadi Perlombongan data - dummies

Perlombongan data - dummies

Isi kandungan:

Video: Are you using SHAREit ( Data mining ? ) { YOU HAVE TO KNOW } ( Is it safe to use ? SIM data leak​ ) 2024

Video: Are you using SHAREit ( Data mining ? ) { YOU HAVE TO KNOW } ( Is it safe to use ? SIM data leak​ ) 2024
Anonim

Ciri yang membezakan mengenai perlombongan data, berbanding dengan pertanyaan, pelaporan, atau bahkan OLAP, adalah bahawa anda boleh mendapatkan maklumat tanpa perlu bertanya soalan tertentu.

Perlombongan data berfungsi dua peranan utama dalam misi perisikan perniagaan anda:

  • Peranan "Beritahu saya apa yang mungkin berlaku": Peranan pertama perlombongan data adalah ramalan, di mana anda pada dasarnya berkata, "Beritahu saya apa mungkin berlaku. "Menggunakan pengetahuan tersembunyi yang terkunci dalam gudang data anda, kebarangkalian dan kemungkinan trend dan kejadian masa depan akan disampaikan kepada anda.

  • Peranan "Beritahu saya sesuatu yang menarik": Di samping kemungkinan kejadian dan kejadian masa depan, perlombongan data juga cuba menarik maklumat menarik yang mungkin anda ketahui, seperti hubungan luar biasa antara jualan dua produk berbeza dan bagaimana hubungan itu berbeza mengikut penempatan di kedai runcit anda.

    Walaupun banyak tidbit menarik yang mungkin wujud, apakah soalan yang akan anda tanyakan jika anda menggunakan alat pertanyaan atau OLAP, dan bagaimana anda akan mentafsirkan hasilnya? Perlombongan data membantu anda dalam tugas sukar ini untuk mencari tahu soalan-soalan yang boleh ditanya dengan melakukan banyak kerja menggigit untuk anda.

Perlombongan data dalam misi perniagaan tertentu

Perlombongan data sangat sesuai untuk jenis misi perniagaan tertentu:

  • Mengesan penipuan

  • Menentukan keberkesanan program pemasaran

  • Memilih siapa, dari asas pelanggan yang besar atau penduduk umum, anda harus menargetkan sebagai sebahagian dari program pemasaran

  • Menguruskan kitar hayat pelanggan, termasuk misi retensi pelanggan

  • Melakukan pemodelan proses perniagaan yang lebih maju dan senario apa-jika

Fikirkan tentang apa yang ada di belakang setiap misi perniagaan dalam senarai terdahulu:

  • Sejumlah besar data

  • Lebih besar bilangan gabungan pelbagai keping data

  • Analisis set keputusan intensif, biasanya melibatkan algoritma kompleks dan teknik statistik lanjutan

Sekarang, fikirkan tentang apa yang perlu anda lakukan jika anda menggunakan alat pelaporan atau OLAP untuk mencapai misi ini. Anda akan mendapati hampir mustahil untuk melakukan apa-apa misi sebelum ini jika anda perlu bertanya dan mendapatkan hasilnya, tanya soalan lain dan dapatkan hasil yang lain, dan kemudian teruskan langkah-langkah tersebut.

Perlombongan data dan kepintaran buatan

Jika anda telah berada di bidang teknologi maklumat (IT) selama sekurang-kurangnya satu dekad, beberapa istilah sebelum ini mungkin terdengar samar-samar.Membuka kunci pengetahuan tersembunyi? Fungsi ramalan? Tunggu sebentar - kecerdasan buatan itu!

Dari hari-hari awal pengkomputeran komersial, terdapat minat yang besar dalam membangunkan "mesin pemikiran" yang dapat memproses sejumlah besar data dan membuat keputusan berdasarkan analisis itu.

Kepentingan dalam kecerdasan buatan (AI) memukul puncaknya pada pertengahan 1980-an. Pada masa itu, vendor pangkalan data bekerja menghasilkan sistem pengurusan asas pengetahuan (KBMS); vendor lain keluar menggunakan kerangka sistem pakar , atau atau rangka kerja pembangunan aplikasi yang berasaskan AI yang menggunakan teknik-teknik seperti forward-chaining dan back-chaining untuk menasihati pengguna mengenai keputusan; dan rangkaian saraf diletakkan sebagai perkembangan AI yang akan datang.

Kepentingan dalam AI merosot pada awal 1990-an, apabila jangkaan melebihi keupayaan yang tersedia dan kegilaan yang lain, seperti migrasi pelanggan / pelayan dan (tentu saja) pergudangan data, mengambil peringkat tengah.

Sekarang, AI sudah kembali!

Teknik AI berprofil tinggi yang digunakan dalam perlombongan data adalah rangkaian saraf. Jaring neural pada asalnya dibayangkan sebagai model pemprosesan yang akan meniru cara otak manusia menyelesaikan masalah, menggunakan neuron dan pemprosesan yang sangat selari untuk melakukan penyelesaian pola.

Memohon algoritma rangkaian neural ke bidang perisikan perniagaan yang mengendalikan data perlombongan (sekali lagi, ramalan dan "memberitahu saya sesuatu yang menarik" misi) nampaknya perlawanan semulajadi.

Walaupun permainan perlombongan / permainan rangkaian saraf pasti bernilai diperiksa, anda perlu melakukannya dengan teliti. Anda boleh menemui banyak teknologi yang menarik dan menarik yang, di tangan mereka yang tidak memahami algoritma, mungkin akan gagal.

Walau bagaimanapun, dengan pengetahuan dan pendidikan yang betul, anda boleh membuat komitmen penuh untuk membawa pemprosesan jenis ini ke dalam kerangka risikan perniagaan anda sebagai pasangan analisis teknikal untuk analisis perniagaan OLAP yang difokuskan.

Perlombongan dan statistik data

Kawasan perlombongan data yang lebih matang adalah penerapan teknik statistik lanjutan terhadap jumlah besar data dalam gudang data anda. Alat yang berbeza menggunakan pelbagai jenis teknik statistik, disesuaikan dengan bidang tertentu yang mereka cuba alamat.

Tanpa latar belakang statistik, anda mungkin mendapati banyak perlombongan data yang mengelirukan. Anda perlu melakukan banyak kerja untuk melatih algoritma dan membina peraturan untuk memastikan hasil yang tepat dengan dataset yang lebih besar. Walau bagaimanapun, dengan mengandaikan bahawa anda selesa dengan konsep ini, atau mempunyai rakan sekerja yang boleh membantu, berikut adalah beberapa algoritma yang lebih meluas:

  • Algoritma pengklasifikasian: Meramalkan satu atau lebih pembolehubah diskret, berdasarkan yang lain atribut dalam dataset. Dengan menggunakan algoritma klasifikasi, alat perlombongan data boleh melihat sejumlah besar data dan kemudian memberitahu anda bahawa, misalnya, "Pelanggan yang dikekalkan melalui sekurang-kurangnya dua generasi pembelian produk cenderung mempunyai ciri-ciri ini: Mereka mempunyai pendapatan pada kurangnya $ 75,000, dan mereka memiliki rumah mereka sendiri."

  • Algoritma regresi: Ramalkan satu atau lebih pemboleh ubah berterusan, seperti keuntungan atau kerugian, berdasarkan sifat-sifat lain dalam dataset. Algoritma regresi digerakkan melalui maklumat sejarah yang dibentangkan kepada alat perlombongan data "dari masa ke masa," yang lebih dikenali sebagai maklumat siri siri masa .

  • Algoritma segmenasi: Bahagikan data ke dalam kumpulan, atau kelompok, item yang mempunyai sifat yang serupa.

  • Algoritma Persatuan: Cari korelasi antara atribut yang berbeza dalam dataset. Aplikasi algoritma jenis yang paling umum ini mewujudkan peraturan persatuan, yang boleh anda gunakan dalam analisis keranjang pasar. Ambil perhatian bahawa, sebagai contoh, jika pelanggan membeli pakej perisian tertentu, dia mempunyai peluang 65 peratus untuk membeli sekurang-kurangnya dua pek tambahan produk khusus dalam masa dua minggu.

  • Algoritma analisis urutan: Huraikan urutan atau episod yang kerap dalam data, seperti aliran laluan web.

Banyak lagi kaedah. Debukan buku statistik lama dan mulakan bacaan.

Perlombongan data - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...