Rumah Kewangan Peribadi Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Video: Cara Membuat Slide Isi Presentasi PowerPoint yang Cantik Menawan 2024

Video: Cara Membuat Slide Isi Presentasi PowerPoint yang Cantik Menawan 2024
Anonim

Banyak kaedah yang wujud untuk menganalisis data tidak berstruktur untuk inisiatif data besar anda. Dari segi sejarah, teknik ini keluar dari bidang teknikal seperti Pemprosesan Bahasa Asli (NLP), penemuan pengetahuan, perlombongan data, pengambilan maklumat, dan statistik. Analisis teks adalah proses menganalisis teks tidak berstruktur, mengekstrak maklumat yang relevan, dan mengubahnya menjadi maklumat terstruktur yang kemudiannya dapat dimanfaatkan dalam pelbagai cara.

Proses analisis dan pengekstrakan mengambil kesempatan daripada teknik yang berasal dari linguistik komputasi, statistik, dan disiplin sains komputer yang lain.

Kadang-kadang contoh dapat membantu menjelaskan topik rumit. Katakan bahawa anda bekerja untuk jabatan pemasaran dalam sebuah syarikat telefon wayarles. Anda baru sahaja melancarkan dua pelan panggilan baru - Rencana A dan Rencana B - dan anda tidak mendapat pengambilan yang anda inginkan di Rencana A. Teks tidak berstruktur dari nota pusat panggilan mungkin memberi anda sedikit pemahaman tentang mengapa ini berlaku.

Kata-kata yang digariskan memberikan maklumat yang anda perlu fahami mengapa Rancangan A tidak diterima pakai dengan cepat. Sebagai contoh, entiti Rancangan A muncul di seluruh nota pusat panggilan, menunjukkan bahawa laporan menyebut rencana itu.

Syarat-syarat roll-over minit, data 4GB, pelan data, dan mahal adalah bukti bahawa ada masalah dengan minit-minit roll, pelan data, dan harga. Perkataan seperti tidak masuk akal dan bodoh memberikan pandangan tentang sentimen pemanggil, yang dalam hal ini negatif.

Proses analisis teks menggunakan pelbagai algoritma, seperti memahami struktur kalimat, untuk menganalisis teks yang tidak tersusun dan kemudian mengekstrak maklumat, dan mengubah maklumat tersebut ke dalam data berstruktur. Data berstruktur yang diambil dari teks tidak berstruktur digambarkan dalam Jadual 13-1.

Pengecualian Entiti Isu Sentimen
Cust XYZ Plan A Roll-over minutes Neutral < Pelancaran
Neutral Cust XYT Rencana XXXX
Rencana > Pelan A Pelan data Negatif
Anda mungkin melihat ini dan berkata, "Tetapi saya boleh melihatnya dengan melihat rekod pusat panggilan. "Bagaimanapun, ini hanyalah subset kecil dari maklumat yang direkam oleh ribuan agen pusat panggilan. Setiap ejen individu tidak mungkin merasakan trend yang luas mengenai masalah dengan setiap pelan yang ditawarkan oleh syarikat. Ejen tidak mempunyai masa atau keperluan untuk berkongsi maklumat ini di semua agen pusat panggilan lain yang mungkin mendapat nombor panggilan yang sama mengenai Rencana A. Walau bagaimanapun, selepas maklumat ini diagregatkan dan diproses menggunakan algoritma analisis teks, trend boleh muncul dari data tidak berstruktur ini. Itulah yang menjadikan analitik teks begitu kuat. Carian adalah tentang mendapatkan dokumen berdasarkan kepada pengguna akhir yang sudah tahu yang mereka cari. Analisis teks adalah mengenai penemuan maklumat. Walaupun analisis teks berbeza daripada carian, ia boleh menambah teknik carian. Sebagai contoh, analitik teks digabungkan dengan carian boleh digunakan untuk memberikan pengkategorian atau klasifikasi dokumen yang lebih baik dan menghasilkan abstrak atau ringkasan dokumen. Terdapat empat teknologi: pertanyaan, pertambangan data, carian, dan analisis teks. Di sebelah kiri jadual adalah pertanyaan dan carian, yang kedua-duanya mengenai pengambilan semula. Sebagai contoh, pengguna akhir dapat menanyakan pangkalan data untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan perkhidmatan syarikat pada bulan lalu.
Pertanyaan itu akan mengembalikan satu nombor. Hanya dengan bertanya lebih banyak dan pertanyaan yang berbeza akan pengguna akhir mendapatkan maklumat yang diperlukan untuk menentukan mengapa pelanggan meninggalkan. Begitu juga, carian kata kunci membolehkan pengguna akhir mencari dokumen yang mengandungi nama-nama pesaing syarikat. Carian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen-dokumen itu, pengguna akhir akan datang dengan jawapan yang relevan. Semula Insight Terstruktur

Pertanyaan: Mengembalikan data

Penambangan data: Wawasan dari data berstruktur

Tidak terstruktur

Teknologi pada kepulangan kiri maklumat dan memerlukan interaksi manusia untuk mensintesis dan menganalisis maklumat tersebut. Teknologi dalam bidang penambangan data dan analisis teks - memberikan wawasan lebih cepat. Diharapkan, nilai analisis teks kepada organisasi anda menjadi jelas.

Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...