Rumah Kewangan Peribadi Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Video: Cara Membuat Slide Isi Presentasi PowerPoint yang Cantik Menawan 2024

Video: Cara Membuat Slide Isi Presentasi PowerPoint yang Cantik Menawan 2024
Anonim

Banyak kaedah yang wujud untuk menganalisis data tidak berstruktur untuk inisiatif data besar anda. Dari segi sejarah, teknik ini keluar dari bidang teknikal seperti Pemprosesan Bahasa Asli (NLP), penemuan pengetahuan, perlombongan data, pengambilan maklumat, dan statistik. Analisis teks adalah proses menganalisis teks tidak berstruktur, mengekstrak maklumat yang relevan, dan mengubahnya menjadi maklumat terstruktur yang kemudiannya dapat dimanfaatkan dalam pelbagai cara.

Proses analisis dan pengekstrakan mengambil kesempatan daripada teknik yang berasal dari linguistik komputasi, statistik, dan disiplin sains komputer yang lain.

Kadang-kadang contoh dapat membantu menjelaskan topik rumit. Katakan bahawa anda bekerja untuk jabatan pemasaran dalam sebuah syarikat telefon wayarles. Anda baru sahaja melancarkan dua pelan panggilan baru - Rencana A dan Rencana B - dan anda tidak mendapat pengambilan yang anda inginkan di Rencana A. Teks tidak berstruktur dari nota pusat panggilan mungkin memberi anda sedikit pemahaman tentang mengapa ini berlaku.

Kata-kata yang digariskan memberikan maklumat yang anda perlu fahami mengapa Rancangan A tidak diterima pakai dengan cepat. Sebagai contoh, entiti Rancangan A muncul di seluruh nota pusat panggilan, menunjukkan bahawa laporan menyebut rencana itu.

Syarat-syarat roll-over minit, data 4GB, pelan data, dan mahal adalah bukti bahawa ada masalah dengan minit-minit roll, pelan data, dan harga. Perkataan seperti tidak masuk akal dan bodoh memberikan pandangan tentang sentimen pemanggil, yang dalam hal ini negatif.

Proses analisis teks menggunakan pelbagai algoritma, seperti memahami struktur kalimat, untuk menganalisis teks yang tidak tersusun dan kemudian mengekstrak maklumat, dan mengubah maklumat tersebut ke dalam data berstruktur. Data berstruktur yang diambil dari teks tidak berstruktur digambarkan dalam Jadual 13-1.

Pengecualian Entiti Isu Sentimen
Cust XYZ Plan A Roll-over minutes Neutral < Pelancaran
Neutral Cust XYT Rencana XXXX
Rencana > Pelan A Pelan data Negatif
Anda mungkin melihat ini dan berkata, "Tetapi saya boleh melihatnya dengan melihat rekod pusat panggilan. "Bagaimanapun, ini hanyalah subset kecil dari maklumat yang direkam oleh ribuan agen pusat panggilan. Setiap ejen individu tidak mungkin merasakan trend yang luas mengenai masalah dengan setiap pelan yang ditawarkan oleh syarikat. Ejen tidak mempunyai masa atau keperluan untuk berkongsi maklumat ini di semua agen pusat panggilan lain yang mungkin mendapat nombor panggilan yang sama mengenai Rencana A. Walau bagaimanapun, selepas maklumat ini diagregatkan dan diproses menggunakan algoritma analisis teks, trend boleh muncul dari data tidak berstruktur ini. Itulah yang menjadikan analitik teks begitu kuat. Carian adalah tentang mendapatkan dokumen berdasarkan kepada pengguna akhir yang sudah tahu yang mereka cari. Analisis teks adalah mengenai penemuan maklumat. Walaupun analisis teks berbeza daripada carian, ia boleh menambah teknik carian. Sebagai contoh, analitik teks digabungkan dengan carian boleh digunakan untuk memberikan pengkategorian atau klasifikasi dokumen yang lebih baik dan menghasilkan abstrak atau ringkasan dokumen. Terdapat empat teknologi: pertanyaan, pertambangan data, carian, dan analisis teks. Di sebelah kiri jadual adalah pertanyaan dan carian, yang kedua-duanya mengenai pengambilan semula. Sebagai contoh, pengguna akhir dapat menanyakan pangkalan data untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan perkhidmatan syarikat pada bulan lalu.
Pertanyaan itu akan mengembalikan satu nombor. Hanya dengan bertanya lebih banyak dan pertanyaan yang berbeza akan pengguna akhir mendapatkan maklumat yang diperlukan untuk menentukan mengapa pelanggan meninggalkan. Begitu juga, carian kata kunci membolehkan pengguna akhir mencari dokumen yang mengandungi nama-nama pesaing syarikat. Carian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen-dokumen itu, pengguna akhir akan datang dengan jawapan yang relevan. Semula Insight Terstruktur

Pertanyaan: Mengembalikan data

Penambangan data: Wawasan dari data berstruktur

Tidak terstruktur

Teknologi pada kepulangan kiri maklumat dan memerlukan interaksi manusia untuk mensintesis dan menganalisis maklumat tersebut. Teknologi dalam bidang penambangan data dan analisis teks - memberikan wawasan lebih cepat. Diharapkan, nilai analisis teks kepada organisasi anda menjadi jelas.

Teks Analytics untuk Data Besar Tidak Terstruktur - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...