Video: Cara Membuat Slide Isi Presentasi PowerPoint yang Cantik Menawan 2024
Banyak kaedah yang wujud untuk menganalisis data tidak berstruktur untuk inisiatif data besar anda. Dari segi sejarah, teknik ini keluar dari bidang teknikal seperti Pemprosesan Bahasa Asli (NLP), penemuan pengetahuan, perlombongan data, pengambilan maklumat, dan statistik. Analisis teks adalah proses menganalisis teks tidak berstruktur, mengekstrak maklumat yang relevan, dan mengubahnya menjadi maklumat terstruktur yang kemudiannya dapat dimanfaatkan dalam pelbagai cara.
Proses analisis dan pengekstrakan mengambil kesempatan daripada teknik yang berasal dari linguistik komputasi, statistik, dan disiplin sains komputer yang lain.
Kadang-kadang contoh dapat membantu menjelaskan topik rumit. Katakan bahawa anda bekerja untuk jabatan pemasaran dalam sebuah syarikat telefon wayarles. Anda baru sahaja melancarkan dua pelan panggilan baru - Rencana A dan Rencana B - dan anda tidak mendapat pengambilan yang anda inginkan di Rencana A. Teks tidak berstruktur dari nota pusat panggilan mungkin memberi anda sedikit pemahaman tentang mengapa ini berlaku.
Kata-kata yang digariskan memberikan maklumat yang anda perlu fahami mengapa Rancangan A tidak diterima pakai dengan cepat. Sebagai contoh, entiti Rancangan A muncul di seluruh nota pusat panggilan, menunjukkan bahawa laporan menyebut rencana itu.
Syarat-syarat roll-over minit, data 4GB, pelan data, dan mahal adalah bukti bahawa ada masalah dengan minit-minit roll, pelan data, dan harga. Perkataan seperti tidak masuk akal dan bodoh memberikan pandangan tentang sentimen pemanggil, yang dalam hal ini negatif.
Proses analisis teks menggunakan pelbagai algoritma, seperti memahami struktur kalimat, untuk menganalisis teks yang tidak tersusun dan kemudian mengekstrak maklumat, dan mengubah maklumat tersebut ke dalam data berstruktur. Data berstruktur yang diambil dari teks tidak berstruktur digambarkan dalam Jadual 13-1.
Pengecualian | Entiti | Isu | Sentimen |
---|---|---|---|
Cust XYZ | Plan A | Roll-over minutes | Neutral < Pelancaran |
Neutral | Cust XYT | Rencana | XXXX |
Rencana | > Pelan A | Pelan data | Negatif |
Anda mungkin melihat ini dan berkata, "Tetapi saya boleh melihatnya dengan melihat rekod pusat panggilan. "Bagaimanapun, ini hanyalah subset kecil dari maklumat yang direkam oleh ribuan agen pusat panggilan. Setiap ejen individu tidak mungkin merasakan trend yang luas mengenai masalah dengan setiap pelan yang ditawarkan oleh syarikat. | Ejen tidak mempunyai masa atau keperluan untuk berkongsi maklumat ini di semua agen pusat panggilan lain yang mungkin mendapat nombor panggilan yang sama mengenai Rencana A. Walau bagaimanapun, selepas maklumat ini diagregatkan dan diproses menggunakan algoritma analisis teks, trend boleh muncul dari data tidak berstruktur ini. Itulah yang menjadikan analitik teks begitu kuat. | Carian adalah tentang mendapatkan dokumen berdasarkan kepada pengguna akhir yang sudah tahu yang mereka cari. Analisis teks adalah mengenai penemuan maklumat. Walaupun analisis teks berbeza daripada carian, ia boleh menambah teknik carian. Sebagai contoh, analitik teks digabungkan dengan carian boleh digunakan untuk memberikan pengkategorian atau klasifikasi dokumen yang lebih baik dan menghasilkan abstrak atau ringkasan dokumen. | Terdapat empat teknologi: pertanyaan, pertambangan data, carian, dan analisis teks. Di sebelah kiri jadual adalah pertanyaan dan carian, yang kedua-duanya mengenai pengambilan semula. Sebagai contoh, pengguna akhir dapat menanyakan pangkalan data untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan perkhidmatan syarikat pada bulan lalu. |
Pertanyaan itu akan mengembalikan satu nombor. Hanya dengan bertanya lebih banyak dan pertanyaan yang berbeza akan pengguna akhir mendapatkan maklumat yang diperlukan untuk menentukan mengapa pelanggan meninggalkan. Begitu juga, carian kata kunci membolehkan pengguna akhir mencari dokumen yang mengandungi nama-nama pesaing syarikat. Carian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen-dokumen itu, pengguna akhir akan datang dengan jawapan yang relevan. | Semula | Insight | Terstruktur |
Pertanyaan: Mengembalikan data
Penambangan data: Wawasan dari data berstruktur
Tidak terstruktur
Teknologi pada kepulangan kiri maklumat dan memerlukan interaksi manusia untuk mensintesis dan menganalisis maklumat tersebut. Teknologi dalam bidang penambangan data dan analisis teks - memberikan wawasan lebih cepat. Diharapkan, nilai analisis teks kepada organisasi anda menjadi jelas.