Isi kandungan:
- Asas tag untuk menerangkan item
- (fikirkannya sebagai satu set perlawanan sempurna - biasanya set kecil) dan
- (fikirkannya sebagai satu set perlawanan yang mungkin - selalunya lebih besar). Inilah pandangan yang lebih dekat:
Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024
Sistem pengesyorkan analisis yang berasaskan kandungan prediktif analisis kebanyakannya sepadan dengan ciri (kata kunci yang ditandai) di antara item yang sama dan profil pengguna untuk membuat cadangan. Apabila pengguna membeli item yang telah menandakan ciri, item dengan ciri yang sepadan dengan item asal akan disyorkan. Lebih banyak ciri yang sepadan, semakin tinggi kebarangkalian pengguna akan menyukai cadangan itu. Gelaran kebarangkalian ini dipanggil ketepatan .
Asas tag untuk menerangkan item
Secara umum, syarikat yang melakukan penjualan (atau pengilang) biasanya menandai butirannya dengan kata kunci. Di laman web Amazon, bagaimanapun, ia agak tipikal tidak pernah melihat teg untuk sebarang item yang dibeli atau dilihat - dan tidak perlu diminta menandai sesuatu item. Pelanggan boleh menyemak perkara yang telah mereka beli, tetapi itu tidak sama dengan penandaan.
Item penandaan boleh menimbulkan cabaran skala untuk kedai seperti Amazon yang mempunyai banyak item. Di samping itu, sesetengah atribut boleh menjadi subyektif dan mungkin ditandakan secara salah, bergantung pada siapa tag tersebut. Satu penyelesaian yang menyelesaikan masalah skala adalah untuk membolehkan pelanggan atau orang awam menanda item tersebut.
Untuk memastikan tag boleh diurus dan tepat, satu set tag yang boleh diterima boleh disediakan oleh tapak web. Hanya apabila bilangan pengguna yang sesuai bersetuju (iaitu menggunakan teg yang sama untuk menerangkan item), apakah tag yang dipersetujui digunakan untuk menggambarkan item tersebut.
Penandaan berasaskan pengguna, bagaimanapun, menyulitkan masalah lain untuk sistem penapisan berasaskan kandungan (dan penapisan kolaboratif):
-
Kredibiliti: Tidak semua pelanggan memberitahu kebenaran (terutamanya dalam talian), dan pengguna yang mempunyai hanya sejarah penarafan yang kecil yang boleh merosakkan data. Di samping itu, sesetengah vendor boleh memberi (atau menggalakkan orang lain untuk memberi) penilaian positif kepada produk mereka sendiri sambil memberikan penarafan negatif kepada produk pesaing mereka.
-
Sempadan: Tidak semua item akan dinilai atau akan mempunyai penilaian yang mencukupi untuk menghasilkan data yang berguna.
-
Ketidakkonsistensian: Tidak semua pengguna menggunakan kata kunci yang sama untuk menandai item, walaupun makna mungkin sama. Selain itu, beberapa sifat boleh bersifat subjektif. Sebagai contoh, satu penonton filem mungkin menganggapnya pendek sementara yang lain mengatakan ia terlalu panjang.
Atribut memerlukan definisi yang jelas. Atribut yang mempunyai batas terlalu sedikit sukar untuk dinilai; Memaksakan terlalu banyak peraturan pada atribut mungkin meminta pengguna untuk melakukan terlalu banyak kerja, yang akan menghalang mereka daripada menandai item.
Penandaan kebanyakan item dalam katalog produk boleh membantu menyelesaikan masalah permulaan sejuk yang melanda penapisan kerjasama.Untuk sementara waktu, bagaimanapun ketepatan cadangan sistem akan menjadi rendah sehingga ia membuat atau memperoleh profil pengguna.
Berikut adalah matriks contoh pelanggan dan barang yang dibeli mereka, menunjukkan contoh penapisan berasaskan kandungan.
Ciri | Ciri 1 | Ciri 2 | Ciri 3 | Ciri 4 | Ciri 5 |
---|---|---|---|---|---|
Item 1 | X | X | |||
Item 3 | X | X | |||
X | Item 4 | X | X | ||
X | Item 5 | X > X | X | ||
Di sini, jika pengguna suka Ciri 2 - dan yang dirakam dalam profilnya - sistem akan mengesyorkan semua item yang mempunyai Ciri 2 di dalamnya: Item 1, Perkara 2, dan Item 4. > Pendekatan ini berfungsi walaupun pengguna tidak pernah membeli atau menyemak item. Sistem ini hanya akan melihat dalam pangkalan data produk untuk sebarang item yang telah ditandakan dengan Ciri 2. Jika (contohnya) pengguna yang mencari filem dengan Audrey Hepburn - dan keutamaan itu muncul dalam profil pengguna - sistem akan mengesyorkan semua filem yang menampilkan Audrey Hepburn kepada pengguna ini. | Contoh ini, bagaimanapun, dengan cepat memperlihatkan batasan teknik penapisan berasaskan kandungan: Pengguna mungkin sudah mengetahui tentang semua filem yang Audrey Hepburn telah masuk atau dapat dengan mudah mengetahui - oleh itu, dari sudut pandangan pengguna itu, sistem tidak mencadangkan sesuatu yang baru atau nilai. | Bagaimana untuk memperbaiki ketepatan dengan maklum balas yang berterusan | Salah satu cara untuk meningkatkan ketepatan cadangan sistem adalah untuk meminta maklum balas kepada pelanggan apabila mungkin. Mengumpul maklum balas pelanggan boleh dilakukan dengan cara yang berbeza, melalui pelbagai saluran. Sesetengah syarikat meminta pelanggan menilai item atau perkhidmatan selepas pembelian. Sistem lain menyediakan pautan gaya-media sosial supaya pelanggan boleh "suka" atau "tidak suka" produk. Interaksi yang berterusan antara |
Bagaimana untuk mengukur keberkesanan cadangan sistem
Kejayaan syor sistem bergantung pada seberapa baiknya ia memenuhi dua kriteria:
ketepatan
(fikirkannya sebagai satu set perlawanan sempurna - biasanya set kecil) dan
ingat
(fikirkannya sebagai satu set perlawanan yang mungkin - selalunya lebih besar). Inilah pandangan yang lebih dekat:
Ketepatan mengukur betapa tepatnya cadangan sistem itu. Ketepatan adalah sukar untuk diukur kerana ia boleh menjadi subjektif dan sukar dikira. Sebagai contoh, apabila pengguna pertama kali melawat laman Amazon, bolehkah Amazon mengetahui sama ada cadangannya adalah pada sasaran? Sesetengah cadangan mungkin bersambung dengan kepentingan pelanggan tetapi pelanggan masih tidak boleh membeli. Keyakinan tertinggi bahawa cadangan adalah tepat dari bukti yang jelas: Pelanggan membeli item tersebut. Sebagai alternatif, sistem ini boleh meminta pengguna untuk menilai cadangannya dengan jelas. Recall mengukur set cadangan mungkin yang baik sistem anda datang dengan. Fikirkan ingat sebagai inventori cadangan yang mungkin, tetapi tidak semuanya adalah cadangan yang sempurna. Pada umumnya terdapat hubungan songsang dengan ketepatan dan pengingat. Iaitu, sebagai penarikan semula naik, ketepatan turun, dan sebaliknya.
-
Sistem yang ideal akan mempunyai ketepatan tinggi dan penarikan balik yang tinggi. Tetapi secara realistik, hasil terbaik adalah untuk menyerang keseimbangan antara kedua-dua mereka. Menekankan ketepatan atau mengingat benar-benar bergantung kepada masalah yang anda cuba selesaikan.