Video: Recommender Systems 2024
Sebelum melakukan apa-apa jenis analisis statistik, pemahaman sifat data yang dianalisis adalah penting. Anda boleh menggunakan EDA untuk mengenal pasti sifat dataset untuk menentukan kaedah statistik yang paling sesuai untuk digunakan pada data. Anda boleh menyiasat beberapa jenis sifat dengan teknik EDA, termasuk yang berikut:
-
Pusat data
-
Penyebaran di antara ahli-ahli data
-
Skewness data
-
Pengagihan kebarangkalian data berikut
-
Hubungan antara unsur-unsur dalam dataset
-
Sama atau tidak parameter data tetap dari masa ke masa < Kehadiran outliers dalam data
-
Satu lagi soalan utama soalan EDA adalah "Adakah data sesuai dengan andaian? "Mengenal pasti sifat-sifat sesuatu dataset sangat penting, kerana banyak prosedur statistik sensitif terhadap andaian yang anda buat mengenai data.