Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024
Meringkaskan data, mencari jumlah, dan menghitung purata dan langkah deskriptif lain mungkin bukan baru kepada anda. Apabila anda memerlukan ringkasan anda dalam bentuk data baru, bukannya laporan, proses itu dipanggil pengagregatan. Data agregat boleh menjadi asas untuk pengiraan tambahan, digabungkan dengan dataset lain, digunakan dengan cara apa pun yang digunakan oleh data lain.
Berikut adalah contoh proses agregasi data. Dataset mengandungi maklumat umum mengenai lebih kurang 160, 000 bidang hartanah. Data ini merangkumi pelbagai kegunaan tanah. Bagaimana jika anda ingin melihat purata nilai dinilai untuk tanah dalam setiap kategori guna tanah? Berikut adalah cara anda melakukannya.
Anda akan mencari alat pengagregatan data dalam aplikasi penambangan data anda. Anda mungkin menggunakan carian untuk mencarinya.
Anda akan menambah alat tersebut ke dalam proses dan menyambungkannya ke dataset sumber.
Dalam alat pengagregatan data, anda akan memilih pemboleh ubah pengelompokan. Dalam kes ini, ia adalah pembolehubah Guna Tanah, C_A_CLASS.
Kemudian anda akan menentukan ringkasan yang anda mahu. Untuk mendapatkan purata nilai penilaian tanah, anda akan memilih pemboleh ubah dengan penilaian untuk meringkaskan dan memilih fungsi purata.
Apabila agregasi dijalankan, hasilnya adalah kumpulan data baru, dengan satu baris untuk setiap jenis penggunaan tanah dan pembolehubah baru untuk purata yang dihitung.
Cepat atau lambat, anda perlu mengagregat seluruh dataset. Tetapi apabila anda mahu jumlah keseluruhan atau rata-rata semua data dalam dataset, anda mungkin menghadapi masalah: Apa pembolehubah kumpulan anda? Caranya ialah menggunakan pemboleh ubah dengan nilai malar untuk seluruh dataset. Jadi, buat pembolehubah di mana setiap nilai adalah sama, dan kemudian gunakannya sebagai pemboleh ubah pengelompokan anda.