Isi kandungan:
Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024
Perataan data dalam analisis ramalan adalah, pada dasarnya, cuba mencari "isyarat" dalam "bunyi" oleh membuang mata data yang dianggap "bising". Idea ini adalah untuk mempertajam corak dalam data dan menonjolkan trend yang ditunjuk oleh data.
Implikasi di balik perataan data ialah data terdiri daripada dua bahagian: satu bahagian (terdiri daripada titik data teras ) yang menandakan trend keseluruhan atau trend sebenar, dan sebahagian lain yang sebahagian besarnya terdiri daripada penyimpangan ( bunyi ) - beberapa titik turun naik yang disebabkan oleh beberapa ketidaktentuan dalam data. Perataan data bertujuan untuk menghapuskan bahagian kedua.
Bagaimana untuk menolak bunyi
Perataan data beroperasi pada beberapa andaian:
-
Bahawa turun naik dalam data sepertinya adalah bunyi bising.
-
Bahawa bahagian yang bising dari data adalah jangka pendek.
-
Bahawa turun naik data, tidak kira bagaimana ia berubah, tidak akan menjejaskan trend asas yang diwakili oleh titik data teras.
Kebisingan dalam data cenderung menjadi rawak; turun naiknya tidak akan menjejaskan trend keseluruhan yang diperoleh daripada memeriksa data yang lain. Jadi mengurangkan atau menghapuskan titik data bising boleh menjelaskan trend dan corak sebenar dalam data - berkuat kuasa, meningkatkan nisbah "isyarat-ke-bunyi. "
Dengan syarat anda telah mengenalpasti bunyi dengan betul dan kemudian mengurangkannya, perataan data dapat membantu anda meramalkan titik data diperhatikan seterusnya dengan mengikuti tren utama yang telah anda ketahui dalam data.
Perincian data merujuk kepada majoriti titik data, kedudukan mereka dalam graf, dan apa yang dihasilkan oleh corak yang dihasilkan mengenai trend umum (katakan) harga saham, sama ada arah amnya naik, turun, atau menyamping.
Teknik ini tidak akan tepat meramalkan harga sebenar perdagangan seterusnya untuk stok tertentu - tetapi meramalkan arah aliran umum boleh menghasilkan gambaran yang lebih kuat daripada mengetahui harga sebenar atau turun naiknya.
Ramalan berdasarkan arah aliran umum yang diperoleh dari data terlicin mengandaikan bahawa arah apa saja data yang telah diikuti setakat ini akan terus ke masa depan dengan cara yang selaras dengan trend itu. Di pasaran saham, contohnya, prestasi masa lalu tidak menunjukkan petunjuk prestasi masa depan, tetapi ia pasti dapat menjadi panduan umum untuk pergerakan harga saham masa hadapan.
Kaedah, kelebihan, dan kelemahan pemeliharaan data
Penataan data tidak akan dikelirukan dengan pemasangan model, yang merupakan sebahagian daripada analisis data yang terdiri daripada dua langkah:
-
Cari yang sesuai model yang mewakili data.
-
Pastikan bahawa model itu sesuai dengan data dengan berkesan.
Pemetaan data memberi tumpuan kepada penubuhan arahan asas bagi titik data teras dengan (1) mengabaikan sebarang titik data yang bising dan (2) melukis lengkung yang lebih lancar melalui titik data yang melangkau yang berkerut dan menekankan corak utama - trend - dalam data, tidak kira betapa perlahan kemunculannya. Oleh itu, dalam siri masa berangka, perataan data berfungsi sebagai satu bentuk penapisan.
Perataan data boleh menggunakan mana-mana kaedah berikut:
-
Rawak berjalan didasarkan pada idea bahawa hasil seterusnya, atau titik data masa depan, adalah sisihan rawak dari titik data terakhir yang diketahui atau sekarang.
-
Purata pergerakan adalah purata berjalan mengikut tempoh yang sama. Contohnya ialah pengiraan purata bergerak 200 hari harga saham.
-
Melancarkan eksponen memberikan lebih banyak berat badan, atau kepentingan, kepada mata data baru-baru ini berbanding dengan titik data yang lebih lama.
-
Mudah: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend dan tiada bermusim.
-
Linear: Kaedah ini harus digunakan apabila data siri masa mempunyai garis trend.
-
Bermusim: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend tetapi bermusim.
-
Apa kaedah-kaedah smoothing ini semua mempunyai persamaan ialah mereka menjalankan beberapa proses purata pada beberapa titik data. Rata-rata titik data bersebelahan adalah cara penting untuk menghalang aliran atau corak asas.
Keuntungan melicinkan data
-
Mudah untuk dilaksanakan.
-
Ia membantu mengenal pasti trend.
-
Ia membantu mendedahkan corak dalam data.
-
Ia menghapuskan titik data yang anda telah memutuskan tidak menarik.
-
Ia membantu meramalkan arah umum titik data diperhatikan seterusnya.
-
Ia menjana grafik lancar yang bagus.
Tetapi semuanya mempunyai kelemahan. Kelemahan data melicinkan adalah
-
Ini boleh menghilangkan titik data yang sah yang disebabkan oleh peristiwa yang melampau.
-
Ini mungkin menyebabkan ramalan yang tidak tepat jika data ujian hanya bermusim dan tidak mewakili kenyataan sebenar yang menjana titik data.
-
Ia mungkin beralih atau mencengkam data, terutamanya puncak-puncak, menyebabkan gambar yang terdistorsi mengenai apa yang sedang berlaku.
-
Ia mungkin terdedah kepada gangguan yang ketara daripada penyumber keluar dalam data.
-
Ini mungkin menyebabkan penyelewengan utama dari data asal.
Jika perataan data tidak lebih dari sekadar memberi data ke hadapan, ia boleh menggambarkan secara mendasar salah dengan cara berikut:
-
Ia boleh memperkenalkan kesilapan melalui gangguan yang merawat data terlicin seolah-olah sama dengan yang asal data.
-
Ini boleh menafsirkan tafsiran dengan mengabaikan - dan bersembunyi - risiko yang tertanam dalam data.
-
Ini boleh mengakibatkan kehilangan terperinci dalam data anda - yang merupakan salah satu cara bahawa lengkung terapung mungkin menyimpang jauh dari data asal.
Seberapa serius penyaluran data boleh menjejaskan data anda bergantung pada sifat data di tangan, dan teknik pelicinan yang dilaksanakan pada data tersebut.Sebagai contoh, jika data asal mempunyai lebih banyak di dalamnya, maka perataan data akan membawa kepada pergeseran utama puncak-puncak itu dalam graf yang dilapiskan - kemungkinan besar penyimpangan.
Berikut adalah beberapa mata peringatan untuk diingat semasa anda mendekati pelurusan data:
-
Idea yang baik untuk membandingkan graf smoothed kepada graf yang tidak disentuh yang merancang data asal.
-
Mata data yang dikeluarkan semasa pelepasan data mungkin tidak bunyi; mereka boleh menjadi sah, titik data sebenar yang disebabkan oleh peristiwa jarang-tetapi-nyata.
-
Perataan data boleh membantu dalam kesederhanaan, tetapi berlebihannya boleh mengakibatkan salah nyataan data anda.
Dengan menggunakan penghakiman profesional anda dan kepakaran pengetahuan perniagaan anda, anda boleh menggunakan pelurusan data dengan berkesan. Mengeluarkan bunyi dari data anda - tanpa menjejaskan ketepatan dan kegunaan data asal - sekurang-kurangnya sebanyak satu seni sebagai sains.