Rumah Kewangan Peribadi Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Isi kandungan:

Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024

Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024
Anonim

Perataan data dalam analisis ramalan adalah, pada dasarnya, cuba mencari "isyarat" dalam "bunyi" oleh membuang mata data yang dianggap "bising". Idea ini adalah untuk mempertajam corak dalam data dan menonjolkan trend yang ditunjuk oleh data.

Implikasi di balik perataan data ialah data terdiri daripada dua bahagian: satu bahagian (terdiri daripada titik data teras ) yang menandakan trend keseluruhan atau trend sebenar, dan sebahagian lain yang sebahagian besarnya terdiri daripada penyimpangan ( bunyi ) - beberapa titik turun naik yang disebabkan oleh beberapa ketidaktentuan dalam data. Perataan data bertujuan untuk menghapuskan bahagian kedua.

Bagaimana untuk menolak bunyi

Perataan data beroperasi pada beberapa andaian:

  • Bahawa turun naik dalam data sepertinya adalah bunyi bising.

  • Bahawa bahagian yang bising dari data adalah jangka pendek.

  • Bahawa turun naik data, tidak kira bagaimana ia berubah, tidak akan menjejaskan trend asas yang diwakili oleh titik data teras.

Kebisingan dalam data cenderung menjadi rawak; turun naiknya tidak akan menjejaskan trend keseluruhan yang diperoleh daripada memeriksa data yang lain. Jadi mengurangkan atau menghapuskan titik data bising boleh menjelaskan trend dan corak sebenar dalam data - berkuat kuasa, meningkatkan nisbah "isyarat-ke-bunyi. "

Dengan syarat anda telah mengenalpasti bunyi dengan betul dan kemudian mengurangkannya, perataan data dapat membantu anda meramalkan titik data diperhatikan seterusnya dengan mengikuti tren utama yang telah anda ketahui dalam data.

Perincian data merujuk kepada majoriti titik data, kedudukan mereka dalam graf, dan apa yang dihasilkan oleh corak yang dihasilkan mengenai trend umum (katakan) harga saham, sama ada arah amnya naik, turun, atau menyamping.

Teknik ini tidak akan tepat meramalkan harga sebenar perdagangan seterusnya untuk stok tertentu - tetapi meramalkan arah aliran umum boleh menghasilkan gambaran yang lebih kuat daripada mengetahui harga sebenar atau turun naiknya.

Ramalan berdasarkan arah aliran umum yang diperoleh dari data terlicin mengandaikan bahawa arah apa saja data yang telah diikuti setakat ini akan terus ke masa depan dengan cara yang selaras dengan trend itu. Di pasaran saham, contohnya, prestasi masa lalu tidak menunjukkan petunjuk prestasi masa depan, tetapi ia pasti dapat menjadi panduan umum untuk pergerakan harga saham masa hadapan.

Kaedah, kelebihan, dan kelemahan pemeliharaan data

Penataan data tidak akan dikelirukan dengan pemasangan model, yang merupakan sebahagian daripada analisis data yang terdiri daripada dua langkah:

  1. Cari yang sesuai model yang mewakili data.

  2. Pastikan bahawa model itu sesuai dengan data dengan berkesan.

Pemetaan data memberi tumpuan kepada penubuhan arahan asas bagi titik data teras dengan (1) mengabaikan sebarang titik data yang bising dan (2) melukis lengkung yang lebih lancar melalui titik data yang melangkau yang berkerut dan menekankan corak utama - trend - dalam data, tidak kira betapa perlahan kemunculannya. Oleh itu, dalam siri masa berangka, perataan data berfungsi sebagai satu bentuk penapisan.

Perataan data boleh menggunakan mana-mana kaedah berikut:

  • Rawak berjalan didasarkan pada idea bahawa hasil seterusnya, atau titik data masa depan, adalah sisihan rawak dari titik data terakhir yang diketahui atau sekarang.

  • Purata pergerakan adalah purata berjalan mengikut tempoh yang sama. Contohnya ialah pengiraan purata bergerak 200 hari harga saham.

  • Melancarkan eksponen memberikan lebih banyak berat badan, atau kepentingan, kepada mata data baru-baru ini berbanding dengan titik data yang lebih lama.

    • Mudah: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend dan tiada bermusim.

    • Linear: Kaedah ini harus digunakan apabila data siri masa mempunyai garis trend.

    • Bermusim: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend tetapi bermusim.

Apa kaedah-kaedah smoothing ini semua mempunyai persamaan ialah mereka menjalankan beberapa proses purata pada beberapa titik data. Rata-rata titik data bersebelahan adalah cara penting untuk menghalang aliran atau corak asas.

Keuntungan melicinkan data

  • Mudah untuk dilaksanakan.

  • Ia membantu mengenal pasti trend.

  • Ia membantu mendedahkan corak dalam data.

  • Ia menghapuskan titik data yang anda telah memutuskan tidak menarik.

  • Ia membantu meramalkan arah umum titik data diperhatikan seterusnya.

  • Ia menjana grafik lancar yang bagus.

Tetapi semuanya mempunyai kelemahan. Kelemahan data melicinkan adalah

  • Ini boleh menghilangkan titik data yang sah yang disebabkan oleh peristiwa yang melampau.

  • Ini mungkin menyebabkan ramalan yang tidak tepat jika data ujian hanya bermusim dan tidak mewakili kenyataan sebenar yang menjana titik data.

  • Ia mungkin beralih atau mencengkam data, terutamanya puncak-puncak, menyebabkan gambar yang terdistorsi mengenai apa yang sedang berlaku.

  • Ia mungkin terdedah kepada gangguan yang ketara daripada penyumber keluar dalam data.

  • Ini mungkin menyebabkan penyelewengan utama dari data asal.

Jika perataan data tidak lebih dari sekadar memberi data ke hadapan, ia boleh menggambarkan secara mendasar salah dengan cara berikut:

  • Ia boleh memperkenalkan kesilapan melalui gangguan yang merawat data terlicin seolah-olah sama dengan yang asal data.

  • Ini boleh menafsirkan tafsiran dengan mengabaikan - dan bersembunyi - risiko yang tertanam dalam data.

  • Ini boleh mengakibatkan kehilangan terperinci dalam data anda - yang merupakan salah satu cara bahawa lengkung terapung mungkin menyimpang jauh dari data asal.

Seberapa serius penyaluran data boleh menjejaskan data anda bergantung pada sifat data di tangan, dan teknik pelicinan yang dilaksanakan pada data tersebut.Sebagai contoh, jika data asal mempunyai lebih banyak di dalamnya, maka perataan data akan membawa kepada pergeseran utama puncak-puncak itu dalam graf yang dilapiskan - kemungkinan besar penyimpangan.

Berikut adalah beberapa mata peringatan untuk diingat semasa anda mendekati pelurusan data:

  • Idea yang baik untuk membandingkan graf smoothed kepada graf yang tidak disentuh yang merancang data asal.

  • Mata data yang dikeluarkan semasa pelepasan data mungkin tidak bunyi; mereka boleh menjadi sah, titik data sebenar yang disebabkan oleh peristiwa jarang-tetapi-nyata.

  • Perataan data boleh membantu dalam kesederhanaan, tetapi berlebihannya boleh mengakibatkan salah nyataan data anda.

Dengan menggunakan penghakiman profesional anda dan kepakaran pengetahuan perniagaan anda, anda boleh menggunakan pelurusan data dengan berkesan. Mengeluarkan bunyi dari data anda - tanpa menjejaskan ketepatan dan kegunaan data asal - sekurang-kurangnya sebanyak satu seni sebagai sains.

Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...