Rumah Kewangan Peribadi Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Isi kandungan:

Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024

Video: Building Apps for Mobile, Gaming, IoT, and more using AWS DynamoDB by Rick Houlihan 2024
Anonim

Perataan data dalam analisis ramalan adalah, pada dasarnya, cuba mencari "isyarat" dalam "bunyi" oleh membuang mata data yang dianggap "bising". Idea ini adalah untuk mempertajam corak dalam data dan menonjolkan trend yang ditunjuk oleh data.

Implikasi di balik perataan data ialah data terdiri daripada dua bahagian: satu bahagian (terdiri daripada titik data teras ) yang menandakan trend keseluruhan atau trend sebenar, dan sebahagian lain yang sebahagian besarnya terdiri daripada penyimpangan ( bunyi ) - beberapa titik turun naik yang disebabkan oleh beberapa ketidaktentuan dalam data. Perataan data bertujuan untuk menghapuskan bahagian kedua.

Bagaimana untuk menolak bunyi

Perataan data beroperasi pada beberapa andaian:

  • Bahawa turun naik dalam data sepertinya adalah bunyi bising.

  • Bahawa bahagian yang bising dari data adalah jangka pendek.

  • Bahawa turun naik data, tidak kira bagaimana ia berubah, tidak akan menjejaskan trend asas yang diwakili oleh titik data teras.

Kebisingan dalam data cenderung menjadi rawak; turun naiknya tidak akan menjejaskan trend keseluruhan yang diperoleh daripada memeriksa data yang lain. Jadi mengurangkan atau menghapuskan titik data bising boleh menjelaskan trend dan corak sebenar dalam data - berkuat kuasa, meningkatkan nisbah "isyarat-ke-bunyi. "

Dengan syarat anda telah mengenalpasti bunyi dengan betul dan kemudian mengurangkannya, perataan data dapat membantu anda meramalkan titik data diperhatikan seterusnya dengan mengikuti tren utama yang telah anda ketahui dalam data.

Perincian data merujuk kepada majoriti titik data, kedudukan mereka dalam graf, dan apa yang dihasilkan oleh corak yang dihasilkan mengenai trend umum (katakan) harga saham, sama ada arah amnya naik, turun, atau menyamping.

Teknik ini tidak akan tepat meramalkan harga sebenar perdagangan seterusnya untuk stok tertentu - tetapi meramalkan arah aliran umum boleh menghasilkan gambaran yang lebih kuat daripada mengetahui harga sebenar atau turun naiknya.

Ramalan berdasarkan arah aliran umum yang diperoleh dari data terlicin mengandaikan bahawa arah apa saja data yang telah diikuti setakat ini akan terus ke masa depan dengan cara yang selaras dengan trend itu. Di pasaran saham, contohnya, prestasi masa lalu tidak menunjukkan petunjuk prestasi masa depan, tetapi ia pasti dapat menjadi panduan umum untuk pergerakan harga saham masa hadapan.

Kaedah, kelebihan, dan kelemahan pemeliharaan data

Penataan data tidak akan dikelirukan dengan pemasangan model, yang merupakan sebahagian daripada analisis data yang terdiri daripada dua langkah:

  1. Cari yang sesuai model yang mewakili data.

  2. Pastikan bahawa model itu sesuai dengan data dengan berkesan.

Pemetaan data memberi tumpuan kepada penubuhan arahan asas bagi titik data teras dengan (1) mengabaikan sebarang titik data yang bising dan (2) melukis lengkung yang lebih lancar melalui titik data yang melangkau yang berkerut dan menekankan corak utama - trend - dalam data, tidak kira betapa perlahan kemunculannya. Oleh itu, dalam siri masa berangka, perataan data berfungsi sebagai satu bentuk penapisan.

Perataan data boleh menggunakan mana-mana kaedah berikut:

  • Rawak berjalan didasarkan pada idea bahawa hasil seterusnya, atau titik data masa depan, adalah sisihan rawak dari titik data terakhir yang diketahui atau sekarang.

  • Purata pergerakan adalah purata berjalan mengikut tempoh yang sama. Contohnya ialah pengiraan purata bergerak 200 hari harga saham.

  • Melancarkan eksponen memberikan lebih banyak berat badan, atau kepentingan, kepada mata data baru-baru ini berbanding dengan titik data yang lebih lama.

    • Mudah: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend dan tiada bermusim.

    • Linear: Kaedah ini harus digunakan apabila data siri masa mempunyai garis trend.

    • Bermusim: Kaedah ini harus digunakan apabila data siri masa tidak mempunyai trend tetapi bermusim.

Apa kaedah-kaedah smoothing ini semua mempunyai persamaan ialah mereka menjalankan beberapa proses purata pada beberapa titik data. Rata-rata titik data bersebelahan adalah cara penting untuk menghalang aliran atau corak asas.

Keuntungan melicinkan data

  • Mudah untuk dilaksanakan.

  • Ia membantu mengenal pasti trend.

  • Ia membantu mendedahkan corak dalam data.

  • Ia menghapuskan titik data yang anda telah memutuskan tidak menarik.

  • Ia membantu meramalkan arah umum titik data diperhatikan seterusnya.

  • Ia menjana grafik lancar yang bagus.

Tetapi semuanya mempunyai kelemahan. Kelemahan data melicinkan adalah

  • Ini boleh menghilangkan titik data yang sah yang disebabkan oleh peristiwa yang melampau.

  • Ini mungkin menyebabkan ramalan yang tidak tepat jika data ujian hanya bermusim dan tidak mewakili kenyataan sebenar yang menjana titik data.

  • Ia mungkin beralih atau mencengkam data, terutamanya puncak-puncak, menyebabkan gambar yang terdistorsi mengenai apa yang sedang berlaku.

  • Ia mungkin terdedah kepada gangguan yang ketara daripada penyumber keluar dalam data.

  • Ini mungkin menyebabkan penyelewengan utama dari data asal.

Jika perataan data tidak lebih dari sekadar memberi data ke hadapan, ia boleh menggambarkan secara mendasar salah dengan cara berikut:

  • Ia boleh memperkenalkan kesilapan melalui gangguan yang merawat data terlicin seolah-olah sama dengan yang asal data.

  • Ini boleh menafsirkan tafsiran dengan mengabaikan - dan bersembunyi - risiko yang tertanam dalam data.

  • Ini boleh mengakibatkan kehilangan terperinci dalam data anda - yang merupakan salah satu cara bahawa lengkung terapung mungkin menyimpang jauh dari data asal.

Seberapa serius penyaluran data boleh menjejaskan data anda bergantung pada sifat data di tangan, dan teknik pelicinan yang dilaksanakan pada data tersebut.Sebagai contoh, jika data asal mempunyai lebih banyak di dalamnya, maka perataan data akan membawa kepada pergeseran utama puncak-puncak itu dalam graf yang dilapiskan - kemungkinan besar penyimpangan.

Berikut adalah beberapa mata peringatan untuk diingat semasa anda mendekati pelurusan data:

  • Idea yang baik untuk membandingkan graf smoothed kepada graf yang tidak disentuh yang merancang data asal.

  • Mata data yang dikeluarkan semasa pelepasan data mungkin tidak bunyi; mereka boleh menjadi sah, titik data sebenar yang disebabkan oleh peristiwa jarang-tetapi-nyata.

  • Perataan data boleh membantu dalam kesederhanaan, tetapi berlebihannya boleh mengakibatkan salah nyataan data anda.

Dengan menggunakan penghakiman profesional anda dan kepakaran pengetahuan perniagaan anda, anda boleh menggunakan pelurusan data dengan berkesan. Mengeluarkan bunyi dari data anda - tanpa menjejaskan ketepatan dan kegunaan data asal - sekurang-kurangnya sebanyak satu seni sebagai sains.

Bagaimana Menggunakan Pengelupasan Data dalam Analytics Predictive - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...