Rumah Kewangan Peribadi Batasan Data dalam Analisis ramalan - dummies

Batasan Data dalam Analisis ramalan - dummies

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024
Anonim

Seperti banyak aspek dari sistem perniagaan mana pun, data adalah penciptaan manusia - jadi ia sesuai untuk mempunyai beberapa kebarangkalian apabila anda terlebih dahulu dapatkannya. Berikut adalah gambaran mengenai beberapa batasan yang mungkin anda hadapi:

  • Data mungkin tidak lengkap. Nilai yang hilang, walaupun kekurangan bahagian atau sebahagian besar data, boleh mengehadkan kebolehgunaannya.

    Sebagai contoh, data anda mungkin hanya meliputi satu atau dua keadaan set yang lebih besar yang anda cuba modelkan - seperti apabila model yang dibina untuk menganalisis prestasi pasaran saham hanya mempunyai data yang tersedia dari 5 tahun yang lalu, yang memakan kedua-duanya data dan model ke arah andaian pasaran lembu.

    Ketika pasaran mengalami pembetulan yang membawa kepada pasaran beruang, model gagal menyesuaikan diri - hanya kerana ia tidak terlatih dan diuji dengan data yang mewakili pasaran beruang.

    Pastikan anda melihat tempoh masa yang memberi gambaran lengkap tentang turun naik semula data anda; data anda tidak boleh dihadkan oleh bermusim .

  • Jika anda menggunakan data daripada tinjauan, ingat bahawa orang tidak selalu memberikan maklumat yang tepat. Tidak semua orang akan menjawab dengan jujur ​​tentang (nyatakan) berapa kali mereka berolahraga - atau berapa banyak minuman beralkohol yang mereka makan - seminggu. Orang mungkin tidak jujur ​​seperti kesedaran diri sendiri, tetapi data masih condong.

  • Data yang dikumpul dari sumber yang berbeza boleh berbeza dalam kualiti dan format. Data yang dikumpul dari pelbagai sumber seperti tinjauan, e-mel, borang kemasukan data, dan laman web syarikat akan mempunyai atribut dan struktur yang berbeza. Data dari pelbagai sumber mungkin tidak mempunyai banyak keserasian di antara bidang data. Data sedemikian memerlukan pra-proses utama sebelum ia siap-siap. Sidebar yang disertakan memberikan contoh.

Data yang dikumpulkan dari pelbagai sumber mungkin mempunyai perbezaan dalam pemformatan, rekod pendua dan ketidakkonsistenan merentas medan data yang digabungkan. Berharap untuk menghabiskan masa yang lama membersihkan data tersebut - dan lebih lama lagi mengesahkan kebolehpercayaannya.

Untuk menentukan batasan data anda, pastikan:

  • Sahkan semua pembolehubah yang akan anda gunakan dalam model anda.

  • Menilai skop data, terutamanya dari masa ke masa, jadi model anda boleh mengelakkan perangkap bermusim.

  • Semak nilai yang hilang, mengenal pasti mereka, dan menilai impak mereka terhadap analisis keseluruhan.

  • Berhati-hati untuk nilai yang melampau (outlier) dan tentukan sama ada untuk memasukkannya dalam analisis.

  • Sahkan bahawa kumpulan data latihan dan ujian cukup besar.

  • Pastikan jenis data (bilangan bulat, nilai perpuluhan, atau aksara, dan sebagainya) adalah betul dan tetapkan batas atas dan bawah kemungkinan nilai.

  • Beri perhatian lebih kepada integrasi data apabila data anda berasal dari pelbagai sumber.

Pastikan anda memahami sumber data anda dan impaknya terhadap kualiti keseluruhan data anda.

  • Pilih dataset yang berkaitan yang mewakili seluruh penduduk.

  • Pilih parameter yang sesuai untuk analisis anda.

Walaupun selepas semua penjagaan dan perhatian ini, jangan terkejut sekiranya data anda masih memerlukan proses sebelum anda boleh menganalisis dengan tepat. Preprocessing sering mengambil masa yang lama dan usaha yang signifikan kerana ia perlu menangani beberapa isu yang berkaitan dengan data asal - isu-isu ini termasuk:

  • Apa-apa nilai yang hilang dari data.

  • Sebarang ketidakkonsistenan dan / atau kesilapan yang ada dalam data.

  • Sebarang pendua atau penglihatan dalam data.

  • Mana-mana normalisasi atau transformasi data lain.

  • Sebarang data yang diperolehi diperlukan untuk analisis.

Batasan Data dalam Analisis ramalan - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...