Rumah Kewangan Peribadi Hilang Nilai dalam Data Anda - dummies

Hilang Nilai dalam Data Anda - dummies

Isi kandungan:

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025
Anonim

Salah satu masalah data yang paling kerap dan tersisih untuk ditangani ialah kehilangan data. Fail boleh menjadi tidak lengkap kerana rekod jatuh atau peranti simpanan diisi. Atau medan data tertentu mungkin tidak mengandungi data untuk beberapa rekod. Yang pertama masalah ini boleh didiagnosis dengan hanya mengesahkan tuduhan rekod untuk fail. Masalah kedua adalah lebih sukar untuk ditangani.

Untuk meletakkannya dalam istilah yang mudah, apabila anda mencari medan yang mengandungi nilai yang hilang, anda mempunyai dua pilihan:

  • Abaikannya.

  • Tetapkan sesuatu di medan.

Mengabaikan masalah

Dalam beberapa kes, anda mungkin mencari medan tunggal dengan sejumlah besar nilai yang hilang. Jika ya, perkara yang paling mudah dilakukan adalah mengabaikan bidang. Jangan masukkannya dalam analisis anda.

Satu lagi cara untuk mengabaikan masalah adalah mengabaikan rekod. Hanya padamkan rekod yang mengandungi data yang hilang. Ini mungkin masuk akal jika terdapat hanya beberapa rekod penyangak. Tetapi jika terdapat banyak medan data yang mengandungi jumlah nilai penting yang hilang, pendekatan ini mungkin mengecilkan kiraan rekod anda ke tahap yang tidak dapat diterima.

Satu lagi perkara yang perlu diperhatikan sebelum sekadar memadamkan rekod adalah sebarang tanda corak. Sebagai contoh, andaikan menganalisis satu set data yang berkaitan dengan baki kad kredit di seluruh negara. Anda mungkin mendapati sejumlah besar rekod yang menunjukkan $ 0. 00 baki (mungkin kira-kira separuh rekod). Ini bukannya merupakan indikasi kehilangan data. Walau bagaimanapun, jika semua rekod dari, katakan, California menunjukkan $ 0. 00 baki, yang menunjukkan masalah nilai yang berpotensi hilang. Dan ia bukanlah satu yang akan dipecahkan dengan berguna dengan memotong semua rekod dari negara terbesar di negara ini. Dalam kes ini, ia mungkin merupakan isu sistem dan menunjukkan bahawa fail baru harus dibuat.

Secara umum, memadam rekod adalah penyelesaian yang mudah, tetapi bukan ideal, untuk masalah kehilangan nilai. Sekiranya masalahnya agak kecil dan tidak ada corak yang ketara terhadap ketinggalan, maka mungkin baik untuk menghalang rekod yang menyerang dan teruskan. Tetapi kerap pendekatan yang lebih tinggi diperlukan.

Mengisi data yang hilang

Mengisi jumlah data yang hilang untuk membuat tebakan terdidik tentang apa yang akan berlaku dalam bidang itu. Terdapat cara yang baik dan buruk untuk melakukan ini. Satu pendekatan yang mudah (tetapi buruk) adalah untuk menggantikan nilai-nilai yang hilang dengan purata yang tidak hilang. Dalam bidang bukan berangka, anda mungkin tergoda untuk mengisi rekod yang hilang dengan nilai yang paling umum dalam rekod lain (mod).

Pendekatan ini, malangnya, masih sering digunakan dalam beberapa aplikasi perniagaan.Tetapi mereka dianggap secara meluas oleh ahli statistik sebagai idea buruk. Untuk satu perkara, keseluruhan titik melakukan analisis statistik adalah untuk mencari data yang membezakan satu hasil daripada yang lain. Dengan menggantikan semua rekod yang hilang dengan nilai yang sama, anda tidak membezakan apa-apa.

Pendekatan yang lebih tinggi adalah untuk mencari cara untuk meramalkan dengan cara yang bermakna apa nilai harus diisi pada setiap rekod yang hilang nilai. Ini melibatkan melihat rekod lengkap dan cuba mencari petunjuk tentang apa yang mungkin hilang.

Anggap anda menganalisis fail demografi untuk meramalkan kemungkinan pembeli salah satu produk anda. Dalam fail yang anda ada, antara bidang lain, maklumat mengenai status perkahwinan, bilangan anak, dan jumlah kereta. Atas sebab tertentu, bilangan medan autos hilang dalam satu pertiga rekod.

Dengan menganalisis dua bidang lain - status perkahwinan dan bilangan anak - anda boleh menemui beberapa pola. Orang tunggal cenderung mempunyai satu kereta. Orang yang berkahwin tanpa anak cenderung mempunyai dua kereta. Orang yang berkahwin dengan lebih daripada seorang kanak-kanak mungkin lebih berkemungkinan mempunyai tiga kereta. Dengan cara ini, anda boleh meneka nilai yang hilang dengan cara yang sebenarnya membezakan rekod. Lebih lanjut mengenai pendekatan ini akan datang.

Terdapat istilah am dalam statistik dan pemprosesan data yang merujuk kepada data yang dipersoalkan. Istilah bising digunakan untuk menggambarkan data yang tidak boleh dipercayai, korup, atau sebaliknya kurang daripada murni. Data yang hilang adalah satu contoh sahaja. Penerangan mengenai teknik untuk membersihkan data bising secara amnya adalah di luar skop buku ini. Malah, ini adalah bidang penyelidikan yang aktif dalam teori statistik. Hakikat bahawa semua bunyi bising tidak mudah dilihat kerana nilai-nilai yang hilang menjadikannya menyusahkan untuk ditangani.

Hilang Nilai dalam Data Anda - dummies

Pilihan Editor

Cara Mengurus Masks Vektor dalam Photoshop CS6 - maya

Cara Mengurus Masks Vektor dalam Photoshop CS6 - maya

Topeng vektor membolehkan anda membuat bentuk yang bermata halus dalam Adobe Photoshop CS6. Berikut adalah petua topeng vektor. Anda boleh melakukan tugas-tugas berikut: Edit path mask vektor. Gunakan alat pen dan Alat Pemilihan Langsung. Tambah pelbagai bentuk atau laluan ke topeng vektor yang ada. Apa yang anda perlu lakukan ialah ...

Cara Manipulate Bentuk di Adobe Photoshop CS6 - dummies

Cara Manipulate Bentuk di Adobe Photoshop CS6 - dummies

Adobe Photoshop Creative Suite 6 mempunyai beberapa alat yang anda boleh digunakan untuk memanipulasi bentuk yang telah anda buat. Dengan menggunakan pelbagai alat yang ditawarkan di Photoshop, anda dapat dengan cepat mencapai matlamat projek anda. Berikut ialah senarai cepat banyak perkara yang boleh anda lakukan: Pindah: Pilih alat Pindah (tekan V) untuk memindahkan bentuk ...

Bagaimana Menggabungkan Saluran di Photoshop CS6 - dummies

Bagaimana Menggabungkan Saluran di Photoshop CS6 - dummies

Anda boleh menggabungkan saluran menjadi satu imej dalam Photoshop CS6. Saluran mesti dibuka sebagai imej yang berasingan, dalam mod skala kelabu, dan mempunyai dimensi piksel yang sama. Anda boleh menggabungkan saluran hanya apabila imej mereka diratakan dan tidak mempunyai lapisan. Menggabungkan saluran warna boleh menghasilkan beberapa kesan khas yang unik. Contohnya, dengan tidak sepadan dengan ...

Pilihan Editor

Cara Membuat Yammer Group - dummies

Cara Membuat Yammer Group - dummies

Yammer adalah alat yang hebat untuk berkolaborasi di tempat kerja. Itu bererti orang berkumpul dan membuang idea, membuat keputusan, atau bekerjasama. Tidak ada cara yang lebih baik untuk melakukannya daripada membuat kumpulan. Yammer menjadikannya mudah.

Cara Membuat Profil Yammer - dummies

Cara Membuat Profil Yammer - dummies

Yammer memudahkan untuk terus berhubung dengan rakan dan rakan sekerja anda. Apa yang anda perlukan adalah profil, dan anda akan dalam perjalanan untuk berkolaborasi untuk semua keperluan perniagaan anda. Hanya ikuti langkah-langkah berikut:

Cara Berkesan Gunakan SlideShare - dummies

Cara Berkesan Gunakan SlideShare - dummies

Ambil perhatian penonton anda dari awal menggunakan SlideShare. SlideShare, dan Internet pada umumnya, bersaing untuk penonton setiap saat. Mencari sesuatu yang lain untuk dilihat atau dibaca hanya satu klik sahaja. Oleh itu, gunakan warna-warna dan imej yang menarik dan kuat. Berikut adalah contoh hebat: Sumber: slideshare. bersih Selain itu, simpan mesej anda dengan mudah, jelas, ...

Pilihan Editor

Projek 2016 AutoFilter Feature - dummies

Projek 2016 AutoFilter Feature - dummies

Projek 2016 AutoFilter feature dihidupkan secara lalai untuk semua fail jadual baru. Anak panah muncul dalam tajuk lajur dalam helaian yang dipaparkan. Apabila anda mengklik anak panah di ruangan Nama Sumber, sebagai contoh, nama setiap sumber yang diberikan kepada tugas dalam projek itu disenaraikan dalam susunan abjad, bersama-sama dengan ...

Bagaimana Kalendar Projek 2016 Berkaitan dengan Satu-satunya - dummies

Bagaimana Kalendar Projek 2016 Berkaitan dengan Satu-satunya - dummies

Semua kalendar dalam projek Projek 2016 dikawal, secara lalai, dengan tetapan kalendar projek. Berikut adalah bahagian rumit, walaupun: Apabila anda menukar kalendar tugas atau kalendar sumber (dikenali sebagai pengecualian), anda harus memahami penetapan yang diperlukan terlebih dahulu. Inilah caranya konsep keutamaan berfungsi: Dengan tiada tetapan lain, asas ...