Rumah Kewangan Peribadi Hilang Nilai dalam Data Anda - dummies

Hilang Nilai dalam Data Anda - dummies

Isi kandungan:

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025
Anonim

Salah satu masalah data yang paling kerap dan tersisih untuk ditangani ialah kehilangan data. Fail boleh menjadi tidak lengkap kerana rekod jatuh atau peranti simpanan diisi. Atau medan data tertentu mungkin tidak mengandungi data untuk beberapa rekod. Yang pertama masalah ini boleh didiagnosis dengan hanya mengesahkan tuduhan rekod untuk fail. Masalah kedua adalah lebih sukar untuk ditangani.

Untuk meletakkannya dalam istilah yang mudah, apabila anda mencari medan yang mengandungi nilai yang hilang, anda mempunyai dua pilihan:

  • Abaikannya.

  • Tetapkan sesuatu di medan.

Mengabaikan masalah

Dalam beberapa kes, anda mungkin mencari medan tunggal dengan sejumlah besar nilai yang hilang. Jika ya, perkara yang paling mudah dilakukan adalah mengabaikan bidang. Jangan masukkannya dalam analisis anda.

Satu lagi cara untuk mengabaikan masalah adalah mengabaikan rekod. Hanya padamkan rekod yang mengandungi data yang hilang. Ini mungkin masuk akal jika terdapat hanya beberapa rekod penyangak. Tetapi jika terdapat banyak medan data yang mengandungi jumlah nilai penting yang hilang, pendekatan ini mungkin mengecilkan kiraan rekod anda ke tahap yang tidak dapat diterima.

Satu lagi perkara yang perlu diperhatikan sebelum sekadar memadamkan rekod adalah sebarang tanda corak. Sebagai contoh, andaikan menganalisis satu set data yang berkaitan dengan baki kad kredit di seluruh negara. Anda mungkin mendapati sejumlah besar rekod yang menunjukkan $ 0. 00 baki (mungkin kira-kira separuh rekod). Ini bukannya merupakan indikasi kehilangan data. Walau bagaimanapun, jika semua rekod dari, katakan, California menunjukkan $ 0. 00 baki, yang menunjukkan masalah nilai yang berpotensi hilang. Dan ia bukanlah satu yang akan dipecahkan dengan berguna dengan memotong semua rekod dari negara terbesar di negara ini. Dalam kes ini, ia mungkin merupakan isu sistem dan menunjukkan bahawa fail baru harus dibuat.

Secara umum, memadam rekod adalah penyelesaian yang mudah, tetapi bukan ideal, untuk masalah kehilangan nilai. Sekiranya masalahnya agak kecil dan tidak ada corak yang ketara terhadap ketinggalan, maka mungkin baik untuk menghalang rekod yang menyerang dan teruskan. Tetapi kerap pendekatan yang lebih tinggi diperlukan.

Mengisi data yang hilang

Mengisi jumlah data yang hilang untuk membuat tebakan terdidik tentang apa yang akan berlaku dalam bidang itu. Terdapat cara yang baik dan buruk untuk melakukan ini. Satu pendekatan yang mudah (tetapi buruk) adalah untuk menggantikan nilai-nilai yang hilang dengan purata yang tidak hilang. Dalam bidang bukan berangka, anda mungkin tergoda untuk mengisi rekod yang hilang dengan nilai yang paling umum dalam rekod lain (mod).

Pendekatan ini, malangnya, masih sering digunakan dalam beberapa aplikasi perniagaan.Tetapi mereka dianggap secara meluas oleh ahli statistik sebagai idea buruk. Untuk satu perkara, keseluruhan titik melakukan analisis statistik adalah untuk mencari data yang membezakan satu hasil daripada yang lain. Dengan menggantikan semua rekod yang hilang dengan nilai yang sama, anda tidak membezakan apa-apa.

Pendekatan yang lebih tinggi adalah untuk mencari cara untuk meramalkan dengan cara yang bermakna apa nilai harus diisi pada setiap rekod yang hilang nilai. Ini melibatkan melihat rekod lengkap dan cuba mencari petunjuk tentang apa yang mungkin hilang.

Anggap anda menganalisis fail demografi untuk meramalkan kemungkinan pembeli salah satu produk anda. Dalam fail yang anda ada, antara bidang lain, maklumat mengenai status perkahwinan, bilangan anak, dan jumlah kereta. Atas sebab tertentu, bilangan medan autos hilang dalam satu pertiga rekod.

Dengan menganalisis dua bidang lain - status perkahwinan dan bilangan anak - anda boleh menemui beberapa pola. Orang tunggal cenderung mempunyai satu kereta. Orang yang berkahwin tanpa anak cenderung mempunyai dua kereta. Orang yang berkahwin dengan lebih daripada seorang kanak-kanak mungkin lebih berkemungkinan mempunyai tiga kereta. Dengan cara ini, anda boleh meneka nilai yang hilang dengan cara yang sebenarnya membezakan rekod. Lebih lanjut mengenai pendekatan ini akan datang.

Terdapat istilah am dalam statistik dan pemprosesan data yang merujuk kepada data yang dipersoalkan. Istilah bising digunakan untuk menggambarkan data yang tidak boleh dipercayai, korup, atau sebaliknya kurang daripada murni. Data yang hilang adalah satu contoh sahaja. Penerangan mengenai teknik untuk membersihkan data bising secara amnya adalah di luar skop buku ini. Malah, ini adalah bidang penyelidikan yang aktif dalam teori statistik. Hakikat bahawa semua bunyi bising tidak mudah dilihat kerana nilai-nilai yang hilang menjadikannya menyusahkan untuk ditangani.

Hilang Nilai dalam Data Anda - dummies

Pilihan Editor

Saiz dan Komposisi dalam Fotografi Berdekatan - dummies

Saiz dan Komposisi dalam Fotografi Berdekatan - dummies

Untuk menggunakan saiz sebagai unsur komposisi di dekat- up dan makro fotografi, anda perlu terlebih dahulu memikirkan apa yang ingin anda katakan mengenai subjek anda. Anda boleh menggunakan hubungan saiz antara dua objek untuk mengetahui penonton tentang sejauh mana subjek anda, atau membuat kedalaman dengan mempunyai satu objek ...

Saiz dan Jarak Lampu dalam Fotografi Makro - patung

Saiz dan Jarak Lampu dalam Fotografi Makro - patung

Walaupun pendekatan kreatif biasanya dapat mengatasi sebarang halangan pencahayaan , dalam fotografi makro dan close-up anda biasanya bekerja dengan subjek dan adegan yang sangat kecil, dan kamera anda cenderung cukup dekat dengan tindakan. Faktor-faktor ini penting dalam menentukan peralatan pencahayaan yang paling sesuai. Dua faktor utama menentukan kualiti ...

Menyelesaikan Masalah Warna HDR dengan hitam dan putih - monyet

Menyelesaikan Masalah Warna HDR dengan hitam dan putih - monyet

Tidak kelihatan baik. Atas sebab apa pun, foto ini, imej HDR pendedahan tunggal, adalah kes seperti itu. Versi warna, seperti yang anda lihat, tidak begitu menarik, walaupun dalam HDR. Objek yang menarik mata anda adalah garis pokok hijau dan tanda warna pada ...

Pilihan Editor

Cara Membuat Rangkaian StumbleUpon yang Besar - patung

Cara Membuat Rangkaian StumbleUpon yang Besar - patung

Seperti di dunia nyata, anda tidak akan menjadi sangat berjaya di StumbleUpon jika anda tidak membina rangkaian kenalan. Perkara yang sama berlaku jika anda ingin meningkatkan secara dramatik trafik ke laman web atau blog anda dari StumbleUpon. Hubungan yang lebih banyak yang anda bina, semakin banyak trafik dan keterlibatan anda akan menerima ...

6 Tips untuk Penggunaan Lebih Betul StumbleUpon - dummies

6 Tips untuk Penggunaan Lebih Betul StumbleUpon - dummies

Apabila anda cukup selesa dengan semua aspek Pengalaman StumbleUpon, anda boleh mula meningkatkan penggunaan program anda. Berikut adalah beberapa petua: Meningkatkan rangkaian anda Untuk mendapatkan manfaat sepenuhnya dari komuniti StumbleUpon, anda perlu mempunyai tentera penyokong. Ia sangat serupa dengan mengembangkan rangkaian anda secara nyata ...

Cara Mengundang Kawan untuk StumbleUpon - dummies

Cara Mengundang Kawan untuk StumbleUpon - dummies

Anda tahu betapa hebatnya StumbleUpon sebenarnya, jadi secara semula jadi anda mahu untuk memberitahu semua rakan anda betapa hebatnya juga, dan jemput mereka untuk menyertai anda! Sangat mudah. Sepatutnya percaya, sesetengah rakan anda mungkin tidak berada di StumbleUpon. Kejutan, bukan? Nah, bagaimana cara menyelesaikannya ...

Pilihan Editor

Cara menggunakan penapis warna terpilih pada Nikon D3200 - dummies

Cara menggunakan penapis warna terpilih pada Nikon D3200 - dummies

Menu Retouch pada Nikon D3200 menawarkan penapis Warna Selective yang membolehkan anda mengecilkan (mengeluarkan warna dari) bahagian-bahagian foto sambil meninggalkan warna tertentu utuh. Contohnya, dalam angka berikut, semua adalah desaturated kecuali kuning dan pic dalam mawar. Hasilnya meminjamkan drama tambahan ke subjek anda kerana ...

Cara Menggunakan Mod Histogram RGB di Nikon D5300 - dummies

Cara Menggunakan Mod Histogram RGB di Nikon D5300 - dummies

Tekan Multi Selector turun untuk beralih dari mod Sorotan ke mod ini pada Nikon D5300 anda. Anda boleh melihat gambar anda dalam mod ini hanya jika anda mendayakannya melalui pilihan Mod Paparan pada menu Main Semula. Di bawah imej kecil imej, anda melihat hanya beberapa keping data. Seperti Maklumat Fail ...

Cara menggunakan mod kawalan jauh wayarles pada Nikon D5300 - dummies

Cara menggunakan mod kawalan jauh wayarles pada Nikon D5300 - dummies

Terdapat pelbagai pilihan Rilis pada Nikon D5300, ada juga yang membolehkan akses kawalan jauh. Tetapan mod Dua Ringan berkaitan dengan unit kawalan jauh tanpa wayar Nikon ML-L3. Mod Lepas ini berfungsi seperti berikut: Kelewatan Dihindari: Selepas anda menekan butang pelepas shutter pada unit jauh, lampu bantuan AF berkedip selama kira-kira dua saat, dan kemudian ...