Rumah Kewangan Peribadi Hilang Nilai dalam Data Anda - dummies

Hilang Nilai dalam Data Anda - dummies

Isi kandungan:

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025

Video: 8 Macam Error Pada Microsoft Excel dan Cara Mengatasinya 2025
Anonim

Salah satu masalah data yang paling kerap dan tersisih untuk ditangani ialah kehilangan data. Fail boleh menjadi tidak lengkap kerana rekod jatuh atau peranti simpanan diisi. Atau medan data tertentu mungkin tidak mengandungi data untuk beberapa rekod. Yang pertama masalah ini boleh didiagnosis dengan hanya mengesahkan tuduhan rekod untuk fail. Masalah kedua adalah lebih sukar untuk ditangani.

Untuk meletakkannya dalam istilah yang mudah, apabila anda mencari medan yang mengandungi nilai yang hilang, anda mempunyai dua pilihan:

  • Abaikannya.

  • Tetapkan sesuatu di medan.

Mengabaikan masalah

Dalam beberapa kes, anda mungkin mencari medan tunggal dengan sejumlah besar nilai yang hilang. Jika ya, perkara yang paling mudah dilakukan adalah mengabaikan bidang. Jangan masukkannya dalam analisis anda.

Satu lagi cara untuk mengabaikan masalah adalah mengabaikan rekod. Hanya padamkan rekod yang mengandungi data yang hilang. Ini mungkin masuk akal jika terdapat hanya beberapa rekod penyangak. Tetapi jika terdapat banyak medan data yang mengandungi jumlah nilai penting yang hilang, pendekatan ini mungkin mengecilkan kiraan rekod anda ke tahap yang tidak dapat diterima.

Satu lagi perkara yang perlu diperhatikan sebelum sekadar memadamkan rekod adalah sebarang tanda corak. Sebagai contoh, andaikan menganalisis satu set data yang berkaitan dengan baki kad kredit di seluruh negara. Anda mungkin mendapati sejumlah besar rekod yang menunjukkan $ 0. 00 baki (mungkin kira-kira separuh rekod). Ini bukannya merupakan indikasi kehilangan data. Walau bagaimanapun, jika semua rekod dari, katakan, California menunjukkan $ 0. 00 baki, yang menunjukkan masalah nilai yang berpotensi hilang. Dan ia bukanlah satu yang akan dipecahkan dengan berguna dengan memotong semua rekod dari negara terbesar di negara ini. Dalam kes ini, ia mungkin merupakan isu sistem dan menunjukkan bahawa fail baru harus dibuat.

Secara umum, memadam rekod adalah penyelesaian yang mudah, tetapi bukan ideal, untuk masalah kehilangan nilai. Sekiranya masalahnya agak kecil dan tidak ada corak yang ketara terhadap ketinggalan, maka mungkin baik untuk menghalang rekod yang menyerang dan teruskan. Tetapi kerap pendekatan yang lebih tinggi diperlukan.

Mengisi data yang hilang

Mengisi jumlah data yang hilang untuk membuat tebakan terdidik tentang apa yang akan berlaku dalam bidang itu. Terdapat cara yang baik dan buruk untuk melakukan ini. Satu pendekatan yang mudah (tetapi buruk) adalah untuk menggantikan nilai-nilai yang hilang dengan purata yang tidak hilang. Dalam bidang bukan berangka, anda mungkin tergoda untuk mengisi rekod yang hilang dengan nilai yang paling umum dalam rekod lain (mod).

Pendekatan ini, malangnya, masih sering digunakan dalam beberapa aplikasi perniagaan.Tetapi mereka dianggap secara meluas oleh ahli statistik sebagai idea buruk. Untuk satu perkara, keseluruhan titik melakukan analisis statistik adalah untuk mencari data yang membezakan satu hasil daripada yang lain. Dengan menggantikan semua rekod yang hilang dengan nilai yang sama, anda tidak membezakan apa-apa.

Pendekatan yang lebih tinggi adalah untuk mencari cara untuk meramalkan dengan cara yang bermakna apa nilai harus diisi pada setiap rekod yang hilang nilai. Ini melibatkan melihat rekod lengkap dan cuba mencari petunjuk tentang apa yang mungkin hilang.

Anggap anda menganalisis fail demografi untuk meramalkan kemungkinan pembeli salah satu produk anda. Dalam fail yang anda ada, antara bidang lain, maklumat mengenai status perkahwinan, bilangan anak, dan jumlah kereta. Atas sebab tertentu, bilangan medan autos hilang dalam satu pertiga rekod.

Dengan menganalisis dua bidang lain - status perkahwinan dan bilangan anak - anda boleh menemui beberapa pola. Orang tunggal cenderung mempunyai satu kereta. Orang yang berkahwin tanpa anak cenderung mempunyai dua kereta. Orang yang berkahwin dengan lebih daripada seorang kanak-kanak mungkin lebih berkemungkinan mempunyai tiga kereta. Dengan cara ini, anda boleh meneka nilai yang hilang dengan cara yang sebenarnya membezakan rekod. Lebih lanjut mengenai pendekatan ini akan datang.

Terdapat istilah am dalam statistik dan pemprosesan data yang merujuk kepada data yang dipersoalkan. Istilah bising digunakan untuk menggambarkan data yang tidak boleh dipercayai, korup, atau sebaliknya kurang daripada murni. Data yang hilang adalah satu contoh sahaja. Penerangan mengenai teknik untuk membersihkan data bising secara amnya adalah di luar skop buku ini. Malah, ini adalah bidang penyelidikan yang aktif dalam teori statistik. Hakikat bahawa semua bunyi bising tidak mudah dilihat kerana nilai-nilai yang hilang menjadikannya menyusahkan untuk ditangani.

Hilang Nilai dalam Data Anda - dummies

Pilihan Editor

Menggunakan Kalkulator di SAT - dummies

Menggunakan Kalkulator di SAT - dummies

Semasa mengambil SAT, anda dibenarkan menggunakan kalkulator. Kalkulator boleh menjimatkan banyak masa pada SAT jika anda menyimpannya apabila anda tidak dapat dengan cepat dan mudah membuat pengiraan di kepala anda. Semakin rumit perhitungan tunggal, semakin besar kemungkinan anda memasukkannya secara salah, jadi jika ...

UKCAT For Dummies Cheat Sheet (UK Edition) - dummies

UKCAT For Dummies Cheat Sheet (UK Edition) - dummies

Kursus-kursus di UK sering bergantung pada skor yang baik di United Kingdom Clinical Aptitude Test (UKCAT). Ia adalah peperiksaan yang baru yang mengukur bakat bawaan anda untuk mengatasi jenis bahan yang akan anda pelajari semasa latihan. Pastikan maklumat ini berguna untuk membantu anda ...

Dengan menggunakan Jadual Joy untuk Membantu dengan Ujian Numeracy - dummies

Dengan menggunakan Jadual Joy untuk Membantu dengan Ujian Numeracy - dummies

Nifty Table of Joy untuk menyelesaikan peratusan, carta pai, perkadaran, penukaran, nisbah dan semua yang lain supaya anda dapat menguji ujian pengiraan dengan mudah! Lukiskan jarum besar dan salib salib, meninggalkan diri anda banyak ruang untuk label di lajur pertama dan baris atas. Label bahagian tengah ...

Pilihan Editor

Bagaimana Menentukan Kadar Automasi Pemasaran Etiopia Pemasaran - dummies

Bagaimana Menentukan Kadar Automasi Pemasaran Etiopia Pemasaran - dummies

Kempen memupuk membantu anda mengurus hubungan secara berkesan dalam jangka masa yang panjang dengan usaha yang sangat sedikit. Inilah peraturan dasar pacing, serta beberapa taktik khusus untuk digunakan dalam mana-mana kempen memupuk untuk menjadikannya lebih berkesan. Ikut peraturan am. The ...

Bagaimana Membangun Membina Templat Automasi Pemasaran E-mel - ejaan pemula

Bagaimana Membangun Membina Templat Automasi Pemasaran E-mel - ejaan pemula

Sangat berbeza dengan e-mel massa. Ingat bahawa kempen memupuk berfungsi sebagai medium one-to-one, sedangkan e-mel letupan adalah satu-ke-banyak medium. Untuk meningkatkan kadar pertunangan anda, anda harus bermula dengan pemahaman kempen satu sama lain Jika anda telah melakukan pemasaran e-mel seketika dan anda mempunyai beberapa ...

Cara Mencipta Kandungan Pemasaran Secara Automatik untuk Memupuk Pemimpin - pengemis

Cara Mencipta Kandungan Pemasaran Secara Automatik untuk Memupuk Pemimpin - pengemis

Aduan nombor satu dari orang yang mendapat bermula dengan automasi pemasaran adalah bahawa mereka tidak mempunyai cukup masa untuk membuat kandungan. Ini juga merupakan satu-satunya sebab yang syarikat menangguhkan penggunaan automasi pemasaran mereka. Walau bagaimanapun, masalah sebenar ialah mereka berfikir tentang kandungan dengan cara yang salah. Apabila anda membina kandungan untuk ...

Pilihan Editor

Pentadbiran: Protokol Firewall - dummies

Pentadbiran: Protokol Firewall - dummies

Semua trafik rangkaian masuk dan keluar dari LAN harus melalui firewall, menghalang akses yang tidak dibenarkan ke rangkaian. Terdapat empat firewall teknik yang digunakan untuk memastikan pengunjung yang tidak diundang keluar dari rangkaian anda. Tiga teknik ini diterangkan di sini. Keempat, penapisan paket, tidak diliputi dalam artikel ini. Pemeriksaan paket negara (SPI) ...

Pentadbiran: Pembentangan Pengurusan Dasar Kumpulan - dummies

Pentadbiran: Pembentangan Pengurusan Dasar Kumpulan - dummies

Sebelum anda boleh bekerja dengan dasar kumpulan pada Windows Server 2008 , anda mesti mendayakan dasar kumpulan pada pelayan. Prosedur ini cukup mudah dan perlu dilakukan sekali sahaja untuk setiap pelayan. Berikut adalah langkah-langkah: Pilih Mula → Alat Pentadbiran → Pengurus Pelayan. Klik Ciri-ciri di dalam pokok konsol. Klik Tambah Ciri. Bersabar - ...