Rumah Kewangan Peribadi Apa Data Pelombong Do - dummies

Apa Data Pelombong Do - dummies

Isi kandungan:

Video: What Is Bitcoin in Malay | Bitcoin Malaysia | Bitcoin Indonesia | Apa Bitcoin? 2024

Video: What Is Bitcoin in Malay | Bitcoin Malaysia | Bitcoin Indonesia | Apa Bitcoin? 2024
Anonim

Jika anda memikirkan data sebagai bahan mentah, dan maklumat yang anda dapat dari data sebagai sesuatu yang bernilai dan agak halus, proses pengekstrakan informasi dapat berbanding dengan mengeluarkan logam dari bijih atau permata dari kotoran. Demikianlah istilah pertambangan data berasal.

Memfokuskan pada perniagaan perlombongan data

Penambang data tidak hanya merenungkan data tanpa tujuan, dengan harapan untuk mencari sesuatu yang menarik. Setiap projek perlombongan data bermula dengan masalah perniagaan tertentu dan matlamat untuk dipadankan.

Sebagai pelombong data, anda mungkin tidak akan mempunyai kuasa untuk membuat keputusan perniagaan akhir, jadi penting agar anda menyelaraskan kerja anda dengan keperluan pembuat keputusan. Anda mesti memahami masalah, keperluan, dan keutamaan mereka, dan menumpukan usaha anda untuk memberikan maklumat yang menyokong keputusan perniagaan yang baik.

Pengetahuan perniagaan anda sendiri sangat penting. Eksekutif tidak akan duduk bersebelahan dengan anda semasa anda bekerja, memberikan maklum balas mengenai kaitan penemuan anda terhadap kebimbangan mereka. Anda mesti menggunakan pengalaman dan kecerdasan anda sendiri untuk menilai itu untuk diri anda semasa anda bekerja.

Memahami bagaimana pelombong data menghabiskan masa mereka

Akan sangat bagus jika penambang data boleh menghabiskan sepanjang hari membuat penemuan yang mengubah hidup, membina model berharga, dan mengintegrasikannya ke dalam perniagaan sehari-hari. Tetapi itu seperti mengatakan ia akan menjadi baik jika atlet boleh menghabiskan semua kejohanan memenangi hari. Ia memerlukan banyak persediaan untuk membina momen kejayaan. Jadi, seperti atlet, penambang data menghabiskan banyak masa untuk persiapan.

Mengenali proses perlombongan data

Proses kerja yang baik membantu anda memanfaatkan sepenuhnya masa, data anda, dan semua sumber lain. Dalam buku ini, anda akan menemui proses perlombongan data yang paling popular, CRISP-DM. Ia adalah kitaran penemuan dan fasa enam fasa yang diwujudkan oleh konsortium penambang data dari banyak industri, dan satu standard terbuka yang digunakan sesiapa sahaja.

Fase proses CRISP-DM adalah

  1. Memahami Perniagaan

  2. Memahami Data

  3. Penyediaan Data

  4. Pemodelan

  5. Evaluasi

  6. Penggunaan (menggunakan model dalam perniagaan setiap hari)

fasa membawa berat badan yang sama pentingnya kepada kualiti hasil dan nilai kepada perniagaan. Tetapi dari segi masa yang diperlukan, penyediaan data menguasai. Penyediaan data secara rutin mengambil masa lebih banyak daripada semua fasa lain proses penambangan data yang digabungkan.

Membuat model

Apabila matlamat difahami, dan data dibersihkan dan sedia untuk digunakan, anda boleh mengubah perhatian anda untuk membina model ramalan.Model melakukan apa yang tidak dapat laporan; mereka memberi anda maklumat yang menyokong tindakan.

Laporan boleh memberitahu anda bahawa jualan turun. Ia boleh memecah jualan mengikut rantau, produk, dan saluran supaya anda tahu di mana penjualan menurun dan sama ada penurunan ini meluas atau menjejaskan hanya kawasan tertentu. Tetapi mereka tidak memberi anda sebarang petunjuk tentang penjualan mengapa merosot atau tindakan yang mungkin dapat membantu menghidupkan semula perniagaan.

Model membantu anda memahami faktor-faktor yang memberi kesan kepada jualan, tindakan yang cenderung meningkatkan atau menurunkan jualan, dan strategi dan taktik yang memastikan perniagaan anda berjalan lancar. Itu menarik, bukan? Mungkin itulah sebabnya kebanyakan penambang data mempertimbangkan pemodelan untuk menjadi bahagian yang menyenangkan dari pekerjaan itu.

Memahami model matematik

Model matematik adalah pusat kepada perlombongan data, tetapi apakah mereka? Apa yang mereka lakukan, bagaimana ia berfungsi, dan bagaimana ia dicipta?

Model matematik adalah, biasa dan mudah, persamaan, atau set persamaan, yang menggambarkan hubungan antara dua atau lebih perkara. Persamaan sedemikian adalah cara tersendiri bagi teori-teori mengenai cara-cara alam dan masyarakat. Teori ini boleh disokong oleh bukti yang besar atau ia mungkin hanya meneka liar. Bahasa matematik adalah sama dalam kedua-dua kes.

Terma seperti model ramalan, model statistik, atau model linear merujuk kepada jenis model matematik tertentu, nama-nama yang menggambarkan penggunaan yang dimaksudkan, satu model tertentu. Ketiga contoh ini hanya beberapa dari sebutan tersebut.

Apabila model disebut dalam tetapan perniagaan, kemungkinan besar model yang digunakan untuk membuat ramalan. Model digunakan untuk meramalkan harga saham, jualan produk, dan kadar pengangguran, di antara banyak perkara lain.

Ramalan ini mungkin atau mungkin tidak tepat, tetapi bagi setiap nilai yang diberikan (faktor-faktor yang dikenali seperti ini dipanggil pembolehubah bebas atau input ) termasuk dalam model, anda akan mencari ramalan yang jelas (juga dikenali sebagai pembolehubah, output, atau bergantung ). Model matematik digunakan untuk tujuan lain dalam perniagaan, juga, seperti untuk menerangkan mekanisme kerja yang mendorong proses tertentu. Dalam perlombongan data, anda membuat model dengan mencari pola dalam data menggunakan pembelajaran mesin atau kaedah statistik. Penambang data tidak mengikuti pendekatan ketat yang sama yang dilakukan ahli statistik klasik, tetapi semua model diperolehi daripada data sebenar dan teknik pemodelan matematik yang konsisten. Semua model perlombongan data disokong oleh satu badan bukti.

Mengapa menggunakan model matematik? Tidakkah hubungan yang sama dapat diterangkan menggunakan kata-kata? Itu mungkin, namun anda mendapati kelebihan tertentu untuk menggunakan persamaan. Ini termasuk

Kenyamanan:

  • Dibandingkan dengan uraian bersamaan yang ditulis dalam ayat, persamaan adalah ringkas. Perlambangan matematik telah berkembang khusus untuk maksud mewakili hubungan matematik; bahasa seperti bahasa Inggeris tidak. Kejelasan:

  • Persamaan menyampaikan idea-idea ringkas dan tidak jelas.Mereka tidak tertakluk kepada tafsiran yang berbeza berdasarkan budaya, dan simbolisme matematik adalah sejenis bahasa umum yang digunakan di seluruh dunia. Ketekalan:

  • Oleh kerana perwakilan matematik adalah tidak jelas, implikasi keadaan tertentu jelas ditakrifkan oleh model matematik. Meletakkan maklumat ke dalam tindakan

Model hanya memberikan nilai apabila anda menggunakannya dalam perniagaan. Ramalan model mungkin menyokong keputusan dalam pelbagai cara. Anda mungkin

Menggabungkan ramalan ke dalam laporan atau persembahan yang akan digunakan dalam membuat keputusan tertentu.

  • Mengintegrasikan model ke dalam sistem operasi (seperti sistem perkhidmatan pelanggan) untuk memberikan ramalan masa nyata untuk penggunaan setiap hari. (Sebagai contoh, anda mungkin membenderkan tuntutan insurans untuk bayaran segera, penafian segera, atau siasatan lanjut.)

  • Gunakan model untuk ramalan batch. (Sebagai contoh, anda boleh menjaringkan senarai pelanggan dalaman untuk memutuskan pelanggan mana yang patut menerima tawaran tertentu.)

Apa Data Pelombong Do - dummies

Pilihan Editor

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Melindungi Metrik Media Sosial anda dengan Alat Cadangan - dummies

Jika anda telah memulakan jejak sosial metrik media dan menikmati kurniaan data yang kini dapat dilihat, dihidupkan, dan digunakan, anda mungkin tertanya-tanya apa yang mungkin menyebabkan kemurungan! Mudah: kehilangan data. Katakanlah bahawa anda mempunyai masalah tapak atau entah bagaimana kehilangan akses ke tapak atau data anda. Adakah anda mempunyai sandaran anda ...

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Laman web baru? Menarik Tumpuan Media Sosial Lalu Lintas dan Meningkat - dummies

Mana-mana kempen baru, laman web, akaun Twitter, halaman Facebook, atau item lain yang anda ingin ukur dengan metrik media sosial bermula pada sifar. Nombor ini boleh membuat anda merasa seperti anda bercakap dengan tidak sah, bercakap dengan diri anda atau anda tersembunyi dari pandangan. Perasaan ini boleh membawa kepada pengasingan secara keseluruhan ...

Meracuni Google Spider - dummies

Meracuni Google Spider - dummies

Anda sentiasa dapat mencari orang yang ingin menyimpang dari lurus dan sempit. Ya, mereka adalah orang bodoh yang terlibat dalam taktik pengoptimuman berisiko yang bertujuan untuk menggerakkan PageRank secara artifisial, memanipulasi pesanan halaman hasil carian di Google, dan mendapatkan kelebihan yang tidak adil dalam indeks. Google, dengan reputasi yang luar biasa untuk melindungi, ...

Pilihan Editor

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Mengukur Pengunjung Lama Menginap di Laman Web Anda - dummies

Di laman web anda memberikan wawasan yang penting. Anda boleh memikirkan sama ada pengunjung sedang melihat cepat, kemudian pergi, atau sama ada mereka bertahan lebih lama dan sebenarnya membaca bahan dalam talian anda dengan tujuan untuk mengambil tindakan. Jika majoriti pelawat laman web anda tidak ...

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Pemasaran web: Cara Menilai Layouts dengan Peta Haba - dummies

Laman web perniagaan sangat mirip dengan merancang kedai dengan pemasaran produk dalam fikiran. Malah, laman web anda benar-benar adalah kedai - kedai maya di Internet. Rangkaian kedai runcit telah menghabiskan berjuta-juta dolar dalam penyelidikan pasaran, menonton dan mendokumentasikan bagaimana pembeli memasuki kedai, belok kanan atau kiri, dan ...

Analitik web Untuk Menipu Cheat Sheet - dummies

Analitik web Untuk Menipu Cheat Sheet - dummies

Melakukan analisis laman web tidak perlu meletihkan dan intensif masa. Anda boleh meringkaskan prestasi keseluruhan laman web anda dengan cepat - jika anda tahu apa yang perlu dicari. Alat analisis web percuma dan kos rendah boleh membantu anda mengukur kejayaan laman web anda, dan anda boleh menjana perujuk tapak dengan pelbagai cara yang tidak mungkin ...

Pilihan Editor

Cara Memaksimumkan Ruang pada Laman Web - dummies

Cara Memaksimumkan Ruang pada Laman Web - dummies

Terlalu terhad, anda boleh membuat penggunaan kreatif beberapa teknologi di luar sana untuk memaksimumkan antara muka anda. Untuk setiap teknik berikut yang diterangkan, terdapat banyak laman web yang menawarkan sampel kod, forum, dan sumber untuk membantu anda memulakan. Accordions. Antara muka akordion membolehkan ...

Cara Mendapatkan Corak CSS3 Online - dummies

Cara Mendapatkan Corak CSS3 Online - dummies

Mencipta kesan mudah untuk laman CSS3 menggunakan gradien mudah . Walau bagaimanapun, mewujudkan sesuatu yang benar-benar hebat memerlukan masa dan keupayaan artistik. Kebanyakan pemaju benar-benar tidak mempunyai masa atau kemahiran yang diperlukan untuk mencipta sesuatu yang mempesonakan menggunakan CSS3 sahaja (atau CSS3 digabungkan dengan grafik) - di sinilah pereka bermain. Ramai pereka yang membolehkan anda ...

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Bagaimana Mengoptimumkan Aplikasi CSS3 dengan Modernizr - dummies

Terdapat banyak pelayar dan versi pelayar yang berbeza gunakan hari ini. Tidak semua daripada mereka adalah optimum untuk CSS3. Inilah tempat Modernizr dimainkan. Pemajunya menyebutnya "perpustakaan JavaScript yang mengesan ciri HTML5 dan CSS3 dalam pelayar pengguna. "Anda menggunakan Modernizr untuk melaksanakan tugas secara pilihan dan memasukkan ciri aplikasi berdasarkan ...