Rumah Kewangan Peribadi Bekerja dengan Data Grafik dalam Python untuk Sains Data - dummies

Bekerja dengan Data Grafik dalam Python untuk Sains Data - dummies

Isi kandungan:

Video: What REALLY is Data Science? Told by a Data Scientist 2024

Video: What REALLY is Data Science? Told by a Data Scientist 2024
Anonim

Kebanyakan saintis data mesti berfungsi dengan data graf pada satu ketika. Python memberi anda fungsinya. Bayangkan titik data yang disambungkan ke titik data lain, seperti bagaimana satu halaman web disambungkan ke laman web lain melalui hiperpautan. Setiap titik data adalah nod . Node bersambung ke satu sama lain menggunakan pautan .

Tidak semua pautan nod ke setiap nod lain, jadi sambungan nod menjadi penting. Dengan menganalisis nod dan pautan mereka, anda boleh melakukan pelbagai tugas menarik dalam sains data, seperti menentukan cara terbaik untuk mendapatkan dari kerja ke rumah anda menggunakan jalan-jalan dan lebuh raya.

Memahami matriks bersebelahan

Matriks Matriks mewakili sambungan antara nod grafik. Apabila terdapat sambungan di antara satu nod dan yang lain, matriks menunjukkan ia sebagai nilai yang lebih besar daripada 0. Perwakilan tepat sambungan dalam matriks bergantung kepada sama ada grafik diarahkan (di mana arah sambungan itu penting) atau tidak diarahkan.

Masalah dengan banyak contoh dalam talian adalah bahawa para penulis membuatnya mudah untuk tujuan penerangan. Walau bagaimanapun, graf dunia sebenar sering kali besar dan menentang analisis mudah semata-mata melalui visualisasi. Cukup fikirkan bilangan nod yang mungkin ada bandar kecil ketika mempertimbangkan jalan persilangan. Ramai grafik lain jauh lebih besar, dan hanya melihat mereka tidak akan mendedahkan apa-apa corak yang menarik. Ahli sains data memanggil masalah dalam membentangkan mana-mana graf yang kompleks menggunakan matriks adjacency a hairball .

Satu kunci untuk menganalisis matriks persekitaran adalah untuk menyusunnya dengan cara tertentu. Sebagai contoh, anda mungkin memilih menyusun data mengikut sifat selain daripada sambungan sebenar. Grafik sambungan jalan mungkin termasuk tarikh jalan yang terakhir diturap dengan data, membolehkan anda mencari corak yang mengarahkan seseorang berdasarkan jalan-jalan yang dalam pembaikan yang terbaik. Ringkasnya, membuat data grafik berguna menjadi perkara yang memanipulasi organisasi data tersebut dengan cara tertentu.

Menggunakan asas NetworkX

Bekerjasama dengan grafik boleh menjadi sukar jika anda perlu menulis semua kod dari awal. Mujurlah, pakej NetworkX untuk Python memudahkan untuk membuat, memanipulasi, dan mengkaji struktur, dinamik, dan fungsi rangkaian kompleks (atau graf). Anda boleh menggunakan pakej ini untuk bekerja dengan digraphs dan multigraphs juga.

Penekanan utama NetworkX adalah untuk mengelakkan keseluruhan masalah bola rambut.Penggunaan panggilan mudah menyembunyikan banyak kerumitan bekerja dengan graf dan matriks adjacency dari pandangan. Contoh berikut menunjukkan cara mencipta matriks jejak asas dari salah satu graf yang disediakan oleh NetworkX:

networkx import sebagai nx G = nx. cycle_graph (10) A = nx. adjacency_matrix (G) print (A todense ())

Contoh bermula dengan mengimport pakej yang diperlukan. Ia kemudiannya membuat grafik menggunakan template cycle_graph (). Grafik mengandungi sepuluh nod. Memanggil adjacency_matrix () mencipta matriks adjacency dari graf. Langkah terakhir ialah mencetak output sebagai matriks, seperti ditunjukkan di sini:

[[0 1 0 0 0 0 0 0 1] [1 0 1 0 0 0 0 0 0] [0 1 0 1 0 0 0 0 0 0 0] [0 0 0 0 0 0 0 0] [0 0 0 0 0 0 0 0] [0 0 0 0 0 0 0 0] [0 0 0 0 0 0 0 1 0 0] [0 0 0 0 0 0 1 0 1 0] [0 0 0 0 0 0 0 1 0 1] [1 0 0 0 0 0 0 0 1 0]]

Anda tidak perlu membina graf anda sendiri dari awal untuk tujuan ujian. Laman NetworkX menyalin beberapa jenis grafik standard yang boleh anda gunakan, semuanya boleh didapati dalam IPython.

Sangat menarik untuk melihat bagaimana graf kelihatan selepas anda menjana. Kod berikut memaparkan graf untuk anda.

Merancang graf asal.
import matplotlib. pyplot sebagai plx nx. draw_networkx (G) plt. tunjukkan ()

Plot menunjukkan bahawa anda boleh menambah tepi antara node 1 dan 5. Berikut adalah kod yang diperlukan untuk melakukan tugas ini menggunakan fungsi add_edge ().

Merancang penambahan grafik.
G. add_edge (1, 5) nx. draw_networkx (G) plt. tunjukkan ()
Bekerja dengan Data Grafik dalam Python untuk Sains Data - dummies

Pilihan Editor

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Cara menggunakan Pemesejan Segera dengan Akaun MySpace anda - dummies

Pasangan mySpaceIM MySpace Instant Messaging (IMing ) dengan perkhidmatan Skype telefon Internet yang popular, membolehkan anda menghantar dan menerima sama ada mesej menaip atau komunikasi suara. MySpaceIM berfungsi pada mesin Windows sahaja yang menggunakan Internet Explorer Microsoft. Sekiranya anda mempunyai Mac atau menggunakan pelayar yang berbeza, anda tidak bernasib baik. Juga, sesiapa sahaja yang anda mahu ...

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Cara Menggunakan Profil MySpace Edit Halaman - dummies

Dengan halaman Edit Profil MySpace, anda boleh tambah, padam, atau tukar maklumat profil anda bila-bila masa anda mahu. Untuk membuka halaman Edit Profil, cuma pergi ke halaman utama anda dan klik pautan Edit Profil di sudut kiri atas. Tab Maklumat Peribadi di halaman Profil Edit dibahagikan kepada lapan skrin berasingan ...

Pilihan Editor

Cara Menggunakan Templat dalam Excel 2007 - dummies

Cara Menggunakan Templat dalam Excel 2007 - dummies

Excel 2007 menyediakan template yang direka bentuk, lembaran kerja untuk kegunaan umum. Templat mengandungi teks standard atau boilerplate, tetapi anda boleh mengubah suai template untuk memenuhi keperluan anda. Anda boleh menggunakan templat secara automatik dipasang dengan Excel 2007, atau anda boleh memuat turun templat percuma dari laman web Microsoft Office Online. Templat berikut dipasang secara automatik apabila ...

Cara menggunakan fungsi teks di Excel 2013 - dummies

Cara menggunakan fungsi teks di Excel 2013 - dummies

Fungsi teks di Excel 2013 menu lungsur butang arahan pada tab Rumus Ribbon (Alt + MT). Terdapat dua jenis fungsi teks: fungsi seperti VALUE, TEXT, dan DOLLAR yang menukarkan entri teks berangka ke dalam nombor dan entri berangka ke dalam teks, dan berfungsi seperti UPPER, LOWER, dan PROPER yang ...

Pilihan Editor

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Cara Mengatur Laman Web Anda dengan Tabel dan Bingkai - dummies

Menggunakan jadual dan bingkai pada halaman Web anda membantu anda membentangkan maklumat kepada pelawat laman anda dengan cara teratur. Jadual adalah alat susunatur untuk jadual data pada halaman Web, tetapi keupayaan meja untuk laman web telah lama digunakan untuk mengawal susun atur keseluruhan halaman. Pereka membuat sel ...

Cara Mendaftar Nama Domain Anda - dummies

Cara Mendaftar Nama Domain Anda - dummies

Ketika membina sebuah laman web, pantai jelas dan nama domain yang anda mahukan memang ada. Seterusnya, sudah tiba masanya untuk mendaftarkan nama domain itu. Apabila anda mendaftarkan nama domain, pastikan anda mendaftarkannya selama sekurang-kurangnya tiga tahun. Anda boleh mendaftar untuk sekurang-kurangnya ...

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Cara Hapus Pemformatan yang Tidak Diingini dari Laman Web Anda - para pengedit kod paling banyak

Yang secara automatik membersihkan kesilapan biasa dalam kod anda. Sebagai contoh, arahan Clean Up Word HTML / XHTML dalam Dreamweaver adalah satu kemestian bagi mana-mana halaman web yang merangkumi kandungan yang disalin dari Word atau mana-mana dokumen Microsoft lain. Ini penting kerana fail Microsoft sering membenamkan tambahan ...