Rumah Kewangan Peribadi Cara Menggambarkan Data Raw Analisis 'dummies

Cara Menggambarkan Data Raw Analisis 'dummies

Isi kandungan:

Video: Copy Your Analytics Data to a Spreadsheet with this One WEIRD Trick! - Firecasts 2024

Video: Copy Your Analytics Data to a Spreadsheet with this One WEIRD Trick! - Firecasts 2024
Anonim

Gambar bernilai seribu perkataan - terutama apabila anda cuba mendapatkan pegangan yang baik pada data analisis ramalan anda. Pada langkah pra-pemprosesan, semasa anda menyediakan data anda, amalan biasa untuk memvisualisasikan apa yang ada di tangan sebelum meneruskan langkah seterusnya.

Anda mula menggunakan spreadsheet seperti Microsoft Excel untuk mencipta matriks data - yang terdiri daripada data calon ciri (juga disebut sebagai atribut ). Beberapa pakej perisian perisikan perniagaan (seperti Tableau) dapat memberikan gambaran awal mengenai data yang akan anda gunakan untuk analitik.

Cara menggunakan visualisasi jadual untuk analisis ramalan

Jadual adalah perwakilan bergambar bergambar paling asas dan paling asas. Jadual (juga dikenali sebagai spreadsheet ) terdiri daripada baris dan lajur - yang masing-masing sesuai dengan objek dan atribut mereka yang disebut tadi sebagai membuat data anda. Sebagai contoh, pertimbangkan data rangkaian sosial dalam talian. Objek data boleh mewakili pengguna. Atribut pengguna (objek data) boleh menjadi tajuk lajur: Gender, Kod Zip, atau Tarikh Lahir.

Sel-sel dalam jadual mewakili nilai. Visualisasi dalam jadual dapat membantu anda dengan mudah melihat nilai atribut objek yang hilang.

Jadual juga boleh memberikan fleksibiliti untuk menambahkan atribut baru yang merupakan kombinasi atribut lain. Sebagai contoh, dalam data rangkaian sosial, anda boleh menambah lajur yang dipanggil Umur, yang boleh dikira dengan mudah - sebagai atribut yang diperolehi - dari atribut Tarikh Lahir yang sedia ada. Data rangkaian sosial tabular menunjukkan lajur baru, Umur, dibuat dari lajur yang sedia ada (Tarikh Lahir).

Carta bar digunakan dalam analisis ramalan

Carta bar boleh digunakan untuk melihat pancang atau anomali dalam data anda. Anda boleh menggunakannya untuk setiap atribut untuk memaparkan nilai minima dan maksimum dengan cepat. Carta bar juga boleh digunakan untuk memulakan perbincangan bagaimana cara menormalkan data anda.

Normalisasi adalah pelarasan beberapa - atau semua - atribut nilai pada skala yang menjadikan data lebih dapat digunakan. Sebagai contoh, anda boleh dengan mudah melihat bahawa terdapat ralat dalam data: Bar Umur pada satu rekod adalah negatif. Anomali itu lebih mudah digambarkan oleh carta bar berbanding dengan jadual data.

Asas carta pai untuk analisis ramalan

Carta pai digunakan terutamanya untuk menunjukkan peratusan. Mereka dengan mudah dapat menggambarkan pembahagian beberapa item, dan menyerlahkan yang paling dominan. Data mentah rangkaian sosial diwakili mengikut atribut Umur.Perhatikan bahawa carta menunjukkan bukan sahaja pengedaran jelas lelaki berbanding wanita, tetapi juga ralat yang mungkin: R sebagai nilai untuk jenis jantina yang mungkin dibuat apabila data dikumpulkan.

Cara menggunakan grafik grafik untuk analisis ramalan

Teori grafik menyediakan satu set algoritma yang kuat yang boleh menganalisis data berstruktur dan diwakili sebagai graf. Dalam sains komputer, graf adalah struktur data, satu cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri daripada dua bahagian utama:

  • Vertices, juga dikenali sebagai nodes

  • Edges, yang menghubungkan pasangan nod

Tepi boleh diarahkan (ditarik sebagai anak panah) dan boleh mempunyai berat. Anda boleh memutuskan untuk meletakkan kelebihan (anak panah) di antara dua nodus (lingkaran) - dalam kes ini, ahli rangkaian sosial yang disambungkan kepada ahli lain sebagai kawan:

Arah panah menunjukkan siapa "kawan" yang pertama, atau yang memulakan interaksi kebanyakan masa.

Asas perkataan awan untuk analisis ramalan

Pertimbangkan senarai perkataan atau konsep yang disusun sebagai awan perkataan - perwakilan grafik semua perkataan dalam senarai, yang menunjukkan saiz setiap perkataan sebagai proporsional kepada metrik yang anda nyatakan. Sebagai contoh, jika anda mempunyai spreadsheet perkataan dan kejadian dan anda ingin mengenal pasti perkataan yang paling penting, cuba awan perkataan.

Kata kerja awan kerana kebanyakan data organisasi adalah teks; contoh biasa ialah penggunaan istilah Twitter. Setiap istilah dalam perwakilan ini mempunyai berat yang mempengaruhi ukurannya sebagai penunjuk kepentingannya.

Satu cara untuk menentukan berat badan itu adalah dengan beberapa kali perkataan muncul dalam pengumpulan data anda. Selalunya perkataan muncul, "berat" beratnya - dan semakin besar ia muncul di awan.

Cara menggunakan perwakilan burung untuk menganalisa analisis ramalan

Tingkah laku semulajadi secara umum adalah sistem penganjur diri di mana objek (khususnya, makhluk hidup) cenderung berkelakuan sesuai dengan (a) persekitaran yang mereka milik dan (b) tindak balas mereka terhadap objek sedia ada yang lain. Tingkah laku alam sekitar semulajadi seperti lebah, lalat, burung, ikan, dan semut - atau, untuk perkara itu, orang - juga dikenali sebagai kecerdasan .

Burung mengikuti peraturan semula jadi apabila mereka berkelakuan sebagai kawanan. Kawan kawanan adalah burung yang terletak dengan jarak tertentu dari satu sama lain; burung-burung itu dianggap serupa. Setiap burung bergerak mengikut tiga peraturan utama yang mengatur tingkah laku berduyun.

  • Pemisahan: Rakan sekutu tidak boleh bertembung dengan satu sama lain.

  • Alignment: Rakan sekelompok untuk bergerak dalam arah purata yang sama seperti jiran-jiran mereka.

  • Perpaduan: Rakan sekelompok berpindah mengikut kedudukan purata atau lokasi kawan-kawan mereka.

Memodelkan ketiga-tiga peraturan ini membolehkan sistem analisis mensimulasikan perilaku berkelompok. Dengan menggunakan tingkah laku semulajadi yang dianjurkan oleh burung, anda boleh menukar hamparan langsung ke visualisasi.Kuncinya ialah untuk menentukan tanggapan kesamaan sebagai sebahagian daripada data anda. Mulakan dengan beberapa soalan:

  • Apa yang menjadikan dua objek data dalam data anda serupa?

  • Atribut-atribut yang mana yang terbaik dapat memacu persamaan antara dua rekod data?

Sebagai contoh, dalam data rangkaian sosial, rekod data mewakili pengguna individu; ciri-ciri yang menggambarkannya boleh termasuk Umur, Kod Zip, Status Hubungan, Senarai Kawan, Bilangan Kawan, Tabiat, Peristiwa

Cara Menggambarkan Data Raw Analisis 'dummies

Pilihan Editor

Cara RSVP ke Acara di Ning - patung

Cara RSVP ke Acara di Ning - patung

Di Ning, setelah anda menemukan persidangan itu mencari atau parti yang ingin anda hadiri, anda perlu RSVP untuk acara tersebut supaya pihak penganjur boleh mendapatkan jumlah minuman, makanan dan barang yang sesuai untuk semua peserta - dan juga rakan-rakan rangkaian anda yang tahu anda akan pergi . Untuk RSVP ...

Cara Menghantar Mesej Peribadi di Ning - dummies

Cara Menghantar Mesej Peribadi di Ning - dummies

Mesej hanya dengan dua kumpulan orang: rakan anda dan Pentadbir (termasuk Pencipta Rangkaian). Mesej peribadi Ning memberi anda cara yang ideal sebagai ahli untuk berkomunikasi dengan ahli-ahli lain dalam rangkaian tanpa semua orang mengetahui tentangnya:

Pilihan Editor

Dimensi web untuk Infographics anda - dummies

Dimensi web untuk Infographics anda - dummies

Cabaran untuk menilai infographic untuk web adalah saiz reka bentuk kini sangat berubah , tiada standard untuk bercakap. "Reka bentuk responsif" yang dibawa dengan kemunculan HTML5 mengubah landskap reka bentuk web secara kekal. Tidak seperti grafik yang dicetak, di mana setiap orang yang melihatnya mengalaminya dalam saiz yang sama, ...

Pilihan Editor

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Bagaimana Menganalisis Sentimen dan Kesan Penglibatan Media Sosial Anda - pemahaman

Komuniti mempunyai tindak balas yang positif, negatif, atau neutral kepada anda dan jenama anda boleh membantu anda menentukan bagaimana untuk terus mengendalikan pendekatan penglibatan media sosial anda. Bagaimana anda mengukur pesaing dalam minda penonton dalam talian anda adalah satu lagi faktor penting untuk dinilai. Anda juga boleh memanfaatkan ...

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Cara Tanya Ahli Komuniti Dalam Talian untuk Ulasan - dummies

Tidak ada yang salah dengan menjangkau para blogger, penulis, dan ahli komuniti dalam talian lain dan bertanya kepada mereka jika mereka berminat untuk menyemak jenama atau komuniti anda. Perbezaan antara penginjilan jenama dan melakukan kajian semula adalah bahawa penginjil jenama tidak mengkaji: Mereka mempromosikan, dan mereka diberi pampasan sebagai pertukaran untuk promosi mereka. Penilai, di ...

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Cara Mengiklankan Syarikat Anda melalui Penajaan Blog - patung

Untuk cara percikan untuk dilihat blog atau laman web, pertimbangkan menaja laman web ini. Penajaan untuk blog popular telah mendapat banyak perhatian dalam blogosphere. Sesetengah blogger menyeru menerima tajaan "menjual keluar," tetapi yang lain menganggapnya sebagai cara terbaik untuk mendapatkan bayaran untuk melakukan apa yang mereka suka. Penajaan cenderung kepada ...