Isi kandungan:
- Menggali data. gov
- Memeriksa Data Terbuka Kanada
- Menyelam ke dalam data. gov. uk
- Memeriksa Data Biro Banci AS
- Sejak penubuhannya pada tahun 1958, NASA telah mempublikasikan semua data projek yang tidak diklasifikasikannya. Ia telah berada dalam permainan data terbuka begitu lama bahawa NASA mempunyai banyak data! Data NASA telah berkembang lebih cepat dengan penambahbaikan teknologi satelit dan komunikasi baru-baru ini. Malah, NASA kini menjana 4 terabyte data sains bumi baru setiap hari - bersamaan dengan lebih sejuta fail MP3.Banyak projek NASA telah mengumpulkan data ke dalam petabyte.
- Bank Dunia adalah institusi kewangan antarabangsa yang dijalankan oleh Pertubuhan Bangsa-Bangsa Bersatu. Ia menyediakan pinjaman kepada negara-negara membangun untuk membayar pelaburan modal yang akan membawa (satu harapan) kepada pengurangan kemiskinan dan beberapa lebihan supaya negara penerima dapat membayar jumlah pinjaman dari masa ke masa. Oleh kerana pegawai Bank Dunia perlu membuat keputusan yang tepat mengenai negara mana yang akan lebih mungkin untuk membayar balik pinjaman mereka, mereka telah mengumpulkan sejumlah besar data di negara anggota. Mereka telah membuat data ini tersedia kepada orang ramai di halaman Data Terbuka Bank Dunia.
- siri masa
- crowdsourcing
- fork
- Platform OSM cukup kuat. Kerajaan dan syarikat swasta telah mula menyumbang kepada, dan menarik dari, kumpulan data yang dikongsi. Malah syarikat-syarikat yang besar seperti Apple bergantung pada data OSM. OSM kini mempunyai lebih daripada 1 juta pengguna berdaftar. Untuk menggambarkan bagaimana seseorang boleh membuat data dalam OSM, bayangkan bahawa seseorang menghubungkan sistem GPS pada telefon bimbitnya ke aplikasi OSM. Oleh kerana kebenaran ini, OSM secara automatik boleh mengesan laluan jalan ketika orang itu bergerak. Kemudian, orang ini (atau pengguna OSM yang lain) boleh masuk ke platform dalam talian OSM untuk mengesahkan dan melabelkan laluan.
Video: Fakta Data: Paspor Sakti Siapa Punya 2024
Data terbuka adalah sebahagian daripada trend yang lebih besar ke arah pemahaman idea harta intelek yang kurang ketat, yang semakin popular dalam dekad yang lalu. Data terbuka adalah data yang telah tersedia secara umum dan dibenarkan untuk digunakan, digunakan semula, dibina dan dikongsi dengan orang lain. Data terbuka adalah sebahagian daripada pergerakan terbuka.
Di luar data terbuka, ini juga dinamakan pergerakan terbuka juga termasuk perisian sumber terbuka, perkakasan terbuka, kerja kreatif terbuka, akses terbuka kepada jurnal saintifik dan sains terbuka - semuanya komited kepada tanggapan bahawa kandungan (termasuk data mentah dari eksperimen) harus dikongsi dengan bebas.
Ciri membezakan lesen terbuka adalah bahawa mereka mempunyai copyleft dan bukan hak cipta. Dengan copyleft, satu-satunya sekatan adalah bahawa sumber kerja mesti dikenalpasti, kadang-kadang dengan kaveat bahawa karya terbitan tidak boleh berhak cipta dengan lesen yang lebih ketat daripada yang asal. Sekiranya keadaan kedua berkuatkuasa, berjaya mengkomersialkan kerja itu sendiri menjadi sukar, walaupun orang sering mencari banyak jalan komersil yang tidak langsung dan kreatif.
Perhatikan bahawa kadang-kadang kerja yang dilabel sebagai terbuka mungkin tidak sesuai dengan definisi yang diterima. Anda bertanggungjawab untuk memeriksa hak pelesenan dan sekatan data terbuka yang anda gunakan.
Orang sering mengelirukan lesen buka dengan lesen Creative Commons. Creative Commons adalah organisasi yang bukan keuntungan yang didedikasikan untuk menggalakkan dan menyebarkan karya-karya kreatif dengan menawarkan rangka kerja perundangan yang membolehkan kebenaran penggunaannya diperoleh dan diperoleh, supaya pihak-pihak yang berkongsian selamat dari risiko hukum ketika membangun dan menggunakan kerja dan pengetahuan yang telah dikongsi secara terbuka. Sesetengah lesen Creative Commons dibuka, dan sesetengahnya mengharamkan karya derivatif dan / atau pengkomersialan secara jelas.
Sebagai sebahagian daripada inisiatif kerajaan terbuka yang lebih baru, kerajaan di seluruh dunia mula melepaskan data kerajaan yang terbuka. Kerajaan umumnya menyediakan data ini agar dapat digunakan oleh penganalisis sukarelawan dan peretas sivik - pengaturcara yang bekerjasama untuk membina penyelesaian sumber terbuka yang menggunakan data terbuka untuk menyelesaikan masalah sosial - dalam usaha untuk memberi manfaat kepada masyarakat besar. Pada tahun 2013, negara-negara G8 (Perancis, Amerika Syarikat, United Kingdom, Rusia, Jerman, Jepun, Itali, dan Kanada) menandatangani piagam untuk membuka data, mengutamakan bidang statistik kebangsaan, keputusan pilihan raya, dan peta kebangsaan.
Pergerakan kerajaan terbuka menggalakkan ketelusan dan akauntabiliti kerajaan, memupuk pengundi yang bermaklumat, dan menggalakkan penglibatan orang awam. Untuk memasukkannya dalam istilah pengkomputeran, kerajaan terbuka memudahkan hubungan baca / tulis antara kerajaan dan rakyatnya.
Menggali data. gov
Data. Program gov telah dimulakan oleh pentadbiran Obama untuk menyediakan akses terbuka kepada data kerajaan U. S. yang tidak diklasifikasikan. Data. data govi sedang dihasilkan oleh semua jabatan di cawangan eksekutif - Gedung Putih dan semua jabatan peringkat Kabinet - serta dataset dari peringkat lain kerajaan. Menjelang pertengahan 2014, anda boleh mencari lebih 100,000 data dengan menggunakan Data. carian kerajaan. Laman web ini adalah sumber yang tiada tandingannya jika anda mencari data yang diperoleh oleh kerajaan Amerika Syarikat mengenai penunjuk berikut:
- Ekonomi
- Alam Sekitar
- Industri STEM
- Kualiti hidup
- Undang-undang
Memeriksa Data Terbuka Kanada
Jika anda melihat laman web Terbuka Kanada Data, komitmen kuat negara terhadap data sangat jelas. Di laman web Data Terbuka Kanada, anda boleh menemui lebih daripada 200,000 data. Antara 25 tawaran paling popular di laman Data Terbuka Kanada adalah kumpulan data yang meliputi penunjuk berikut:
- Alam Sekitar
- Kewarganegaraan
- Kualiti hidup
Menyelam ke dalam data. gov. uk
Kerajaan United telah mula terlambat dalam gerakan kerajaan terbuka. Data. gov. uk telah dimulakan pada tahun 2010, dan menjelang pertengahan 2014, hanya kira-kira 20,000 set data belum tersedia. Seperti Data. gov, data. gov. uk juga dikuasakan oleh katalog data CKAN.
Walaupun data. gov. uk masih bermain catch-up, ia mempunyai koleksi Peta Ordnance Survey yang cukup lama - 50 tahun atau lebih - untuk keluar dari hak cipta. Jika anda mencari peta survei yang terkenal di dunia, data kegunaan menggunakan data. gov. uk adalah tempat yang luar biasa untuk anda meneroka. Di luar peta kaji selidik yang cemerlang, data. gov. uk adalah sumber yang berguna untuk data mengenai penunjuk berikut:
- Alam Sekitar (tema yang paling produktif di UK)
- Perbelanjaan Kerajaan
- Sosial
- Kesihatan
- Pendidikan
- Perniagaan dan ekonomi
Memeriksa Data Biro Banci AS
Banci Amerika Syarikat diadakan setiap sepuluh tahun, dan sejak 2010, data telah dibuat secara bebas. Statistik boleh didapati ke tahap blok banci - yang dikagregat oleh kira-kira 30 orang, secara purata. Data demografi yang disediakan oleh Biro Banci AS boleh sangat membantu jika anda melakukan pemasaran atau penyelidikan iklan dan perlu menargetkan penonton anda mengikut klasifikasi berikut:
- Umur
- Pendapatan tahunan purata
- Ukuran rumah tangga < Jantina atau bangsa
- Tahap pendidikan
- Mengetahui Data NASA
Sejak penubuhannya pada tahun 1958, NASA telah mempublikasikan semua data projek yang tidak diklasifikasikannya. Ia telah berada dalam permainan data terbuka begitu lama bahawa NASA mempunyai banyak data! Data NASA telah berkembang lebih cepat dengan penambahbaikan teknologi satelit dan komunikasi baru-baru ini. Malah, NASA kini menjana 4 terabyte data sains bumi baru setiap hari - bersamaan dengan lebih sejuta fail MP3.Banyak projek NASA telah mengumpulkan data ke dalam petabyte.
Portal data terbuka NASA dipanggil data. Portal ini adalah sumber semua jenis data yang indah, termasuk data mengenai
Astronomi dan ruang (sudah tentu!)
- Iklim
- Sains hayat
- Geologi
- Kejuruteraan
- Wrangling World Bank Data
Bank Dunia adalah institusi kewangan antarabangsa yang dijalankan oleh Pertubuhan Bangsa-Bangsa Bersatu. Ia menyediakan pinjaman kepada negara-negara membangun untuk membayar pelaburan modal yang akan membawa (satu harapan) kepada pengurangan kemiskinan dan beberapa lebihan supaya negara penerima dapat membayar jumlah pinjaman dari masa ke masa. Oleh kerana pegawai Bank Dunia perlu membuat keputusan yang tepat mengenai negara mana yang akan lebih mungkin untuk membayar balik pinjaman mereka, mereka telah mengumpulkan sejumlah besar data di negara anggota. Mereka telah membuat data ini tersedia kepada orang ramai di halaman Data Terbuka Bank Dunia.
Jika anda mencari data untuk menegaskan hujah anda dalam sekeping data-jurnalisme yang menarik yang disokong oleh statistik global, Bank Dunia harus menjadi sumber anda. Tidak kira skop projek anda, jika anda memerlukan data mengenai apa yang berlaku di negara-negara membangun, Bank Dunia adalah tempat untuk pergi. Anda boleh menggunakan laman web untuk memuat turun seluruh dataset atau hanya melihat visualisasi data dalam talian. Anda juga boleh menggunakan API Data Terbuka Bank Dunia untuk mengakses apa yang anda perlukan.
Data Terbuka Bank Dunia membekalkan data ke atas petunjuk berikut (dan banyak, banyak lagi):
Pertanian dan pembangunan luar bandar
- Ekonomi dan pertumbuhan
- Persekitaran
- Sains dan teknologi
- Sektor kewangan < Pendapatan kemiskinan
- Data Bank Dunia juga termasuk
- microdata
- tinjauan sampel isi rumah dan perniagaan di negara-negara membangun. Anda boleh menggunakan microdata untuk meneroka variasi dalam dataset anda. Mengenali Knoema Data Knoema (diucapkan "no-mah") berupa sebagai repositori terbesar data awam di web. Platform Knoema menempatkan 500+ pangkalan data yang mengagumkan, di samping 150 juta
siri masa
- 150 juta koleksi data pada nilai atribut dari masa ke masa, dengan kata lain. Knoema termasuk, tetapi tidak terhad kepada, semua sumber data: Data kerajaan dari negara industri Data awam negara dari negara-negara membangun
- Data Pertubuhan Bangsa-Bangsa
- Data organisasi antarabangsa
- syarikat global
- Knoema adalah sumber luar biasa jika anda mencari data antarabangsa mengenai pertanian, statistik jenayah, demografi, ekonomi, pendidikan, tenaga, alam sekitar, keselamatan makanan, perdagangan luar negeri, kesihatan, penggunaan tanah, pertahanan negara, kemiskinan, penyelidikan dan pembangunan, telekomunikasi, pelancongan, pengangkutan, atau air.
- Sebagai tambahan kepada sumber data yang luar biasa, Knoema adalah platform tugas pelbagai fungsi. Anda boleh menggunakan platform Knoema untuk membuat papan pemuka yang mengesan semua kumpulan data kegemaran anda. Anda boleh menggunakan alat visualisasi data platform untuk dengan cepat dan mudah melihat data anda dalam format jadual atau peta.Anda boleh menggunakan Atlas Data Knoema untuk mengetengahkan antara kategori dan / atau kawasan geografi dan dengan pantas mengakses set data khusus yang anda perlukan. Sebagai individu, anda boleh memuat naik data anda sendiri dan menggunakan Knoema sebagai perkhidmatan hosting percuma. Di atas dan di luar semua ini, Knoema bahkan menawarkan Pasar Knoema - tempat di mana Anda dapat pergi untuk dibayar hanya untuk menjadi bagian dari proyek yang didorong data.
Walaupun banyak data Knoema cukup umum, anda masih dapat mencari beberapa data yang menghairankan juga. Sekiranya anda mengalami kesukaran mencari data pada topik tertentu, anda mungkin mempunyai nasib mencarinya di platform Knoema. Angka itu menggambarkan betapa spesifik data Knoema dapat.
Indeks rekod serangga dalam pencarian Knoema.
Beratur dengan Quandl Data
Quandl adalah laman web berasaskan Toronto yang bertujuan untuk menjadi enjin carian untuk data berangka. Tidak seperti kebanyakan enjin carian, namun pangkalan datanya tidak dihasilkan secara automatik oleh labah-labah yang merangkak web. Sebaliknya, ia memberi tumpuan kepada data berkaitan yang dikemas kini melaluicrowdsourcing
- dikemas kini secara manual melalui kurator manusia, dengan kata lain. Oleh kerana kebanyakan data kewangan dalam format berangka, Quandl adalah alat yang sangat baik untuk mengetahui maklumat terbaru mengenai informatika perniagaan terkini. Seperti yang anda dapat lihat, carian untuk Apple
mengembalikan lebih daripada 4, 700 set data dari 11 sumber berbeza dengan siri masa di peringkat harian, mingguan, bulanan, suku tahunan atau tahunan. Kebanyakan keputusan ini berkaitan dengan data pertanian Pertubuhan Bangsa-Bangsa Bersatu. Jika anda mencari data pada Komputer Apple, anda boleh menyempitkan skop carian anda dengan menggantikan istilah carian Apple dengan singkatan saham syarikat, AAPL. Indeks rekod Apple dalam carian Quandl. Pangkalan data Quandl termasuk pautan ke lebih dari 10 juta dataset (walaupun menggunakan metrik murah hati dalam menyatakan apa yang membezakan satu dataset dari yang lain). Quandl menghubungkan kepada 2. 1 juta dataset PBB dan banyak sumber lain, termasuk dataset dalam Projek Data Kewangan Terbuka, bank-bank pusat, organisasi harta tanah, dan tangki-tompok berfikir yang terkenal.
Meneroka Data ExversionDimodelkan selepas GitHub - platform yang dihoskan awan di mana pengaturcara boleh berkongsi dan mengkaji secara berkumpulan - Exversion bertujuan untuk menyediakan fungsi kerjasama yang sama di sekitar data yang disediakan oleh GitHub di sekitar kod. Platform Exversion menawarkan fungsi pengendalian versi dan perkhidmatan hosting yang mana anda boleh memuat naik dan berkongsi data anda. Untuk menggambarkan bagaimana Exversion berfungsi, bayangkan platform yang membolehkan anda untuk pertama
fork
(atau menyalin) dataset dan kemudian buat perubahan yang anda inginkan. Exversion akan berada di sana untuk menjejaki apa yang telah berubah dari set asal dan setiap perubahan yang anda buat kepadanya. Exversion juga membolehkan pengguna menilai, meninjau, dan mengulas pada dataset. Dataset yang dihoskan pada platform Exversion sama ada disediakan oleh pengguna atau dibuat oleh labah-labah yang merangkak dan mengindeks data terbuka untuk menjadikannya dapat dicari dari antara muka pengaturcaraan aplikasi tunggal (API).Seperti GitHub, dengan akaun pengguna percuma, semua data yang anda muat naik ke Exversion adalah awam. Jika anda bersedia membayar untuk akaun, anda boleh membuat repositori data peribadi anda sendiri. Selain itu, dengan akaun berbayar, anda mendapat pilihan untuk berkongsi data anda dengan pengguna terpilih untuk projek-projek kerjasama. Pemetaan OpenStreetMap Data Spatial
OpenStreetMap (OSM) adalah alternatif yang terbuka untuk orang ramai untuk produk pemetaan komersil seperti Google Maps dan ESRI ArcGIS Online. Di OSM, pengguna membuat, memuat naik, atau mendigitalkan data geografi ke dalam repositori pusat.
Platform OSM cukup kuat. Kerajaan dan syarikat swasta telah mula menyumbang kepada, dan menarik dari, kumpulan data yang dikongsi. Malah syarikat-syarikat yang besar seperti Apple bergantung pada data OSM. OSM kini mempunyai lebih daripada 1 juta pengguna berdaftar. Untuk menggambarkan bagaimana seseorang boleh membuat data dalam OSM, bayangkan bahawa seseorang menghubungkan sistem GPS pada telefon bimbitnya ke aplikasi OSM. Oleh kerana kebenaran ini, OSM secara automatik boleh mengesan laluan jalan ketika orang itu bergerak. Kemudian, orang ini (atau pengguna OSM yang lain) boleh masuk ke platform dalam talian OSM untuk mengesahkan dan melabelkan laluan.
Data dalam OSM tidak disimpan sebagai peta, tetapi sebagai perwakilan geometrik dan teks - titik, garisan, poligon, dan penjelasan peta - supaya semua data OSM dapat dimuat turun dengan cepat dari laman web dan mudah dipasang ke dalam perwakilan kartografi melalui aplikasi desktop.