Video: Week 10 2024
Privasi data adalah isu besar untuk penambang data. Laporan berita menggariskan tahap data peribadi di tangan Agensi Keselamatan Negara AS dan pelanggaran sumber data komersial telah meningkatkan kesedaran dan kebimbangan orang ramai.
Konsep sentral dalam privasi data adalah maklumat peribadi (PII), atau sebarang data yang dapat dikesan dengan individu yang diterangkannya. PII termasuk pengenal jelas seperti nama, nombor kad kredit, dan nombor keselamatan sosial, dan kebanyakan penambang data sedar bahawa data semacam ini bersifat peribadi dan mesti ditangani dengan berhati-hati. Tetapi PII merujuk kepada lebih daripada sekadar pengenal jelas ini.
Sebarang data yang boleh digunakan untuk mengenal pasti individu, walaupun berbuat demikian memerlukan menggunakan beberapa bidang dalam gabungan atau memanipulasi data dalam beberapa cara, juga PII. Sangat mudah bagi penambang data untuk mengabaikan data jenis ini, jenis yang tidak muncul di permukaan menjadi peribadi, namun dapat cukup untuk pengenalan diri jika dimanipulasi untuk tujuan itu. Sekiranya ada data yang boleh dimanipulasi untuk mengenal pasti individu, ia mesti ditangani dengan langkah berjaga-jaga yang sama seperti yang anda berikan senarai nombor kad kredit.
Di sinilah penambang data boleh dengan mudah mendapatkan masalah dalam diri mereka. Terdapat banyak cara untuk mengenal pasti individu jika anda melakukan sedikit usaha untuk melakukannya. Dalam satu contoh yang ketara, AOL Research mengeluarkan rekod carian pengguna untuk kegunaan penyelidikan. Data itu bertujuan untuk menjadi tanpa nama, tidak ada nama di dalamnya, tetapi The New York Times melaporkan bahawa ia telah dapat mengenal pasti individu dari data carian dengan merujuk silang dengan penyenaraian telefon. Kemudian, Netflix membuat data penarafan filem yang tersedia untuk digunakan dalam pertandingan, dan tidak lama kemudian mendedahkan bahawa data ini juga boleh digunakan untuk mengenal pasti individu.
Dalam kerja anda sebagai pelombong data, anda mungkin mempunyai pengalaman dengan calon pelanggan yang berkongsi data yang mereka nyatakan tidak diketahui (atau bahkan dipalsukan, untuk menggambarkan titik diskusi), tetapi mendapati data itu tiada apa-apa. Mengetahui atau tidak, orang-orang ini melanggar undang-undang privasi data dan mempamerkan kekurangan menghormati pelanggan mereka sendiri.
Jadi, bagaimanakah anda dapat mencegah bencana seperti ini? Jangan cuba buat sendiri. Ia mencabar untuk memastikan pematuhan dengan semua undang-undang privasi data yang relevan, belum lagi amalan perniagaan yang baik. Jenny Juliany, Naib Presiden Senibina Penyelesaian dan Pengasas Bersama Intreis, penyepadu penyelesaian dalam pengurusan perkhidmatan dan automasi kepatuhan, menerangkan kitar hayat data dengan analogi kepada empat musim:
-
Musim Semi: Permulaan, data dicipta.
-
Musim panas: Primetime, data sedang digunakan aktif.
-
Jatuh: Persaraan, data tidak lagi relevan atau digunakan, tetapi mungkin ada sebab undang-undang atau alasan lain untuk mengekalkannya.
-
Musim Sejuk: Pembuangan, data dimusnahkan.
Setiap musim mempunyai ciri-ciri tersendiri, dengan keperluan yang berbeza mengelilingi privasi data. Ada yang didasarkan pada undang-undang, yang lain masuk akal, dan masih ada orang lain dalam perjanjian individu dengan klien dan amalan perniagaan majikan anda sendiri. Ia tidak realistik untuk mempercayai anda boleh mengambil semua butir-butir pematuhan ini sebagai tambahan kepada peranan utama anda, jadi anda harus bekerjasama dengan profesional pengurusan data organisasi anda.
Anda tidak mahu menjadi pusat skandal privasi data besar seterusnya. Menghormati privasi data dan pengurusan data yang betul adalah kunci untuk meminimumkan risiko itu. Jangan tunggu sehingga ada masalah, hubungi pakar privasi data dalam organisasi anda hari ini, dan mula membina perkongsian kerja untuk mengurus data sensitif dengan betul.
Lebih terperinci mengenai kitaran hayat data daripada Jenny Juliany di Four Seasons of Data Management boleh didapati di sini:
-
'Spring' Permulaan
-
'Musim Panas' Primetime
-
'Musim Luruh' Persiapan
-
'Musim Sejuk 'Pemecatan