decoding data 線上手冊

近一兩年來,台灣開始關注數據新聞/數據資料報導,也有鼓吹記者要「捲起袖子」自己動手學寫程式。其實我對台灣記者的期待水準,只盼記者大大們能先好好把中文寫正確寫好讓人讀起來順暢,至於還要他們搞什麼數據分析寫程式作圖表之類的要求,呃,恐怕前一個要求尚未達標的話,所謂的數據分析報導也只是另一種嘩眾取寵的賣弄吧。

好吧,就在這一個集體墮落,嘩眾取寵已經成為抓住眼球的鬼島,還是應該偶而仰望一下其它地方的新聞媒體工作者/人權NGO工作者,是如何看待自己的使命,進而利用數位技術開發各種工具,充份利用這些工具來幫助使命達成目標。過去我曾經寫過幾篇文章介紹Tactical Technology Collective開發推廣的網路工具資源:Visualising information for advocacy part I (咦,當時好像打算多寫幾篇介紹,但到今天仍然只有趴萬......)、Info-Activism Toolkit: Women’s Rights Campaigning 女權倡議工具箱 密碼管理軟體GPG加密金鑰do not track 別跟蹤我。而今年Info Activism又推出了Decoding data 這個專案,來幫助公民記者,人權捍衛者,有興趣深入挖掘社會議題的網民們,如何「解析、拆解資料(數據)」

decoding data

為何什麼取名「解析、拆解資料」呢?我自己不負責任的解釋是:當媒體們一窩蜂地提供各種資訊圖表,製作各類互動數據新聞呈現工具,當記者也得自己來摸熟excel 函數密技,弄懂如何在90分鐘學會使用python 進行網路爬蟲,這本工具書,卻是先帶領讀者先從最基本基礎的蹲馬步工夫弄懂什麼叫作資料,如何找資料、收集、分析、保護、甚致是回到原點的倫理課題關照等等課題,故全書分為以下八章:

Finding (找資料)
Collecting(收集)
Analysing(分析)
Networks(資料的網絡)
Metadata(後設資料)
Verification(檢證確認)
Protect(保護)
Ethics(倫理)

每一章的撰寫呈現方式,大抵就是先從實來簡單陳述該主題章節對於調查報導的相關性,或者先作點基本的辭彙說明(例如metadata那章,一開始就把一般人難以理解想像的「後設資料」作了清晰譬喻說明),而每章最後,則會整理出相關資源工具回應該主旨,協助讀者進行:找資料,收集資料......保護相關數據等工作。

例如我前幾天看到臨時政府g0v.tw 的「台灣公司關係圖」專案為例,我們的確需要一些認真揭露台灣財團資本與人脈地圖的調查資訊,並以視覺化易操作的方式將之數位化地呈現,但是從經濟部商業司提供全台公司登記資料爬蟲,我才知道台灣的「公司法」規定($393條):公司登記事項,主管機關應予公開,......任何人得至主管機關之資訊網站查閱。然而這樣不論資本額大小一律被公佈,這是否合乎比例性或必要性,還是就是方便主管者便宜行事?

不妨讀讀手冊裏在「protection」裏的這段文字:

“Protect private data, exploit public data”. This can be interpreted as: all data that identifies persons who have no power over society should be protected, and all data which is public or concerns persons who hold power over society must be utilized to the fullest for the benefit of society. Public data also includes all data that has been produced with public money, such as a national curriculum, legal texts and the data collected by tax and statistics authorities. Making such data transparent creates opportunities to hold these powers accountable. However, transparency alone is not enough. This information must be used to keep powers in check.

我自己在一開始閱讀該手冊的過程中,就不斷納悶,「我(們)」為何不曾這麼嚴肅地看看重這些看似無關緊要的(個人)數據以及重視通訊過程中的加密保護或原始數據查證,有必要作到這些步驟(到此種程度)嗎?當某一群人權捍衛者/調查報導記者正每天每日地面對著來自國家(財團)的嚴峻恐嚇打壓,然後逼得他們練就這一身不得不小心翼翼也更一亳不苟的工作技術與專業倫理,反過來想,「我(們)」所以為面對的這個社會的成熟、透明與法治,已足以讓擁有權力財力和武力的國家(財團)立正循矩,「我(們)」到底有多麼天真幼稚啊。

高度推薦這「解析、拆解資料」線上手冊來練功防身,在這人人皆曰調查報導資料事實的時代裏,先學習如何認真看待每一筆微小數據的質量吧。

Free software and open source tools for investigative journalism and journalistic research

1 意見:

a5288 said...

順便用這篇文章作一下筆記

Improve Your Data Literacy: 16 Blogs to Follow in 2016http://gijn.org/2016/02/01/improve-your-data-literacy-16-blogs-to-follow-in-2016/

My Instagram