「消失的檔案」:香港開放數據大檢討 | Initium Lab | Exploratory Arm of Initium Media

「消失的檔案」:香港開放數據大檢討

隨著近期一部焦點紀錄片《消失的檔案》的放映,香港的檔案制度的不完善與檔案法的缺席引起熱議,討論的話題也延伸到香港的「開放數據」問題上。開放數據(Open Data)一般是指「政府或商業機構所獲取的大量數據開放給民間或其他持份者自由使用,而且資料是可供機器讀取(machine-readable)的格式發放」。[1]

2011年,香港政府揚言打造「智慧城市」,其中一項工作範疇便是數據開放。2016年行政長官再施政報告中再次承諾開放更多公共數據以供機構或個人開發流動應用程序。但是,根據英國「開放知識基金會」(OKFN)公布的2015年全球各地的開放資料指數,香港表現不佳,僅列全球第37位,不及勇奪桂冠的台灣,更落後於印度、韓國、新加坡和日本等亞洲國家。[2]

為何香港「開放數據」步履維艱?綜合近年來二十餘篇分析文章和相關報導,小編從政府、法律、企業和民眾四大方便的現狀,嘗試「一探究竟」:

政府:態度保守、認識落後、缺乏積極

1. 政府所公開的數據(包括「資料一線通」網站)問題重重。

港區政府於2011年推出公共資料入門網站「資料一線通」,由「政府資訊科技總監辦公室」維護。其中數據集則由個政府部門/私營機構提供,可以免費下載、分發、複製和再用。[3]

Data HK

現時網站上有近7000項資料,看似資源眾多,實則大有「水份」:

首先,有用信息少,不少資料價值低,而價值高的資料又尚未開放。「資料一線通」並未集合所有政府部門的公開資料,很多涉及公共利益的內部訊息,政府依舊遮遮掩掩,諸如警務處、區議院乃至公營企業機構的數據仍大多「秘而不宣」。[4] 而所謂已公開出來的資料,則充斥著信息量較低的相片、影片、新聞稿、年報等。[5]

其次,敷衍資料多,存在「一稿多投」現象。如同一內容的繁體中文、簡體中文和英文三個版本,被算做三項資料;同一資料的不同部分於不同日期上載到網頁,被算做多項資料。更具《香港01》的深入分析,剔除內容重疊的部分,真正的資料也就2000多項,僅佔原資料總數的3成而已。[6]

再次,資料原初程度低,不少開放的數據已被預先處理,限制了數據的可塑性。網站對原始數據進行「加工」,包括運算(如總和與平均數)、製作成圖表,然後再展示出來,看似便民,實則並非最大程度發揮數據效益的正途。[7]

最後,資料可處理性低,格式不便於再用於開發。現時公開的資料,無論是立法會議員或其他組織或個人向政府索取的,還是再資料一線通或各部門網站上提供的,往往格式為PDF檔案、XLSX檔案或GIF圖像檔案,屬於開放數據中最低檔次的格式質素。雖然也有資料開放格式是便於處理CSV,但是更高檔次的格式的如XML和JSON則往往欠奉。[8] 可以以API型式給外來程式調用的原始數據也不多。

2. 政府組織架構不利推動數據開放。

開放數據進程受阻,備受責難的當屬負責推動數據公開、管理「資料一線通」網站的政府資訊科技總監辦公室。但實際上,政府中的這個機構就相當於一般企業中的IT部門,責任僅停留在技術層面,執行指令,甚少「發號施令」的權力,所以在推動其他部門公開數據中經常碰壁。[9]

其上的科創局則孤掌難鳴,缺少與其他部門的合作。政府部門的垂直架構,讓部門各自為政,本身即不利於跨部門合作的開展。[10] 再加上創科局缺乏衡量開放數據發展成效的指標制度,往往紙上談兵。[11]

3. 政府與各機構及民間開發者溝通不足。

首先,政府未對公共事業和公營機構提出開放數據要求。立法會議員莫乃光曾多次呼籲,希望政府可以在公共事業和運輸服務的牌照條款加入公開開發數據的要求。 [12] 但政府人員卻以「是否開放數據屬商業決定」為由回應,無意於相關事項 。[13]

其次,政府未對其他商業機構提供足夠的開放數據誘因。雖然政府資訊科技總監楊德斌提出未來提供誘因令商業機構自行分享數據,但具體怎樣實現,卻還沒有下文。[14]

第三,政府未與眾多民間開發者就進行充分的交流溝通。
現時政府就開放數據議題上,缺乏定期與民間開發者保持聯繫,令相關人士無從表達訴求。莫乃光便直言不諱地批評香港政府官僚中「唔好俾你知咁多嘢」的文化嚴重,恐怕是與市民溝通不暢地重要原因。[15]

法律:缺乏專門法例配合

1.《檔案法》的缺席。

全球大部分國家都有《檔案法》保護政府公文及保障民眾的知情權,但香港政府迄今為止都未有相關立法,這未免是一樁奇事。沒有強制將公務人員、活動立檔存照,造成「無檔可查」的情況屢屢出現。[16]

2.《公開資料守則》有待檢討,《資料自由法》尚未建立。

目前,香港沒有一項規定政府必須公開資料、以及怎麼公開資料的法律,只有非法定的《公開資料守則》,來「提供正式框架讓市民獲取個政府部門持有的資料」,其內容包括說明資料公開的適用範圍、程序、即投訴事宜,以及可拒絕披露材料的條件。[17]

Code

然而,《守則》卻存在著以下幾個問題:(1)它僅是一個無法律效力的「行政綱領」,約束力不強,難以落實;(2)它的執行由「政制及內地事務」高級行政主任負責,受重視程度和執行力度不夠;(3)它規制的範圍很窄,460個由公帑支付的公營機構,只有廉政公署和金管局納入規管,其他公營機構甚至連區議會都因為沒有公開資料守則。(4)自95年推出至今,近20年都未曾全面檢討和修訂。(5)它在政府是否接納某些申請的準則上規定模糊,致使相關人士若依《守則》要求政府開放某些數據,往往會被百般搪塞,費時費力,最後讓可能一無所獲。[18]

英國早於2000年把一個類似的行政守則制定出具有法律效力的《資訊自由法》,明確規定政府對公民提供資訊的責任。而香港則在相關立法上舉步維艱。[19]

3.《個人資料(私隱)條例》有待檢討。

現行隱私條例,對於何謂「重用開放數據」(reuse of public data)尚缺乏清晰界定。[20] 一方面令政府畏手畏腳、民眾疑慮叢生;另一方面則讓一些本來願意開放數據的企業,墜入相關條例的陷阱,積極性受到打擊。[21]

企業:以商業利益為由無意開放數據。

除了政府和法律,香港的企業亦有一定的責任。商業公司往往以數據是公司資產、有商業價值為由,遲遲不肯免費開放數據。譬如,屬於公共交通系統的新巴、城巴至今沒有公開自己的數據,而九巴則只願意向運輸署提供實時資訊,算是部分開放數據。僅有電車公司願意完全開放到站資料。這種狀況直接導致香港在公共交通工具智能化上飽受詬病,與新加坡向市民提供免費實時交通資訊形成鮮明對照。[22]

民眾:對開放數據缺乏認知。

社會的認知不足,同樣構成開放數據的一大障礙。不僅香港政府官員、企業負責人思維保守、缺乏遠見,就是普通人,都未必知曉開放數據之重要意義及好處,就更不要說能齊力向政府施壓打破僵局。Citymapper 香港總經理蘇頌禮便直言香港缺乏開放數據文化。[23]

除了不瞭解箇中好處,香港市民對數據開放中的「私隱」問題充滿擔心。但是,當界定「私隱」時,他們的尺度卻又游移不定。 [24] 市民的這種由於缺乏瞭解而產生的疑慮,也成為政府迴避公開資料問題的「最方便藉口」。[25]

結語:香港 Open Data 的未來,政府和市民任重道遠

在亞洲地區,香港開放數據起步於2011年,不可謂不早。但由於政策制定和執行力、以及上述的種種問題,現今卻遠遠落後於台灣、新加坡等地。後任行政長官林鄭月娥在競選期間,曾簽署由記協草擬的「新聞自由約章」,承諾在任內落實《資訊自由法》和《檔案法》,推動政府公開數據。是否真能達成,還需要時間的檢驗。[26]

香港開放數據之路坎坷漫長,恐怕還需要我們共同努力、上下求索,最終玉成其事。

參考資料: