資料集品質提升機制(草案)(凍結)

(以 https://gov2g0v.hackpad.com/0T28wqhR2EW 優先)

依據使用者回饋態樣

回饋態樣 則數
資料集下載連結有問題 330
資料集內容有誤 269
建議提供其他結構化檔案格式 145
資料集內容亂碼 126
欄位定義不明確 100
更新頻率建議 66
內容品質建議 46
檔案格式錯誤 4

目前整理出的七種建議評策指標:

遭遇問題:

  1. 會議紀錄等現行以PDF格式放置之資料資源,是否符合政府資料開放之定義?

法條範例:「法務部全國法規資料庫」http://law.moj.gov.tw/PublicData/DevelopGuide.aspx

(載點: http://law.moj.gov.tw/PublicData/GetFile.ashx?DType=XML&AuData=CF

會議紀錄範例:

資料集品質評鑑機制(草案)

摘要說明

2016.8.17版

        

為提升政府開放資料內容之正確性、易用性、即時性及採適當格式開放,使政府開放資料之運用價值得以最大化,爰依據政府資料開放進階行動方案規定,參考如世界銀行、Open Knowledge International (OKI)、Open Data Barometer等國際國際推動資料開放相關組織之經驗,並以減輕各機關承辦同仁作業負荷之基礎下,研擬可滾動修正之資料品質評鑑機制,以強化各機關資料開放品質觀念、並逐步提升開放資料之可用性。

 

分析政府資料開放平臺互動專區內,於開站以來至2016年8月14日之資料使用者反義意見回饋整理如下表1,本評鑑機制以處理多數民眾反映之品質改善建議為設計規劃,另以104年1月1日以後新增或異動之資料集為評鑑標的,以符合政府資料開放進階行動方案所規定之:103年12月之前所產製之資料,經清理且確認權利完整後,得先依現有格式開放,後續更新時,建議適時投入資源,改善開放格式,提升資料品質。104年起新增之資料,單一文件需符合ODF-CNS15251標準格式為原則,資料集採開放格式(如JSON等)或應用程式介面(API或Web Service)等方式提供容易取得且具結構性與時效性之高品質資料。                 

回饋態樣 則數
資料集下載連結有問題 330
資料集內容有誤 269
建議提供其他結構化檔案格式 145
資料集內容亂碼 126
欄位定義不明確 100
更新頻率建議 66
內容品質建議 46
檔案格式錯誤 4

統計區間:2013.04 ~ 2016.07  

表1 使用者回饋態樣

綜整資料使用者之資料品質意見回饋,依據資料集之資料資源狀態研擬相應之評核指標,並組織為四大評核構面,採機器測試為主,人工檢測為輔,四大評核構面及其評核指標臚列如下表2:

評核構面 評核指標 權重
資料可取得 連結有效性 15%
資料資源能否直接下載 15%
資料易於被處理 結構化 20%
詮釋資料內容 詮釋資料 10%
詮釋資料 10%
資料 10%
民眾 民間回應錯誤之回復效率 20%

表2 評核構面與評核指標

        

        

        

        

各評核指標將轉化為百分比之形態,並搭配雷達圖於政府資料開放平臺公開,並將可於政府資料開放平臺後臺以部會管理者身分匯出各機關所屬資料集之檢核清冊,以利各機關自行檢視有改善空間之評核指標及相應資料集。

本次評核指標主要目的在於藉由以圖形化呈現評核結果,讓各機關得以快速瞭解資料集品質較弱項目並改善之,同時強化各機關業務承辦同仁資料品質之概念。

目前於有關資料品質部份,尚有許多面向尚待研議:

This pad text is synchronized as you type, so that everyone viewing this page sees the same text.  This allows you to collaborate seamlessly on documents!