資料集品質提升機制(草案)(凍結)

最後編輯:2016-11-10 建立:2016-08-30 歷史紀錄

LEO C(以 https://gov2g0v.hackpad.com/0T28wqhR2EW 優先)

 

依據使用者回饋態樣

*

目前整理出的七種建議評策指標:

 

 

 

 

遭遇問題:

  1. 會議紀錄等現行以PDF格式放置之資料資源,是否符合政府資料開放之定義?

 

 

法條範例:「法務部全國法規資料庫」http://law.moj.gov.tw/PublicData/DevelopGuide.aspx

(載點: http://law.moj.gov.tw/PublicData/GetFile.ashx?DType=XML&AuData=CF

  • 有沒有工具?

 

會議紀錄範例:

  • 必須欄位:"會議主題", "會議開始時間", "會議結束時間", "主席", "出席人員", etc.

 

 

 

 

 

 

 

 

 

 

 

資料集品質評鑑機制(草案)

摘要說明

2016.8.17版

 

 

  • 緣起

為提升政府開放資料內容之正確性、易用性、即時性及採適當格式開放,使政府開放資料之運用價值得以最大化,爰依據政府資料開放進階行動方案規定,參考如世界銀行、Open Knowledge International (OKI)、Open Data Barometer等國際國際推動資料開放相關組織之經驗,並以減輕各機關承辦同仁作業負荷之基礎下,研擬可滾動修正之資料品質評鑑機制,以強化各機關資料開放品質觀念、並逐步提升開放資料之可用性。

 

  • 現況說明

分析政府資料開放平臺互動專區內,於開站以來至2016年8月14日之資料使用者反義意見回饋整理如下表1,本評鑑機制以處理多數民眾反映之品質改善建議為設計規劃,另以104年1月1日以後新增或異動之資料集為評鑑標的,以符合政府資料開放進階行動方案所規定之:103年12月之前所產製之資料,經清理且確認權利完整後,得先依現有格式開放,後續更新時,建議適時投入資源,改善開放格式,提升資料品質。104年起新增之資料,單一文件需符合ODF-CNS15251標準格式為原則,資料集採開放格式(如JSON等)或應用程式介面(API或Web Service)等方式提供容易取得且具結構性與時效性之高品質資料。

*

統計區間:2013.04 ~ 2016.07  

表1 使用者回饋態樣

 

  • 評鑑方法

綜整資料使用者之資料品質意見回饋,依據資料集之資料資源狀態研擬相應之評核指標,並組織為四大評核構面,採機器測試為主,人工檢測為輔,四大評核構面及其評核指標臚列如下表2:

*

表2 評核構面與評核指標

 

 

  • 資料可取得構面
  • 包含「連結有效性」、「資料資源是否能夠直接下載」2項評核指標,評核重點如下:

*

 

 

 

    • 資料易於被處理構面
    • 包含「結構化檔案格式」1項評核指標,其目的為推動資料開放應盡可能採用結構化檔案格式,以利後續資料治理等延伸應用。評核重點如下:

*

 

 

 

    • 詮釋資料內容正確性構面
    • 包含「詮釋資料欄位描述與資料相符」、「詮釋資料編碼描述與資料相符」以及「資料更新週期」3項評核指標,其目的為推動確實填寫詮釋資料欄位並如其更新。評核重點如下:

*

 

 

    • 民眾意見回饋構面
    • 包含「民間回應錯誤之回復效率」1項評核指標,針對資料使用者於「我有話要說」當中指出資料內容錯誤之情事,並以7日(日曆天)為基準,判斷機關回復時效,以期各機關能快速修正錯誤並與民間建立良好互信關係。評核重點如下:

*

 

 

 

  • 評鑑步驟、範例及公開方式
    • 評鑑步驟
      • 適用範圍:
      • 以機關為單位進行評鑑,計算各別部會及其所屬機關(構)、地方政府之資料集、資料資源項數。
        • 以熱門資料集進行評鑑,計算瀏覽或下載次數各達1萬人次以上之資料集,評鑑範圍包含該資料集之資料資源。
      • 執行檢核:
        • 以機關為單位進行檢核,就該機關所開放之資料集及其資料資源進行各項評核指標判讀,其檢核結果分為符合/不符合兩種狀態;其中機器檢測部分含括全部之資料資源,人工檢測部分,資料更新時效性將以下載達1萬人次以上之資料集進行普查;民間回應錯誤之回復效率則以機關所屬資料集有意見回饋為「資料內容錯誤」態樣的部分進行普查。
        • 以熱門資料集進行檢核,就該資料集之資料資源進行各項評核指標判讀,其檢核結果分為符合/不符合兩種狀態;人工檢測部分,含括資料更新時效及意見回饋為「資料內容錯誤」之部分進行普查。
      • 計算評分:統計全部資料資源數量以及各資料資源數量評核結果之數量後,計算各項評核指標之百分比以進行評分。

 

 

    • 評鑑範例
      • 以機關為單位進行檢核:以A機關為例,計算其及其所屬機關(構)之資料集為500筆,資料資源為800筆。
      • 執行檢核:以「資料易於被處理」之「結構化檔案格式」進行檢測,其中480筆資料資源資料符合結構化檔案格式,其餘320筆符合結構化檔案格式要求。
      • 計算評分:「資料易於被處理」之「結構化檔案格式」總配分20分,以總配分乘以符合項數,該項「結構化檔案格式」得分為= 12分。其他各項評核指標處理方式依此類推,最後得出每個評核構面的分數,並加總為該機關之總評分。

 

 

    • 公開方式

各評核指標將轉化為百分比之形態,並搭配雷達圖於政府資料開放平臺公開,並將可於政府資料開放平臺後臺以部會管理者身分匯出各機關所屬資料集之檢核清冊,以利各機關自行檢視有改善空間之評核指標及相應資料集。

 

 

  • 執行期程
    • 試辦階段:邀集有意願之部會及地方政府進行評鑑指標測試並修訂,以期指標能真實呈現開放資料內容之正確性、易用性、即時性及採適當格式之情形。預計於105年9至10月間進行。
    • 正式檢測階段:每年於上下半年各進行1次檢測作業,並分為初測及複測兩階段。
      • 初測:以四大構面七項指標進行測試,並於測試後一個月內於政府資料開放平臺後臺提供測試報告及改善建議,供各部會 / 地方政府進行資料品質改善作業。
      • 複測:於前述測試報告提供後三個月內,就初測未過部分進行複測,並於測試後一個月內於政府資料開放平臺後臺提供測試報告及改善建議。

 

 

 

 

  • 預估可達成效益

本次評核指標主要目的在於藉由以圖形化呈現評核結果,讓各機關得以快速瞭解資料集品質較弱項目並改善之,同時強化各機關業務承辦同仁資料品質之概念。

 

 

  • 後續精進作法

目前於有關資料品質部份,尚有許多面向尚待研議:

  • 資料集命名
  • 領域資料

 

 

 

 

 

This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!