政府資料開放平臺修正建議(持續募集中!!)

政府資料開放平臺(以下簡稱本平臺)現況基本說明:

略為爬文之後,我發現我的幾個想法好像無法歸類...,所以我就先寫在這裡。如果管理者看到,有適合的段落,可以幫我放進去。

身為資料提供者,我覺得應該要提供批次修正的功能。以政府機關來看,各單位開放資料的承辦人其實來來去去,磐石單位流水兵,更不要說各資料集的負責人調動之頻繁。因此是否可以提供資料提供者資料批次修改功能,比如說聯絡人或負責人的資訊修改,等等。不然有些單位一口氣要修改數百筆資料的時候真的會升天。

另外關於使用者,我也有話要說:目前來看,很多資料的單位與字詞標準都是有相當差異的。比如說45,000可能有人以阿拉伯數字寫就、有人會寫成4.5萬、也有人寫4萬5千。就算是用阿拉伯數字表示,也有可能有人有用comma有人沒有用。又比如說城市名稱,有些人提供資料是用台北市、有些人是用臺北市、有些人用臺北、有人用台北。這些其實都是在說一樣的東西一樣的地方,但在做統計的時候就會產生標籤不一致的狀況。所以我在想有沒有可能提供自動轉換功能,使不管哪邊提供的單位字詞可以進可能的一致化來方便使用?不過這個可能就到了資料品質的部分...,要另外開板嘛?以上。

系統功能面:

  1. 建議刪除預計開放資料集,改以「(各部會 / 縣市政府)盤點資料集清單」替代,提供與"我有話要說"一致的民眾意見回饋管道。
  1. 建議資料集更名(原暫時下架)、永久下架權限下放行政院所屬二級機關 / 地方政府部會管理者
  1. 下架公告改由資料提供機關自行po文介面,並於公告7日後自動下架。(介接機關不受此限?)
  1. 提供CSV / JSON / XML互轉工具
  1. [後台] 建立結構化文件自動讀取建議欄位置入「主要欄位說明」。
  2. [後台] 提供基於各部會 / 縣市政府(含所屬機關)自行查詢「資料集品質評鑑結果」(可機器測試項目)
  3. [前台] 將各部會 / 縣市政府(含所屬機關)之「資料集品質評鑑結果」定期更新於前台。
  4. 提供手動上傳、批次上傳、API介接流程說明文件。
  5. 系統收發信測試 (?)
  6. [後台] 可由後臺匯出權責範圍內指定期間上 / 下架資料集詳細資料。
  7. [後台] 可由後臺匯出權責範圍內資料集瀏覽 / 下載次數詳細資料。
  8. 有機關建議應增列「主題專區」,建議可由主題式標籤達成目的(?)。
  1. 提供搜尋引擎優化(SEO)與社交網路優化(SMO,含og-image功能)
  2. 提供民眾勘誤管道,以利回饋 (各個版本) 資料品質。

資料集詮釋資料標準規範( http://data.gov.tw/node/18252

  1. 建議增加預留欄位(for 整包下載?、etc.)
  2. 考量資料集內資料資源資料型態不同,為了將來提升資料品質導入Data Schema,各資料資源之欄位描述及定義:
    1. 方案一:沿用既有機制,將資料資源來欄位載明於「主要欄位說明」(fieldDescription),要求同一資料集下資料欄位應有一致性欄位。
    2. 方案二:採用【資料集詮釋資料標準規範】內「資料資源描述」(resourceDescription),或「領域別詮釋資料參考網址」(metadataSourceOfData),可達成各項資料資源欄位詳細描述。
  1. 在【資料集詮釋資料標準規範】定義的是「資料存取網址」及「資料下載網址」兩個欄位,結果在系統上卻變成:

  1. 方案一:依據規範將「資料存取網址」及「資料下載網址」分為兩欄,並採擇一必填。
  2. 方案二:資料資源網址僅須維持單一欄位即可。(資料資源形態為 檔案 / WEBSERVICES (含API) 已於檔案格式勾選,建議修正規範)

政府資料開放跨平臺介接規範( http://data.gov.tw/node/18254

p.s.主要供政府機關資料開放平臺介接使用

  1. 單一Publish規範。
  2. 原有Harvest機制預計106年底落日。

API匯出建議:

民間資料集回饋機制:

  1. 本平臺維運政府不干涉審核,僅刪除惡意、廣告與資料開放無關性質之訊息。
  2. 本平臺不額外提供資料儲存空間,僅以記錄metadata為主。
  3. 民間上傳資料集可填列其相關之政府資料集。

  1. 免責條款。

資料集評鑑機制:

  1. 針對自動查核項目,開放各機關自行使用查核,以利預為改善。

5.請問歷史資料的更新頻率,若改為歷史狀態,機測這部份是否會略過.

詮釋資料中的主要欄位,目前還有看到欄位是這樣標示的: 少部份 A/B/C 用斜線表示,大部份是A , B , C  A、B、C方式,而非3. A,B,C  A;B;C  A.B.C等等.如果有斜線表示的話可以嗎?