淺析美國開放資料概況~以美國DATA.GOV之食品召回資料集為例
// 工研院IEK 王榛驛 Jun 11, 2014
根據維基百科對「開放資料(Open Data)」的釋義,開放資料 (Open Data)是指一種經過挑選與許可的資料,且不受著作權、專利權,以及其他管理機制所限制,可以開放給社會公眾,任何人都可以自由出版使用,不論是要拿來出版或是做其他的運用都不加以限制。以政府的開放資料(Open Data)為例,是指將政府運作中所產生的各種資料開放給大眾運用。這些資料可存在於文書、圖畫、照片、光碟片、網路、雲端等各種資料,但必須是未經過分析或是解釋原始Data才符合開放資料(Open Data)的定義。

以美國為例,美國政府自2009年時成立DATA.GOV網站(https://www.data.gov/),並要求聯邦政府機關透過此網站來提供政府開放資料給公眾下載使用,並積極鼓勵企業、組織、人民團體、公民個人等使用開放資料進行創新加值,以期增進公共價值(Dawes & Helbig, 2009)。而美國總統歐巴馬於2011年9月20日發布「開放政府夥伴」(THE OPEN GOVERNMENT PARTNERSHIP),目標在於提升政府透明、打擊貪污、促進民間參與、加強新興科技。兩年內,在資訊近用、公共資源管理、公眾參與政策形成等領域都有初步成果。又於2013年12月6日提出第二期「開放政府國家行動計畫」(Second Open Government National Action Plan),有部分為銜接第一期「開放政府夥伴」(THE OPEN GOVERNMENT PARTNERSHIP)的內容。

比方說,以美國的DATA.GOV(https://www.data.gov/)之食品召回資料集為例,與食品召回(Food Recall)相關的資料集(datasets)約有30個,範圍包括寵物食品召回(Pet Food Recalls)、帶殼蛋召回(Shell Egg Recalls)、所有美國FDA召回(All FDA Recalls)、花生產品召回(Peanut Product Recalls)、開心果產品召回(Pistachio Product Recalls)、亞培嬰兒配方奶粉召回 (Abbott Infant Formula Recall)、食品和膳食補充劑召回(Recalls of Food and Dietary Supplements)、食物安全資訊(Food Safety Information RSS feed)、含水解植物蛋白(HVP)產品召回(FDA Hydrolyzed Vegetable Protein (HVP) Containing Products Recalls)、…等。

各資料集結構中比較完整者包括資料來源類型(Resource Type)、後設資料創建日期(Metadata Created Date)、後設資料更新日期(Metadata Updated Date)、發行者(Publisher)、識別碼(Identifier)、維護者(Maintainer)、維護者電子郵件(Maintainer Email)、可獲取資料等級(Access Level)、資料品質(Data Quality Met)、發行日期(Date Released)、更新日期(Date Updated)、格式(Format)、資料被細分的程度(Granularity)、第一主題區(Subject Area 1)、技術文檔(Technical Documentation)、資料集參考日期(Dataset Reference Date)、資料結果版本(Harvest Harvester Version)、資料結果最後更新時間(Harvest Last Updated)、資料結果主題識別碼(Harvest Object Id)、資料結果來源識別碼(Harvest Source Id)、資料結果來源主題(Harvest Source Title)、資料來源Datajson Hash(Source Datajson Hash,系統API 介接時,可直接以系統介接的方式連結該資料介接URL取得內容之檔案格式:JSON。)、來源Datajson識別碼(Source Datajson Identifier)、來源Datajson網址(Source Datajson Url)等項目,部分較不完整者,則僅包含上述的部分項目。可供下載的檔案以Excel、XML、HTML、JSON、CSV、application/rdf+xml、…等格式最常見。

例如舉帶殼蛋(Shell Egg Recalls)為例,是由美國的衛生福利部(Department of Health and Human Services)自2010年起所提供的資料,其資料結構如下:

資料來源類型 (Resource Type) Dataset
後設資料創建日期
(Metadata Created Date)
Aug 26, 2013
後設資料更新日期
(Metadata Updated Date)
Feb 28, 2014
發行者(Publisher) Unknown
識別碼(Identifier) Unknown
維護者(Maintainer) None
維護者電子郵件(Maintainer Email) None
可獲取資料等級(Access Level) Public
資料品質(Data Quality Met) True
發行日期(Date Released) 2010-10-01
更新日期(Date Updated) 2010-10-01
格式(Format) XLS
資料被細分的程度(Granularity) recalled items/Country
第一主題區(Subject Area 1) Safety
技術文檔
(Technical Documentation)
http://www.fda.gov/AboutFDA/AboutThisWebsite/WebsitePolicies/default.htm
資料集參考日期
(Dataset Reference Date)
None
資料結果版本
(Harvest Harvester Version)
0.9a
資料結果最後更新時間
(Harvest Last Updated)
2013-08-26T19:47:52.484916
資料結果主題識別碼
(Harvest Object Id)
91b49edb-292f-4c02-93ac-ac6501ae62f3
資料結果來源識別碼
(Harvest Source Id)
15c538b5-31a0-474e-8ba5-c85ee421cb4d
資料結果來源主題
(Harvest Source Title)
Healthdata.gov
資料來源Datajson Hash
(Source Datajson Hash)
89dc2fa367b1f3e6db077704d9a436cdc233ded3
來源Datajson識別碼
(Source Datajson Identifier)
dc522ec9-a996-440b-b94e-972136ab80c0
來源Datajson網址
(Source Datajson Url)
http://healthdata.gov/data.json

在其可下載的Excel檔案內容,則包括類別(Category)、品牌(公司)名稱(Brand Name)、描述(Description)、召回的公司名稱(Recalling Firm)、包裝規格(Pack Size)、代碼(Codes)、UPC條碼(UPC Code)、標籤(Label)等項目。

此外,可再進一步根據網站上提供的「標籤(Tags)」、「可下載檔案格式(Formats)」、「資料來源(Organization)」等功能,進行篩選。

另外從美國食品藥物管理局(FDA)的網站觀察以及和DATA.GOV網站進行比較發現,整體而言,美國的DATA.GOV網站所提供的資料集持續建置中,預期未來將有更多有關食品相關的資料集建置完成,例如與美國食品藥物管理局(FDA)的網站上之含砷食物、雙酚A(BPA)、營養成分標籤修訂、FDA食品安全現代化法案等最熱門的民生議題進行連結,以提供消費者和產業界最透明和有用的資料參考用。
上一筆 無下一筆

相關文章

標籤雲

其他人也看