漫談開放資料RDF格式
// 工研院 CITC 江季洲 Mar 12, 2015
 

RDF是Resource Description Framework(資源描述框架)的縮寫,資源可以是任何事物,包含文件、人物、實體物件和抽象概念‧‧‧等,資源描述框架使用簡單的「主詞」、「述詞」、「受詞」三元關係來描述關於資源的一項事實或一個屬性,也可以理解為描述兩個資源之間的關係,例如:

 

  1. <達文西密碼>
    描述有一個資源(書),其ISBN是9571341649,它的書名是達文西密碼。

  2. 描述有兩個資源和,兩者之間的關係則是認識(knows)。

 

實務上「主詞」、「述詞」都是網址的形式,受詞則可以是網址或是一般的文字或數字,上面兩個例子,用更精確的RDF表達為:


"達文西密碼" .
以及


.

 

RDF是全球資訊網協會所定義,作為開放資料四顆星及五顆星的標準資料模型,因此對於有志開發高星等開放資料應用的程式設計師而言,是必須要了解的資料模型,為了幫助程式設計師了解RDF,我們可以從程式設計師都很熟悉的資料庫表格模型做為切入點,假設有一個書籍的資料庫表格如下所示:

 

isbn_id

title

author

9571341649

達文西密碼

丹·布朗

 

這樣的一筆資料表格資料,可以轉化為以下的兩筆RDF資料:


"達文西密碼" .和

"丹·布朗" .


這樣做有什麼好處呢?
第一個好處是RDF的主詞是一個網址,代表主詞具有唯一的特性,而且可以被公開的存取,不像一般的資料庫,通常無法被公開存取。


第二個好處是程式設計師在進行查詢時,等於是把整個全球資訊網當作是一個全球資料庫做查詢,不像一般的資料庫查詢,通常是針對單一資料庫,要跨資料庫查詢相當不容易,要進行資料庫查詢要使用SQL查詢語言,要對這個新的全球資料庫做查詢,需要使用一個新的,稱為SPARQL的查詢語言。


第三個好處是不同資料來源的整合會變的非常的容易,傳統資料庫的整合,必須要具有相同的資料庫綱要才能整合,RDF只要具有相同的主詞即可進行整合。
第四個好處是容易和現存的資料格式做整合,例如常見的網頁HTML、XML、JSON、CSV都可以和RDF進行整合。


第五個好處是,RDF的述詞具有特定的語義,其語義由全球性的組織進行定義,使用RDF開發,則可讓應用程式具有語義理解的能力。

 

RDF的優點這麼多,有志開發高星等開放資料應用的程式設計師,您心動了嗎?

 

 

相關文章

標籤雲

其他人也看