close


本來要睡覺的小郭,

突然看到了什麼,

因此有感而發,

其實一路走來,

我看到不少原本牽著手的兩人,

有的走入禮堂,

但是,也有些選擇了放開了彼此的手,

而且放開的人還真不少。


突然間我想起很老套的一些話:茫茫人海,

能讓兩個人相遇真的很不容易;

對方能讓你牽著她的手更不容易,

既然都如此不容易了,

小郭更想和各位說,

如可以別輕易的放開你的手;

特別是在選擇要放手的同時,

請想清楚你的選擇。


放手不一定會更好,

當然也不一定會不好,

只是在做抉擇時真的要三思。


不管今天小郭的朋友你,

做了什麼樣的選擇,

如果這樣的選擇能讓你更好,

小郭都支持你,

但是,請記得別傷害自己和對方,

更不要意氣用事,

祝福各位!晚安!


小郭賣瓜:每日一正面思考請點此進入。


=====================================================

進入主題


Metadata(詮釋資料)一詞,初始的定義為Data about data

﹝描述資料的資料﹞。

詮釋資料是用來描述「資料檔」(data files)的內容都是些什麼?「

資料檔」是資料(data)的總匯集,它可能是一篇文章,也可能是一本

書,一份報刊,一則錄影,一部DVD電影等等。

  

早期編制了一部編目法則,界定了圖書資訊的「特徵」,其中包括作

者、書名、主題、版本和出版時地等。這些「特徵」,其實也就是我

現在詮釋資料。這些描述資料內容的資料,被抄錄在一張張

的目錄卡片上,貯存在目錄櫃裏。這個目錄櫃也貯存了有關全部館藏

的詮釋資料。這一櫃子的詮釋資料使圖書資訊擁有了「特徵」,

訴讀者,這所圖書館是什麼性質館藏主題重心是什麼?都有

那些作者和那些圖書這些描述,便利了讀者對個別圖書的識別和追

蹤查閱,也增加了圖書資訊的「可用性」。

  

圖書館編目自動化才開始萌芽後,為了配合這「二位數」的新一代的

圖書資訊,圖書編目專家,又開始擬定另一套被命名為機讀編目標準

格式的詮釋資料格式,簡稱MARC。此後,圖書館編目,便根據這套

MARC所制定的「特徵」,編組各類型的圖書資訊

  

電腦和網路資源逐漸普及後,圖書館因管理和維護館藏,開始有了

須同時面對紙本、數位資訊的需要。為了適應這種新資訊環境,對這 

二種不同格式的資訊,就必須要有二種不ˋ同的「特徵」編組方法。

換言之,雖然MARC21是編組「類比」資訊「特徵」(應該是非數

,如印刷品)標準,而以全球資訊網 HTML為基礎的網路資訊,也就

勢必應該有一套相應的詮釋資料標準格式,這類網路「數位」資訊

制定「特徵」。

 

為了使網訊能夠配合「全球資訊網」語言和適應網路輸送,這些新詮

釋資料,都必須要能滿足下列MARC21已經無力做到的四個條件:(1

)使網訊,包括各類型的圖書資訊,確實快速地在網路上被識別和被

擷取;(2)使網訊被正確適時地編組、儲存和管理;(3)能夠保證網訊

在不同資訊組織系統間的互通;(4)能夠維護網訊的智慧財產權、隱

私、安全和查閱取用權益等等。

 

近年來,為了適應新資訊環境,美國大專院校圖書館,大都採用二種

不同方式編組不同格式的圖書資訊:一方面,仍舊沿用MARC21,來

處理紙本位圖書資訊另一方面,則開始採用新的詮釋資料格式,來

處理網路數位資訊。部份美國著名研究級大學圖書館,由於它們的館

藏,貯藏很多數位原始研究資料檔,都積極地設計適用於各自館藏特

色的詮釋資料格式標準,這些格式,有與MARC21編目系統完全不相

同的分類項、藏書處、關鍵字詞和版權說明等等。不過,其他院校圖

書館,則很少自創多半都採用比較知名的詮釋資料格式,譬如

 Dublin Core、VRA、EAD、TEI美國國會圖書館發展的

MARC XML等等。

 

下一個十年裏,數位資訊特別是有關尖端科技的數位資訊,都需要

利用非常手段和方法來經營管理。這類資訊,大多都屬於「深網網訊

」(Deep Web)。它們不僅數量龐大,內容結構精密特殊,而且,網

路檢索系統,也與一般資訊檢索完全不相同。為了要求這類資訊,在

不同主題和不同資料庫的框架下,便於專家們相互交流和檢索查閱,

一套專門設計的詮釋資料標準格式是不可缺少的。譬如,「基因序列

數據庫」這個資料庫,這類資料,無論是在內容或是在結構上,都與

一般圖書資訊有絕對而且顯然的不同。因此,處理這類資料,根本不

能採用MARC21的登錄格式,而必須另有一套專用的格式。這種專用

詮釋資料的編輯特點,不僅使貯存的資訊容易更新和取用,更重要的

是保證它們永遠不會中斷的網路連接。

 

十多年來,為網路數位資訊設計的詮釋資料格式,因為沒有統一標準

的結果,使得網路資訊的編組、應用和流通上,衍生出了很多問題

譬如說,網路資訊資源的欠缺「互通性」、欠缺資訊品質監控、欠缺

自動化詮釋資料編制等等。這些問題,不僅僅加了網訊搜索者搜尋

資訊的困難,同時,也給予電腦設計專家們空前的挑戰。他們研制「

人工智慧」型新一代電腦,除去硬體以外.還需牽涉到如何協調控制

 語言、主題字詞、分類標準和以XML等,有關「詮釋資料語意」

(Metadata semantics)的問題。  

 

描述資訊內容,無論是採用Cutter法則,或是MARC21,或是

Metadata或是將來任何新的格式,都只是用來標示資訊的外表,

而不代表真正的內容正文我們相信終會有那麼一天電腦程式設計

家,設計出一套網訊搜索程式,會完全擺脫類似描述資訊內容的一切

格式,驅使著網訊搜索鼠,直接深入世界上每個資料庫貯存的正文,

讓資訊搜索者鍵入關鍵字詞以後,便會立即獲得絕對相關,而且絕對

乾淨沒有垃圾資料,並清楚註明資訊來源和取用條件 

 

小郭:老實說最後一段的夢,做的真的好大啊!但是,說不定這個遠

大的夢想,在五到十年之後真的就給他實現了也說不定,畢竟這世界

存在著大多的無法預知,也因為這樣,所以這世界有他有趣的地方。 

 

引用:

http://blog.lac.org.tw/lac/vj-attachment/2011/06/attach136.pdf

中華民國圖書館學會電子報 No. 105哈伯的天空 詮釋資料 艾文

arrow
arrow
    文章標籤
    技術服務
    全站熱搜

    小郭 發表在 痞客邦 留言(1) 人氣()