佛教圖書館館刊 第四十七期 97年6月
後設資料與內容標誌(下):意義的處理,以心經為例謝清俊 銘傳大學講座教授續上篇(註1)介紹意義處理的種種考量後,本篇則舉例說明意義處理的可行。 本文介紹的軟體是中央研究院資訊科學研究所文獻處理實驗室所發展的一個雛型(proto- type)(註2)。它能顯現兩種視窗:一個是文件的視窗,稱為「文件夾」;另一個是文件內容結構的視窗,稱為「知識結構夾」。文件夾有兩個(名為文件夾一與文件夾二,如圖一右側上下的兩個視窗),每個最多可呈現四篇文件。所以文件夾總共可同時呈現八篇文件備用。 圖一 這樣的工具是可以協助使用者處理文件意義的。比方說,在文件夾中選擇的是同一文章的不同版本,在知識結構夾中選的是不同作者對此文章的解釋或詮釋。像這樣的安排,就可以處理不同作者對此文章各種解釋或詮釋的比對,同時也可以參照各版本做內容異同的對應。 在我們舉的例子裡,文章選的是《心經》;另分別選周止庵先生和印順導師對《心經》的註解,作為心經的知識結構(請參考圖二)。 圖二 圖三中呈現的都是「意義」的對應,因為我們做的「標誌」本來就是意義的對應。此中,可呈現意義的「多義(ambiguity)」性質,如印順認為此段文字說的是「融相即性觀(加行)」,而周止庵卻認為是「明蘊空」。這兩種註釋,並無不當,只是註釋的角度稍有不同罷了。目前的軟體幾乎無一具有像這樣處理「多義」性質的功能,而這功能對意義的處理又是那麼不可或缺。 圖三 同樣的,若點擊知識結構夾中的科文項目兩下,也會同時呈現相關的經文和其他相關的註釋。譬如,點擊印順的「修般若行」,會出現相關的經文,以及周止庵對此的觀點。如圖四。周止庵認為此段屬「顯說般若」,這顯然是從「經文內容是什麼?」為主的角度說的。與此相較,印順則偏重修行的角度說它是「修般若行」。 圖四 圖五 再者,由於譯文的文字古老,用現在的發音唸不見得準確,那麼,怎麼辦呢?我們可以把梵音漢字的《心經》叫出來作參考,如右下視窗所示。我們發現「揭諦」梵音是「虐諦」。究竟是「揭諦」還是「虐諦」?我們在此不能下定論,可是我們至少知道唸咒語是應該先花工夫了解它正確的發音。 圖六 雖然市面上的軟體沒有處理語意的能力,由本文舉例的雛型軟體,可以證明電腦是可以處理語意的。以上展現的內容處理例子,都是以內容標誌為工具,所做的意義檢索,完全沒有用到檢索常用的詞語聯繫(morphological linking)結構。而意義檢索可呈現「共相」,亦可呈現有個別差異的「別相」(如印順與周止庵對《心經》個別的註釋)。 做文章內容的標誌,不是電腦工程師可以做的,需要了解文章內容的專家來做。這情形正好提供人文學者一個絕佳的機會加入文獻數位化的行列。如果人文學者能用標籤把他們的知識,也就是對文章的理解、真知灼見,表達給電腦知道,那麼,久而久之電腦將匯集大量的人文知識。果真如此,那麼,一種嶄新形式的人工智能(artificial intelligence)即將誕生,且讓我們拭目以待。 後設資料和內容標誌並不相互排擠,它們是兩種類型完全不一樣的工作。若認為:除了文物數位化的本身之外,所有其他的資料都屬後設資料,那麼就犯了不可原諒的大錯──它扼殺了內容標誌生存的空間。換言之,後設資料和內容標誌兩者都是不可缺的,且彼此相輔相成、相得益彰。 綜觀內容標誌的特徵,至少包含下列項目:
謝謝你的閱讀。希望有一天,我們可以有內容標誌的工具,把數位化的文獻處理得更合於人性、更美好。 【附註】
|