佛教圖書館館刊 第四十七期 97年6月

後設資料與內容標誌(下):

意義的處理,以心經為例


謝清俊 銘傳大學講座教授


  續上篇(註1)介紹意義處理的種種考量後,本篇則舉例說明意義處理的可行。

    本文介紹的軟體是中央研究院資訊科學研究所文獻處理實驗室所發展的一個雛型(proto- type)(註2)。它能顯現兩種視窗:一個是文件的視窗,稱為「文件夾」;另一個是文件內容結構的視窗,稱為「知識結構夾」。文件夾有兩個(名為文件夾一與文件夾二,如圖一右側上下的兩個視窗),每個最多可呈現四篇文件。所以文件夾總共可同時呈現八篇文件備用。


圖一

  知識結構夾也有兩個(如圖二左側上下的兩個視窗),每個亦可最多呈現四種對文件夾中文件內容的結構描述。所以文件夾總共可同時呈現八篇文件的內容結構備用。

  這樣的工具是可以協助使用者處理文件意義的。比方說,在文件夾中選擇的是同一文章的不同版本,在知識結構夾中選的是不同作者對此文章的解釋或詮釋。像這樣的安排,就可以處理不同作者對此文章各種解釋或詮釋的比對,同時也可以參照各版本做內容異同的對應。

  在我們舉的例子裡,文章選的是《心經》;另分別選周止庵先生和印順導師對《心經》的註解,作為心經的知識結構(請參考圖二)。


圖二

  如果事先把文件夾中的文章和知識結構夾中的文章內容用「標誌」做好對應的關係,那麼,文件夾與知識結構夾就可以自動的彼此對應。例如,在玄奘梵文漢譯的《心經》中,對「色不異空」點擊兩下,則玄奘譯的《心經》會將包含「色不異空」字串的整段(即意義完整的一段文字)反白,如右上角視窗所示;在此同時,鳩摩羅什譯的對應文字也會反白,如右下角視窗;而印順導師和周止庵先生對此段文字的註解也會分別在左側上下的兩個視窗中同時反白展現,請參考圖三。

  圖三中呈現的都是「意義」的對應,因為我們做的「標誌」本來就是意義的對應。此中,可呈現意義的「多義(ambiguity)」性質,如印順認為此段文字說的是「融相即性觀(加行)」,而周止庵卻認為是「明蘊空」。這兩種註釋,並無不當,只是註釋的角度稍有不同罷了。目前的軟體幾乎無一具有像這樣處理「多義」性質的功能,而這功能對意義的處理又是那麼不可或缺。


圖三

  在玄奘與鳩摩羅什不同的譯文中,我們可以察覺鳩摩羅什的譯文較多,大致多了「色空故,無惱壞相,受空故,無受相,想空故,無知相,行空故,無作相,識空故,無覺相,何以故」這一串。這多的一串,可以視為對前文「五蘊皆空」意義的解釋,也可作為解釋其後文字「色不異空,空不異色」的橋樑。這些關係,也都是意義的相關聯性質,讀者可以從顯示的這些對應關係中,來體會經文的意義。

  同樣的,若點擊知識結構夾中的科文項目兩下,也會同時呈現相關的經文和其他相關的註釋。譬如,點擊印順的「修般若行」,會出現相關的經文,以及周止庵對此的觀點。如圖四。周止庵認為此段屬「顯說般若」,這顯然是從「經文內容是什麼?」為主的角度說的。與此相較,印順則偏重修行的角度說它是「修般若行」。


圖四

  再舉一例,讓我們看看周止庵說的「結讚功能」,其中有「無等等咒」一語。如果我們弄不清楚它是什麼意思,那麼,我們可以把藏文英譯的《心經》叫出來(如圖五右上角視窗),看看對等的英譯文字「the mantra equalizes whatever is unequal」,「無等等咒」一語的意義也就豁然開朗了。


圖五

  最後的例子,讓我們了解一下《心經》的咒語。我們點擊《心經》最後的咒語那一段,就會看到它可認為是「密說般若」(周止庵語),也可說是為了鈍根修行《心經》的方便法門,(「曲為鈍根說方便」,印順語)請見圖六。

  再者,由於譯文的文字古老,用現在的發音唸不見得準確,那麼,怎麼辦呢?我們可以把梵音漢字的《心經》叫出來作參考,如右下視窗所示。我們發現「揭諦」梵音是「虐諦」。究竟是「揭諦」還是「虐諦」?我們在此不能下定論,可是我們至少知道唸咒語是應該先花工夫了解它正確的發音。


圖六

結束語

  雖然市面上的軟體沒有處理語意的能力,由本文舉例的雛型軟體,可以證明電腦是可以處理語意的。以上展現的內容處理例子,都是以內容標誌為工具,所做的意義檢索,完全沒有用到檢索常用的詞語聯繫(morphological linking)結構。而意義檢索可呈現「共相」,亦可呈現有個別差異的「別相」(如印順與周止庵對《心經》個別的註釋)。

  做文章內容的標誌,不是電腦工程師可以做的,需要了解文章內容的專家來做。這情形正好提供人文學者一個絕佳的機會加入文獻數位化的行列。如果人文學者能用標籤把他們的知識,也就是對文章的理解、真知灼見,表達給電腦知道,那麼,久而久之電腦將匯集大量的人文知識。果真如此,那麼,一種嶄新形式的人工智能(artificial intelligence)即將誕生,且讓我們拭目以待。

  後設資料和內容標誌並不相互排擠,它們是兩種類型完全不一樣的工作。若認為:除了文物數位化的本身之外,所有其他的資料都屬後設資料,那麼就犯了不可原諒的大錯──它扼殺了內容標誌生存的空間。換言之,後設資料和內容標誌兩者都是不可缺的,且彼此相輔相成、相得益彰。

  綜觀內容標誌的特徵,至少包含下列項目:

它是給人用的標誌介面。
標誌的彈性:它無固定的標籤集。
它可往復的顯示文字與內容結構(ontology)間的對應,以及對本文的詮釋。
它可呈現本文不同形式、版本間內容的對應。
它可呈現結構間的對應
因為「語意」的表達是跨越國界、跨越文化的。它可跨越不同的語言文字、不同的作者、不同的版本等。

  謝謝你的閱讀。希望有一天,我們可以有內容標誌的工具,把數位化的文獻處理得更合於人性、更美好。

【附註】
註1:謝清俊,〈後設資料與內容標誌:淺談數位化的文章和其內容標誌處理(上)〉,《佛教圖書館館刊》,45期(民96年6月),頁51-59。
註2:雛型是並未發展成可流通或可上市的軟體,它主要的目的是證明一種構想的可行。此軟體是莊德明先生在1993至1994年間撰寫的,詳情可見:謝清俊、莊德明,〈心經的多版本處理〉,民國84年8月,中央研究院資訊科學研究所技術報告。



[gaya首頁]   [圖書館服務]   [佛教圖書館館刊]   [館刊47期目次]