佛教圖書館館刊 第四十六期 96年12月
目錄索引編製:以《中文期刊篇目索引》紙本到網路版的編輯為例羅金梅 國家圖書館期刊文獻中心組員【摘要】《中文期刊篇目索引》創刊於1970年1月,至今已逾37年,歷經六任主編。編輯方式從人工作業、文獻分析機讀格式(MARC)建檔演變至文獻分析詮釋資料格式(Metadata)建檔。其編輯作業的改變,主要為使用者提供快速查檢新穎的期刊資訊。本索引初期自動化的目的,旨在提供資料建檔列印與館內線上查詢服務。爾後,因資訊科技的發展及考量讀者的需求,於是更新系統,設計為開放式環境,提供親和性的Web查詢介面,並進一步改善資料庫維護、查詢、索引彙編排版列印等功能。由於期刊資料量快速的成長,因考量儲存空間與資料的維護安全,於是再次更新系統,並設計具彈性的客製化編輯作業環境。展望未來索引篇目的編輯,對於現刊資料能夠加速建檔,並回溯1970年以前之學術期刊目次建檔,以完整地呈現臺灣地區的學術研究成果。 關鍵詞:索引編輯;中華民國期刊論文索引;中文期刊篇目索引 一、緣起 《中華民國期刊論文索引》創刊於1970年1月,至今已逾37年,歷經六任主編。其創編之構想源自於國家圖書館(1996年之前名為國立中央圖書館)第三任館長包遵彭。編輯計畫首見於1969年4月14日第441次館務會議指示「……希計畫按月編印全國期刊論文索引,並洽請正中書局印行……」;同年5月12日第444次館務會議再次提到「……全國期刊論文索引編印計畫,應急速確定,按月發行。此項索引亦包括官書法規及工作報告,由胡主任安彝督同期刊股辦理……」;6月23日第450次館務會議再次提到,需積極完成若干基本工作,如1. 「全國期刊論文目錄索引」,2. 新書簡報,3. 每年之全國圖書目錄彙編,4. 各項專題目錄之編印等;12月15日第473次館務會議,期刊股首次將編印全國「中文期刊論文分類索引」列為工作項目於會中報告;12月22日第474次館務會議正式確立名稱為《中華民國期刊論文索引》(略稱本索引)。(註1) 本索引於1983年由人工作業轉為自動化作業,在國圖王安主機上建置《期刊論文索引線上資料庫》,系統使用10年後,一方面是因主機老舊,已不堪資料日增之負荷,且系統原有之資料維護與查詢功能均有待進一步改善;另一方面是因讀者要求本系統能開放館外連線查詢,因此,自1993年10月起,委請工研院電通所重新設計一開放式環境且具親和性查詢介面的《中華民國期刊論文索引線上新系統》,並於1994年10月正式開放館外網路連線查詢。在此之前,1993年8月已發行《中華民國期刊論文索引光碟系統》DOS版。 1996年工研院電通所另開發《國家圖書館新到期刊目次系統》,收錄索引未收之資訊性、報導性、休閒性及生活化之文章。索引電腦化作業二十幾年來,由於資料庫的快速成長,資料量已累積180多萬筆,因考量儲存空間與資料維護安全,遂於2004年委託凌網科技公司開發新系統,並於2005年10月完成轉檔及正式啟用,同時將《中華民國期刊論文索引影像系統》與《國家圖書館新到期刊目次系統》合併成《中文期刊篇目索引影像系統》(以下簡稱篇目索引)。 二、資料收錄範圍與選擇原則 本篇目索引收錄1970年1月以來臺灣及部分港澳地區出版的中、西文期刊4400多種,目前已逾200萬筆資料(Webpac僅提供近10年資料)。資料性質分學術性及一般性,使用者在一查詢介面即可同時查檢學術性(索引)及一般性(目次)資料。學術性資料是以研究論著為主,其特點為資料著錄較為詳盡,增加分類號及關鍵詞等;至於一般性資料是指1996年國家圖書館與工研院電通所合作開發的《國家圖書館新到期刊目次系統》,主要提供報導性、休閒性、生活化之文章等,僅簡單著錄目次資料。對於文藝作品、通訊消息、會計報告、人事動態、定期統計資料、產品介紹、隨筆漫談等均未予收錄。 在期刊選擇方面,大致上分為學術性、專業性、一般性。學術性期刊包括學校及各學術機關、文化團體出版的學報、集刊、會報、會誌等。專業性期刊,是以報導專門技術或專業研發成果之期刊,故歸於學術性。至於一般性期刊,是由雜誌社、出版社所發行的刊物。對於刊期較短的旬刊、週刊等,偏向於報導性文章,則不予收錄。 在篇目挑選方面,首先在選定期刊的目錄上加注記號,以便抄錄於特製的卡片或輸入表上。主編在選擇論文資料時,除了注意資料本身的價值外,而且也要兼顧讀者的需要,例如本篇目索引原則上是收錄學術性、議論性及學者專家的論文,但也視實際情況酌收一般報導性及應景文章。對於連載的資料儘量收全,至於篇名不足以表達其內容時,編者則會用﹝﹞加注按語,使其篇名更為明確。一稿兩投之文章,因考量各個圖書館未必兩種刊物皆有收藏,故均予收錄。此外,對於專業性期刊之技術報告,文章雖然簡短,亦收錄於索引資料庫。一般性期刊良莠不齊,對其所刊登之論文則嚴加挑選。 三、編輯方式 本篇目索引創刊至今37年9個月,其間為因應電腦科技的發展,以及為滿足使用者的需求,因此在索引的編輯上也與時並進,從人工編輯、電腦機讀格式建檔(MARC)演變至文獻分析詮釋資料格式建檔(Metadata),這些編輯作業的轉變,其主要目的是為使用者提供快速查檢新穎的期刊資訊。儘管編輯技術隨著科技改變,但其編輯方針不變,在資料的收錄原則上仍以議論性論文為主。之後,為因應國際潮流趨勢及使用者的需要而增加了期刊目次資料。以下就篇目索引從人工編輯到電腦建檔的過程,簡單地說明不同階段的發展概況。 (一)人工編輯:1970年1月至1983年4月 此階段為紙本的人工作業模式,以人工抄錄卡片,進行分類、排卡、付印、校對工作。其作業方式,將每筆資料逐一抄錄於3x5吋(7.5×12.5公分)卡片上,然後插入卡片盒,以導卡標註類目。著錄項目包括篇名、著譯者、期刊名、卷期、頁次、出版年月。(見圖1)卡片左上方待全部資料序列完備後用號碼機加蓋篇名序號。卡片的下方加製作者卡片以騎縫分開,只需登錄著譯者即可(便於製作著者索引)。(註2) 篇目索引之分類架構,則係參照《中國圖書分類法》,分十大類:總類、哲學類、宗教類、自然科學類、應用科學類、社會科學類、史地類、語文類、美術類;另考量當時文獻發表時代環境,增加敵情類。在編排方面則按類集錄,同類文獻依論文篇名首字之筆畫、筆順分別先後,西文論文則按篇名字母順序排列於各類之後。西文作者姓氏在前,依其出現於論文中的形式著錄,出版年採用民國紀元。其輔助索引有收編期刊一覽表(註明收錄卷期及出版年月)及作者索引。資料更新為每月一次,此階段共出版月刊本176冊,66-71年彙編6大冊。 紙本人工編輯流程,首先確定編輯體例,其次選擇收錄對象,依序為登錄、選擇論文、抄寫論文篇目、分類、確定分類類表、排序編號、正文完成、編輔助索引、打字排版、校對、出版。(見圖2) (二)電腦建檔 1. 文獻分析機讀格式建檔(MARC):1983年4月至2005年9月 此時期的論文資料係依據《國立中央圖書館文獻分析機讀格式》著錄。每一筆資料填寫一張輸入表單,著錄款目包括:篇名、並列篇名、篇名編次、著譯者、刊名、卷期、出版年月、頁次、附註內容註,以及資料類型的分析(書目、索引、書評、文評、座談會……),出版國別的註記、題名語文代碼,特種資料代碼、填表者代碼等。(見圖3)著錄原則以《中國編目規則》為著錄規範。 主題分析則參考《中國圖書分類法》(試用本),醫學類則採用醫學圖書館委員會所編訂的「醫學類類號表」,再酌予增補修訂。以往人工作業時,論文並不賦予類號;電腦化後,則每篇論文皆給予類號,有時因應討論主題,並不限於一個類號,以利電腦自動排序及查檢。另「敵情類」改為「中共與蘇俄研究」,在分類號後面標示特種資料($pc)。自2004年起「中共與蘇俄研究」之分類號則不另外標示。 電腦化建檔後的紙本出版形式,則由以往的不分欄條列格式改為左右兩欄款目形式印刷。傳記類資料以往人工作業係依照被傳者姓名排片,但電腦化後另立被傳者人名標題,擬逐步建立人名權威檔,以利電腦排檢與控制。(註3)電腦建檔之優點,除了節省許多人工重複排檢、校對工作外,還可以編製各種專題索引等。此階段資料每週更新一次,紙本月刊本出版7冊,季刊本46冊,年彙編本9大冊。 本索引資料庫1983年4月至1994年9月使用王安所開發的軟體,名稱為《期刊論文索引線上資料庫》,提供資料建檔維護與館內查詢服務。1993年為考量讀者查檢需求,於是委請工研院設計開放且具親和性的查詢介面,其作業系統遂由封閉式的王安系統改為開放式的UNIX系統,開發《中華民國期刊論文索引線上新系統》,其服務範圍擴大於學術網路使用,並於1994年10月正式啟用。1999年為配合新的資訊檢索技術,新增摘要及電子全文資料檢索欄位,以提升檢索品質。此系統在公務方面,提供新增建檔、維護、索引彙編報表排版列印、線上查詢、系統管理、關鍵詞庫、參照關係詞、驗證單與統計報表列印等功能;在讀者方面,提供Telnet(網路撥接)及Webpac(全球資訊網)介面查詢《中華民國期刊論文索引系統》資料庫。(註4) 此階段的建檔流程為:選擇收錄期刊、登錄、選擇論文、填寫論文輸入表、審核論文輸入表、鍵入資料、輸出報表校對。 2. 文獻分析詮釋資料格式(Metadata):2005年10月至今 此階段的軟體係委託凌網科技公司開發設計,作業系統改採LINUX系統,主要是考量篇目索引及影像資料的安全管理。其建檔格式改為「國家圖書館期刊文獻分析詮釋資料格式」,分類表仍然沿用,其著錄款目同MARC格式,著錄規則仍以《中國編目規則》為著錄規範。建檔方式係根據「文獻分析詮釋資料格式」訂定的DTD(Document Type Definition)輸入表單,依客製化欄位分別鍵入資料。(見圖4-圖7)此時為了加速資料的利用時效,以提供讀者查詢篇目新資訊,因此,每篇論文經由文獻分析後即輸入資料,最後再輸出審核。(見圖8)本系統在公務方面,提供新增建檔、維護、線上查詢、資料管理、資料庫管理(包括關鍵詞庫、參照關係詞)、帳號管理、摘要建檔與上傳、電子全文檔案上傳、驗證單與各項統計報表列印等功能;(見圖9)在讀者端方面,則提供資料庫Webpac的網路查詢與瀏覽。 其不同於MARC建檔作業有:(見圖10)
圖1:人工抄錄卡片 圖2:人工編輯作業程序圖 圖3:文獻分析機讀編目輸入表(期刊論文索引) 系統識別號:
圖4:客製化DTD建檔格式 圖5:各資料庫客製化設定 圖6:期刊篇目詮釋資料輸入表
圖7:DTD輸入資料樣例
圖8:資料庫建檔流程圖 圖9:各式統計報表查詢列印 圖10:文獻分析詮釋資料格式與文獻分析機讀格式建檔欄位對照表
四、查詢功能 (一)人工編輯查詢 其查詢原則為依類排序,同類文獻再按篇名筆畫多寡排列,提供著者索引及收編期刊一覽表(註明收錄卷期及出版年月)。 (二)Webpac查詢 提供「簡易查詢」、「詳細查詢」、「自然語言查詢」及「指令查詢」4種檢索介面。「簡易查詢」為初始設定畫面。在各查詢畫面下,使用者可在查詢欄位中輸入檢索值進行檢索。 1. 查詢方式:
2. 查詢結果顯示:條列式與詳目式。 3. 檢索策略:提供分類號切截與布林邏輯功能。
(三)光碟系統查詢 提供「簡易查詢」、「詳細查詢」、「自然語言查詢」、「進階查詢」及「指令查詢」5種檢索介面。「簡易查詢」為初始設定畫面,提供熱門查詢詞,以及篇名、關鍵詞、作者、專輯、書評、摘要檢索欄位,檢索者可勾選檢索值所要出現的欄位。 光碟版與Webpac查詢介面之不同,在於光碟系統增加「進階查詢」,此為光碟新增查詢功能,以下拉式選單點選篇名、作者、關鍵詞、刊名、摘要等5欄位進行布林邏輯運算之查詢。其查詢及瀏覽欄位包括關鍵詞、篇名、作者、刊名、專輯、書評、分類號、類名,而摘要、出版日期則僅提供查詢功能。 查詢結果顯示:除了顯示條列式與詳目式外,另有「檢索輸出」,使用者可選擇「列印」、「下載存檔」、「E-mail」等方式,並提供檢索存檔格式,包括:html、xml、EndNote、HyNote。 人工與電腦編輯查詢功能之比較表
結論 本篇目索引資料庫的建置是一長期且連續性的工作,創刊至今即將近38年,從創編時期的人工編輯到文獻分析詮釋資料格式(Metadata)建檔,經過了幾次資料庫的規劃與系統更新,以及不間斷的資料蒐集、分析、輸入與審核校正,才有此資料庫實體的呈現。在此除了感謝歷任館長及宋副館長的支持外,更要感謝歷任主編的經營擘畫,以及默默耕耘這塊園地的同仁們;舉凡索引的月刊、季刊、彙編本的出版,以及自動化作業設計、光碟系統的開發及系統的更新,無不盡心盡力。展望未來索引篇目的編輯,除了繼續進行現行期刊篇目的建檔外,也希望能擴大收錄範圍及回溯建檔,補收1970年以前之學術刊物目次建檔,以完整地呈現臺灣地區的學術研究成果。 由於資訊科技不斷地發展,文獻數位化仍是未來的趨勢,對於目前所建置的資料庫僅提供查詢或瀏覽功能仍有侷限性。就以本資料庫而言,雖已提供線上多種欄位查詢與瀏覽功能,形式上提供了一個輸入的區域,但也只能顯示使用者查詢或瀏覽的結果,對於沒有被設定為查詢值的相關文獻,則難以被查檢利用,故在檢索結果精確率方面仍有改善空間。近年來,網路資源檢索利用新技術的資料探勘(data mining)和文字探勘(text mining),使用者只需建入一個關鍵詞,其同義詞及所有相關詞皆檢索出來,提高資料的查全率。期待不久的將來,資料探勘、文字探勘技術發展成熟,將其技術普及到網路及電子資料庫檢索,將可彌補目前無法充分滿足資料庫查詢與瀏覽需求的遺憾。 附錄一、大事記
附錄二、相關論著(依發表時間先後順序排列)
【附註】
|