近幾年來,在全國十數所高校的翻譯論壇、研討會以及工作坊講過計算機輔助翻譯(CAT),限于時間,好多背后的故事沒有展開。這些故事是我在山東師范大學講課的時候不時跟同學們分享的內容,對于他們了解CAT的發展史不無幫助。為了彌補工作坊中往往沒時間講哲學故事的遺憾,我特開始這個《閑話CAT》系列,跟大家嘮一嘮我個人的計算機輔助翻譯應用、教學和研究方面經歷的一些事兒。本系列文章大多是閑暇時間,“口述”給訊飛語音輸入,在OneNote中記錄,等有了時間又在電腦前編輯的——這是我近來努力嘗試適應的工作方式,可以大大減少端坐在電腦前的時間,寫文章的效率也大大提高,對于考慮成熟的話題,基本上一個小時能有2500-3000字的草稿出來。
在Déjà Vu的官方網站上,我看過它的開發歷史的介紹。最早,這款軟件是僅供公司內部翻譯部門使用的,后來,公司內部的翻譯人員發現,這款軟件比當時市場上的其他軟件更好用,于是乎,他們就專門將這款軟件推向市場。
當年的很多早期的很多計算機輔助翻譯軟件,開發的思路,都是“傍大款”,也就是說,依附于某個流行的文字處理軟件,為其增加一些特殊的翻譯需要的功能,這種思路在當時看來是非常自然的,因為很多人以為翻譯不過就是一種文字的轉換行為,早期翻譯工作所使用的軟件,最多的就是文字處理軟件。在文字處理軟件的基礎上增加一些存儲/查詢術語,以及存儲/查詢翻譯過的句子的功能,這樣就形成了早期的原始的計算機輔助翻譯軟件。
計算機輔助翻譯軟件的這種設計思路,幾乎流行了有20年,最突出的表現,是直到2014年,鼎鼎大名的塔多思才拋棄了這樣的設計思路,轉為采用獨立的、以“翻譯表格”為基礎的單一的翻譯軟件界面。相比之下,Déjà Vu這款軟件非常的早熟,在2000年后,就已經全面的轉向了翻譯表格的界面設計,而且在Déjà Vu X推出的時候已經是一個全面的、多功能的軟件,把翻譯記憶、術語管理、翻譯記憶的制作(也就是對齊Alignment)功能等,都集成到了單一的軟件之中。
細細說來,這款軟件的早熟(請結合2000年代的時代背景。如今這些早熟的特點,當年有些還是原創的特性,已經成了絕大多數計算機輔助軟件的共性。)主要表現在以下幾個方面:
- 集成性高。Déjà Vu把基本的翻譯所需要的功能集成到了一個軟件界面下,而不是開發獨立的模塊,或者獨立的應用程序。由于集成度高,使得它對電腦系統的要求比較低,整體性能比較穩定,不容易造成翻譯項目錯誤。
- Déjà Vu提供不同的版本。Déjà Vu的多個版本,采用不同的認證機制,使得有不同的需求的人可以選擇使用不同的版本。這樣做特別有利于在2010年以前,云計算尚未展開,還沒有大規模的網絡協同的條件的情況下,在一個集團內部廣泛的部署這團這款軟件。此外,翻譯公司根據需要,選擇不同的版本,可以最大程度節省投資。比如普通譯員采用完全免費的Déjà Vu Editor 版就可以。該版本不能夠用于創建項目,創建數據庫的,但是可以編輯別人創建好的項目,同時使用別人創建好的記憶庫和術語庫。這種設計特別有利于軟件的大范圍推廣使用:項目管理員負責學習掌握所有的技術,處理所有的文檔,為譯員創建項目、翻譯記憶庫和翻譯術語庫,然后把拆分好的項目,分配給譯員。
- 學習簡單。在使用Editor版本時,譯員學習軟件應用的壓力減到最低,大約十分鐘就可以學會基本的幾個操作。比如,最關鍵的幾個操作是,如何添加術語,如何確認當前的譯文,如何為不確定的疑問作出合理的標注,等等。學會了這些操作,就完全可以參與到項目的翻譯過程中來。
- 優越的文件管理。Déjà Vu的文件管理非常的清晰明了,翻譯記憶庫、術語庫、翻譯項目,都是獨立的數據庫文件,便于用戶復制、保存,以及備份,也便于在項目成員之間交換這些文件。此外,由于它采用了標準的文件型數據庫文件格式,文件出現問題特別容易修復。用戶使用過程中所遇到的幾乎所有的翻譯記憶庫、翻譯項目、以及翻譯術語庫無法打開的情況,采用軟件本身所帶的修復功能,都能正常修復。最讓人驚喜的是,由于它的術語庫和記憶庫采用的是標準的數據庫文件,在不購買網絡版的情況下,這些數據庫也可以通過局域網共享,實現小型的網絡寫作。
- Déjà Vu的工作組版支持創建子項目,而且創建子項目的時候,管理員可以選擇是否提供完整的術語庫以及記憶庫給子項目譯員,最大程度保護翻譯機構的語言資產。
- Déjà Vu對術語的管理采用了兩級術語管理,第一級是Lexicon,是項目內部的術語表;第二級是術語庫,可以供不同的項目調用。
- Déjà Vu提供了靈活的外部審閱機制。Déjà Vu支持用戶把翻譯項目中的文件,導出為一個可以用Word編輯的RTF格式的表格文件,這種模式非常的靈活,除了可以用于供不掌握Déjà Vu的譯審參與翻譯項目的審校,而且在這個模式的基礎上,我最早開發了一個辦法,把谷歌機器翻譯的結果粘貼到導出的空白表格文件當中,保存后再重新導入到項目軟件里,就等于是變相地借助谷歌機器翻譯,對翻譯項目中的所有文件進行快速的預處理。那時候,谷歌翻譯的限制比較少,一次可以翻譯數萬字符,二三十頁的文檔經過3到5輪的復制粘貼,就能夠全部預處理完,非常的方便。由此,我也可能成了世界上最早一批把CAT和MT的預處理功能結合到一起,用于社科圖書翻譯實踐的人。
當年,在我把Déjà Vu介紹給周圍的一些曾經用過并熟悉其他CAT軟件的朋友的時候,我想可能正是由于這些早熟的特性,讓他們在了解了Déjà Vu的特性后都會驚呼:這簡直就是CAT軟件中的瑞士軍刀,全能而好用。
如今集成化的軟件設計,以及翻譯表格界面的應用等等,都已經成了計算機輔助翻譯軟件的某種“標準”,成了默認的規范化設計,由此可以看出,在幾乎20年前,Déjà Vu就采用了這樣的設計,提供了如此全面的綜合翻譯輔助系統,是多么的早熟。
【作者簡介】徐彬(1973—),山東師范大學教師。長期從事翻譯研究與實踐,主持參與國家級項目4項,發表學術論文10余篇,出版譯著40余部,1000余萬字,如《藝術宇宙》《宇宙傳記》《我為什么離開高盛》《世界史的故事》等,題材涉及文學、現代物理學、天文學、生物學、歷史、藝術、文化等多學科。國內最早在本科和研究生階段開設計算機輔助翻譯翻譯類課程,指導研究生及本科生應用多種翻譯技術翻譯出版圖書30余部,在翻譯技術傳播方面做出了突出成績。請關注微信公號【我譯故我在】,微博【翻譯及CAT研究-徐彬】。