Déjà Vu 有一個非常特殊的功能,就是能夠把當前翻譯項目中的每一個文件都導出為一種雙語格式(Bilingual File),Déjà Vu X將其稱作“外部視圖”(External View)——這個名詞其實比現在更流行的“雙語格式”更易于理解。這種雙語文件是以rtf格式保存的。rtf文件格式是Rich Text Format的縮寫,即“富文本格式”。這是一種開放標準的文件格式,最典型的應用場景就是可以用Word等絕大多數文字處理軟件將其打開并編輯。基于此特性,它往往用于不同的文字處理軟件之間交流文件內容的一種形式,因為它幾乎可以全面的再現絕大多數文字處理軟件所呈現的版面格式等。
RTF是Rich Text Format的縮寫,意即多文本格式。這是一種類似DOC格式(Word文檔)的文件,有很好的兼容性,使用Windows“附件”中的“寫字板”就能打開并進行編輯。使用“寫字板”打開一個RTF格式文件時,將看到文件的內容;如果要查看RTF格式文件的源代碼,只要使用“記事本”將它打開就行了。這就是說,你完全可以像編輯HTML文件一樣,使用“記事本”來編輯RTF格式文件。
Déjà Vu導出的這種雙語格式是一種表格,主要分為五欄。第一欄是每一句話的ID,也就是它的編號;第二欄是Source Langue,也就是原文;第三欄是Target Language;第四欄是Comments,用于在里面書寫一些評語,第五欄是表示翻譯的狀態。導出的雙語文件可以用Word、WPS、Open Office等打開進行編輯。
設計這種雙語文件格式的導出和導入功能,最初的目的是為了讓未使用Déjà Vu的用戶也能夠參與翻譯項目的審校工作。當一個文件的初稿完成之后,譯者可以將其導出為這種雙語文件,發給審校人員。審校人員不需要專門去學習或者安裝Déjà Vu就可以在電腦上使用任意一款支持rtf格式的文字編輯軟件打開編輯。這樣一來,就可以讓沒有學過,也來不及培訓Déjà Vu應用的譯審參與到翻譯審校的流程中來。
在大約2005年前后,我開始注意到谷歌機器翻譯已經有了根據它來做“譯后編輯”(PE)應用價值。它所提供的譯文雖然還很生硬,但是從里面已經能夠采集到大量的可用語塊,而且采集到的語塊往往多于采用比較完善的術語庫所能獲得的文字數。這樣一來,對于一個熟練的譯員而言,在谷歌機器翻譯的基礎上進行編輯,稍加訓練和適應,就能夠獲得比通過術語庫所得的效率提升得更多的效率。
于是乎,我就開始嘗試在谷歌機器翻譯的基礎上進行編譯。但是,那個時候幾乎任何一款CAT軟件都尚不支持直接引用谷歌機器翻譯的內容。怎么辦呢?我開始從這種雙語文件身上打主意,嘗試能不能讓谷歌翻譯來處理這種文件。
最開始的思路,是把它上傳到谷歌翻譯工具包,用翻譯工具包自動翻譯。翻譯完成的文件,原文列的內容已經變成了譯文,把這一列的內容復制,重新粘貼到原始的、未經翻譯的雙語文件的譯文列,這樣就形成了原文和譯文都有的雙語文件。
后來我又發現,如果使用谷歌的Chromo瀏覽器,可以直接將原文列復制粘貼到谷歌機器翻譯頁面,翻譯完成之后復制譯文,然后在雙語文件當中選擇對應的單元格并按粘貼快捷鍵——注意,這里需要嚴格對應,如我們選擇的原文是從編號1到100的單元格,那么此時在粘貼之前也要選擇對應目標語欄的1-100的單元格。然后按ctrl+V的粘貼快捷鍵,就能夠把譯文內容嚴絲合縫地粘貼進去。
另外一點要注意的就是,谷歌的Chrome瀏覽器,或者Safari瀏覽器,和Word配合起來才能產生這樣的粘貼效果。如果使用IE瀏覽器直接粘貼,就會使每一個單元格內都粘貼上全部的譯文。經過研究發現,如果使用IE瀏覽器可以先借到純文本的編輯器,把它粘貼到文本編輯器里,然后重新復制再回過來粘貼,就可以實現和Chrome瀏覽器中復制再回Word粘貼一樣的效果了。相應的,大家如果使用的文件編輯器和文字處理軟件不是Microsoft Word,而是其他的比如WPS或者OpenOffice,可能也會有不同的特性,需要摸索掌握其規律。
不管怎樣,通過這樣的處理,我們就能夠很順利的把谷歌機器翻譯結果粘貼到雙語文件的譯文區,粘貼保存完成后,把雙語文件重新導入翻譯項目,我們的翻譯項目也就有了谷歌翻譯的譯文。
這個實驗成功之后,我把這個處理的方法告訴了山東交通學院外語系的李慶慶老師。李慶慶老師對于軟件的應用和編程都有一些獨到之處。他就說,他可以研究一下Deja Vu的項目文件格式,看看能不能直接調用谷歌的API。他成功了——他發現能夠用外部程序直接打開Déjà Vu的項目翻譯文件這個數據庫,然后調用谷歌的機器翻譯API,為這個數據庫里的譯文區直接采集灌入谷歌的機器翻譯。他寫的這款小程序非常的精巧,有了這款小應用,我只需要把整個的翻譯項目拖放進去,它就能夠自動填入谷歌翻譯的結果。不經意間,我和李慶慶老師的探索,幾乎就成了最早的把機器翻譯融入到應用計算機輔助翻譯的社科圖書翻譯實踐中的案例。