本文摘要:摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算的飛速發(fā)展,機(jī)器翻譯發(fā)生了巨大變化,機(jī)器翻譯譯后編輯(machinetranslationpost-editing,MTPE)模式也應(yīng)運而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量,還需要相應(yīng)的規(guī)范和準(zhǔn)則加持,以幫助譯后編輯者識別
摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算的飛速發(fā)展,機(jī)器翻譯發(fā)生了巨大變化,機(jī)器翻譯譯后編輯(machinetranslationpost-editing,MTPE)模式也應(yīng)運而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量,還需要相應(yīng)的規(guī)范和準(zhǔn)則加持,以幫助譯后編輯者識別機(jī)器翻譯錯誤并快速決策機(jī)器譯文是否需要進(jìn)行編輯。通過介紹翻譯自動化用戶協(xié)會(TAUS)的MTPE指南的相關(guān)實踐準(zhǔn)則,并根據(jù)文本性質(zhì)和受眾選取適用準(zhǔn)則指導(dǎo)進(jìn)行了醫(yī)學(xué)報告的快速譯后編輯(lightpost-editing,LPE)實踐,對醫(yī)學(xué)報告文本譯后編輯實踐中存在的詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯等問題進(jìn)行了分析,并對該指南的實際指導(dǎo)意義進(jìn)行了總結(jié)與評價。
關(guān)鍵詞:機(jī)器翻譯;快速譯后編輯;機(jī)器翻譯譯后編輯指南;醫(yī)學(xué)報告翻譯
近年來,機(jī)器翻譯質(zhì)量得到了極大改善,信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時全球化和本地化催生的海量翻譯需求,傳統(tǒng)的純?nèi)斯しg無法滿足且成本相對較高,新的翻譯業(yè)務(wù)類型與質(zhì)量標(biāo)準(zhǔn)相較以前都有了很多變化,從而促使越來越多的企業(yè)開始用機(jī)器翻譯技術(shù)進(jìn)行初步的翻譯項目處理,也就導(dǎo)致了譯后編輯市場的擴(kuò)大。
作為提升機(jī)器翻譯質(zhì)量的新模式,譯后編輯還缺少規(guī)范一致的實踐原則、質(zhì)量評估標(biāo)準(zhǔn)等,因此若要該模式得到有效并廣泛的應(yīng)用,還需要清晰明確的各類指導(dǎo)準(zhǔn)則。2016年,翻譯自動化用戶協(xié)會(TranslationAutomationUserSociety,TAUS)發(fā)布了MTPost-editingGuidelines,這是目前可參考的較為完整的機(jī)器翻譯譯后編輯指南。本文根據(jù)該指南對醫(yī)學(xué)報告機(jī)器譯文進(jìn)行了快速譯后編輯實踐,并對其指導(dǎo)意義及存在的問題進(jìn)行了分析。
一、機(jī)器翻譯與譯后編輯
(一)機(jī)器翻譯的發(fā)展及缺陷
機(jī)器翻譯的廣泛應(yīng)用產(chǎn)生了巨大的社會效益和經(jīng)濟(jì)效益。回顧其發(fā)展歷程,主要經(jīng)歷了四個階段:一是基于規(guī)則(RBMT);二是基于例子(EBMT);三是統(tǒng)計機(jī)器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯利用已有的大規(guī)模的真實語料庫來進(jìn)行深度學(xué)習(xí),從語料庫中自動獲取語言特征和規(guī)則,它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)翻譯的機(jī)器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的發(fā)展使機(jī)器譯文質(zhì)量得到了質(zhì)的提升。
但即便神經(jīng)機(jī)器翻譯系統(tǒng)使機(jī)器譯文質(zhì)量飛速發(fā)展,機(jī)器譯文仍有很多局限性,自然語言處理仍有許多在實踐中難以解決的問題,比如從句錯譯、詞匯錯譯、譯文調(diào)序失敗、符號錯譯、漏譯等問題[2]。醫(yī)學(xué)報告作為醫(yī)學(xué)文本的一種,其特點就是縮略語、醫(yī)學(xué)術(shù)語使用較多,同時為表客觀及行文簡潔準(zhǔn)確,被動語態(tài)以及分詞結(jié)構(gòu)應(yīng)用較多[3]。機(jī)器在翻譯醫(yī)學(xué)文本時,往往會出現(xiàn)術(shù)語錯譯、漏譯和詞匯替代錯譯問題,同時也會出現(xiàn)對被動句以及分詞結(jié)構(gòu)的處理不當(dāng)導(dǎo)致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見本文第三章的實踐分析。要克服機(jī)器譯文存在的這些缺陷,使譯文質(zhì)量達(dá)到要求,目前最有效快捷的方法就是對其進(jìn)行人工修改、完善,即進(jìn)行機(jī)器翻譯譯后編輯。
(二)譯后編輯概述
譯后編輯(post-editing)是在語言或格式方面,對機(jī)器翻譯的原始產(chǎn)出,即初始譯文,進(jìn)行加工與修改來提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性[4]。2010年TAUS實踐中的譯后編輯報告將譯后編輯定義為“用最少的人工改進(jìn)機(jī)器生成的翻譯的過程”[5]。而針對不同要求和目的,關(guān)于機(jī)器翻譯譯后編輯的ISO18587標(biāo)準(zhǔn)將譯后編輯分為兩個級別:快速譯后編輯(LightPost-editing,LPE)、完全譯后編輯(FullPost-editing,FPE)[6]。
機(jī)器翻譯譯后編輯模式充分發(fā)揮機(jī)器翻譯的速度(效率),也充分發(fā)揮人工翻譯的精度(質(zhì)量),從而既滿足翻譯市場快速發(fā)展的需求,也推動了翻譯技術(shù)的發(fā)展,還促進(jìn)了學(xué)界和業(yè)界的交流與合作,豐富了語言服務(wù)產(chǎn)業(yè)鏈的組成[7]。不過譯后編輯作為新的翻譯工作模式,在實踐過程中除了要識別并糾正上述機(jī)器譯文各類錯誤之外,還需考慮效率、質(zhì)量要求、成本等各方面因素。
因此其在發(fā)展過程中還需要獨立、一致的標(biāo)準(zhǔn)來衡量和約束譯后編輯的質(zhì)量,確定譯后編輯工作量等,幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù),同時培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機(jī)器翻譯譯后編輯相關(guān)的大部分實踐準(zhǔn)則相對宏觀,如崔啟亮提出的實踐準(zhǔn)則相對宏觀,進(jìn)行實踐時還需自行確立具體規(guī)則[7]。而MidoriTatsuni提出的對MTPE譯文相關(guān)的部分要求與TAUS類似,但比較寬泛,并未針對不同的質(zhì)量要求進(jìn)行細(xì)致劃分,實際應(yīng)用時還需綜合考慮各種因素進(jìn)行細(xì)化[8]。目前相對具體的實踐準(zhǔn)則是TAUS發(fā)布的MTPOSTEDITINGGUIDELINES,根據(jù)不同的質(zhì)量要求列出了對應(yīng)的原則,所以本文采用該原則指導(dǎo)了所選文本的譯后編輯實踐,以檢驗其是否可有效提高譯后編輯效率。
二、TAUS機(jī)器翻譯譯后編輯指南
TAUS成立于2004年,是全球語言和翻譯行業(yè)的資源中心。該協(xié)會通過自己的數(shù)據(jù)云和質(zhì)量評估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標(biāo)、基準(zhǔn)和數(shù)據(jù)等。2016年,該協(xié)會發(fā)行了MTPE指南,旨在促進(jìn)譯后編輯模式的發(fā)展,提升譯后編輯的質(zhì)量和效率,并幫助該行業(yè)選擇、培訓(xùn)高素質(zhì)、高水準(zhǔn)的譯后編輯者。該指南指出,最基本的譯后編輯質(zhì)量評估準(zhǔn)則有兩條,一是機(jī)器生成的譯文質(zhì)量,二是對待翻譯材料的最終質(zhì)量預(yù)期,即譯后編輯工作如何進(jìn)行,取決于機(jī)器生成的原始譯文質(zhì)量及客戶對譯文質(zhì)量的需求[9]。該指南把預(yù)期的最終譯后編輯質(zhì)量大致分為兩個等級,一級為“goodenoughquality”,另一級為“humantranslationquality”。
在選擇適用質(zhì)量要求時,主要取決于目標(biāo)讀者或客戶對最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機(jī)器譯文的質(zhì)量。而對于初始機(jī)器譯文質(zhì)量的評判,若花費太多時間來確定其是否可用會得不償失,降低效率。因此可在決策時間上加一些限制,若在一定時間內(nèi)查看一個機(jī)器翻譯片段(在熟悉源文本和目標(biāo)文本之后),發(fā)現(xiàn)無法輕松理解,那就舍棄機(jī)器譯文。
Mesa-Lao在其實驗分析中表明大部分測試者在初讀機(jī)器譯文上的停留時間為5~10秒左右,本文的譯后編輯實踐即以5~10秒原則來判斷是應(yīng)該糾正機(jī)器譯文,還是應(yīng)該刪除并重新翻譯低質(zhì)量的片段[10]。同時針對最終譯文質(zhì)量的不同質(zhì)量預(yù)期(是“goodenoughquality”還是“humantranslationquality”)以及機(jī)器生成譯文的不同質(zhì)量,也會采取不同的譯后編輯策略,即進(jìn)行LPE還是FPE。
三、基于TAUS指南進(jìn)行的醫(yī)學(xué)文本
譯后編輯實踐分析醫(yī)學(xué)報告屬于醫(yī)學(xué)類文本,作為科技文本的一種,對MTPE模式的適應(yīng)性較強(qiáng),同時有海量翻譯需求,對翻譯效率要求較高。本文選取了TheNewEnglandJournalofMedicine上的醫(yī)學(xué)報告來進(jìn)行譯后編輯實踐,關(guān)于多例分析的報告,發(fā)布于2020年1月24日,全文約3000詞。本文的目的是與醫(yī)學(xué)工作者和研究者共享信息以及時有效共同應(yīng)對并預(yù)防疫情,因為該流行病傳染性強(qiáng),傳播速度快,加之如今交通非常發(fā)達(dá),人員流動頻繁,所以此類文本信息翻譯非常注重準(zhǔn)確性和時效性。
同時,此類文本譯文目標(biāo)受眾為醫(yī)學(xué)專家或工作者,他們僅需了解原文概述或要點,以幫助自己了解疾病相關(guān)信息,共同做好應(yīng)對準(zhǔn)備并尋找解決辦法,所以可選擇省時高效的LPE模式進(jìn)行MTPE,使最終譯文達(dá)到“goodenoughquality”的要求(下文提到的具體準(zhǔn)則均針對“goodenoughquality”)。
本文所選擇的機(jī)器翻譯引擎為谷歌翻譯,在實踐過程中發(fā)現(xiàn)詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯問題較多,而此前一直被視為難點的被動語態(tài)問題已不明顯;谏窠(jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)大的學(xué)習(xí)能力以及大數(shù)據(jù)的支撐,目前谷歌對被動句的處理表現(xiàn)較為良好,比如,筆者較早時期實踐時發(fā)現(xiàn)的相關(guān)問題,在幾個月之后再次用谷歌生成譯文時,發(fā)現(xiàn)其已經(jīng)對譯文進(jìn)行了改良,符合“goodenoughquality”的要求,可不再作為難點進(jìn)行分析。其他相關(guān)案例具體分析如下。
(一)詞匯錯譯
例1InlateDecember2019,severallocalhealthfacilitiesreportedclustersofpatientswithpneumoniaofunknowncausethatwereepidemiologicallylinkedtoaseafoodandwetanimalwholesalemarketinWuhan,HubeiProvince,China.…Wereporttheresultsofthisinvestigation,identifyingthesourceofthepneumoniaclusters,anddescribeanovelcoronavirusdetectedinpatientswithpneumoniawhosespecimensweretestedbytheChinaCDCatanearlystageoftheoutbreak.
綜上,在本次實踐過程中發(fā)現(xiàn),相當(dāng)一部分機(jī)器原始譯文已符合TAUS指南中“goodenoughquality”的要求,不用做太多修改。且機(jī)器翻譯質(zhì)量在持續(xù)提高,在醫(yī)學(xué)專有名詞、術(shù)語以及被動語態(tài)方面均表現(xiàn)良好,但對一詞多義的詞匯識別還不夠準(zhǔn)確,問題較多,同時對長句、結(jié)構(gòu)復(fù)雜的句子處理較為糟糕,如定語從句、分詞結(jié)構(gòu)等,轉(zhuǎn)換時無法對句子語序進(jìn)行調(diào)整,導(dǎo)致譯文意思出現(xiàn)偏差,甚至在翻譯段落時出現(xiàn)漏譯現(xiàn)象。通過使用TAUS指南指導(dǎo)LPE的實踐發(fā)現(xiàn),指導(dǎo)性較強(qiáng)的是要求(1)(2)(4),可根據(jù)此三條要求快速做出判斷是否應(yīng)對機(jī)器譯文進(jìn)行LPE。因本次實踐中未遇到文化上不妥和侵犯信息,以及因本文為英譯漢,漢語無拼寫問題,所以要求(3)和(5)關(guān)于文化和拼寫問題不用討論。
要求(4)在應(yīng)用時應(yīng)注意盡可能多地保留機(jī)器初始譯文是建立在機(jī)器譯文質(zhì)量較高的基礎(chǔ)上,譯者應(yīng)迅速做出判斷是否舍棄機(jī)器譯文進(jìn)行人工翻譯,否則時間成本反而更高。要求(6)無需進(jìn)行僅跟文風(fēng)相關(guān)的改正和(7)不需僅為改善譯文流暢度進(jìn)行句子重組,就允許我們保留一些不符合中文語言習(xí)慣但句子含義表達(dá)正確的機(jī)器譯文而無需進(jìn)行修改,如例1僅修改了詞匯錯譯的部分,其余均保留機(jī)器譯文,節(jié)約了很多時間。通過使用TAUS指南,在進(jìn)行譯后編輯時會更有目的性,標(biāo)準(zhǔn)更加明確,可盡量避免做一些不必要的修改導(dǎo)致時間成本和人工成本的浪費。當(dāng)然,TAUS指南仍有許多不足之處,依舊不夠具體,有待在實踐應(yīng)用中繼續(xù)完善。
四、總結(jié)
語言服務(wù)行業(yè)采用機(jī)器翻譯譯后編輯模式來提高翻譯效率和翻譯質(zhì)量,也需要統(tǒng)一規(guī)范的標(biāo)準(zhǔn)來幫助評估工作質(zhì)量并定價,同時好的規(guī)范還可以促進(jìn)MTPE模式效率和質(zhì)量的進(jìn)一步提升,如本文按照TAUS指南對“goodenoughquality”的要求進(jìn)行快速譯后編輯時,目標(biāo)更加明確和清晰,避免譯后編輯過程中因標(biāo)準(zhǔn)不確定進(jìn)行不必要的編輯,導(dǎo)致比純?nèi)斯しg耗時更長的情況發(fā)生。
且此類醫(yī)學(xué)報告信息交流的時效性尤為關(guān)鍵,因為流行病的傳播快、傳染性強(qiáng),信息能夠更快實現(xiàn)共享,就可能更早更有效地防控疾病更大范圍傳播,就可能幫助各國醫(yī)務(wù)工作者共同合作更早研究出應(yīng)對方法。因此,采取較高的機(jī)器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則)可幫助譯后編輯者們在更短時間內(nèi)獲得符合預(yù)期的譯文。當(dāng)然,本文所遵循的TAUS指南也依舊存在需要改善或進(jìn)一步細(xì)化的地方,相信隨著機(jī)器翻譯譯后編輯的發(fā)展,更加完善的規(guī)范會生成,機(jī)器翻譯譯后編輯模式也會更加成熟高效。
參考文獻(xiàn):
馮志偉.機(jī)器翻譯與人工智能的平行發(fā)展[J].外國語,2018,41(6):35−48.
[1]羅季美,李梅.機(jī)器翻譯譯文錯誤分析[J].中國翻譯,2012,33(5):84−89.
[2][3]劉玉強(qiáng),賀子瓊.醫(yī)學(xué)英語的文體特征及其翻譯策略[J].英語廣場,2015(10):35−36.馮全功,崔啟亮.譯后編輯研究:焦點透析與發(fā)展趨勢[J].上海翻譯,2016(6):67−74,89.
[4]TAUS.Post-editinginPractice[EB/OL].(2010-03-10)[2020-08-20].
[5]ISO.ISO18587:2017Translationservices—Posteditingofmachinetranslationoutput—Requirements[S].ISO,2017.
[6]崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國翻譯,2014,35(6):68−73.
作者:仲晨陽,倪 蓉
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///wslw/29151.html