TAUS指南在快速譯后編輯(LPE)中的應(yīng)用以醫(yī)學(xué)報(bào)告為例

所屬分類：文史論文閱讀次時(shí)間：2021-12-21 10:37

本文摘要：摘要：隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算的飛速發(fā)展，機(jī)器翻譯發(fā)生了巨大變化，機(jī)器翻譯譯后編輯(machinetranslationpost-editing，MTPE)模式也應(yīng)運(yùn)而生，逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量，還需要相應(yīng)的規(guī)范和準(zhǔn)則加持，以幫助譯后編輯者識(shí)別

　　摘要：隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算的飛速發(fā)展，機(jī)器翻譯發(fā)生了巨大變化，機(jī)器翻譯譯后編輯(machinetranslationpost-editing，MTPE)模式也應(yīng)運(yùn)而生，逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量，還需要相應(yīng)的規(guī)范和準(zhǔn)則加持，以幫助譯后編輯者識(shí)別機(jī)器翻譯錯(cuò)誤并快速?zèng)Q策機(jī)器譯文是否需要進(jìn)行編輯。通過介紹翻譯自動(dòng)化用戶協(xié)會(huì)(TAUS)的MTPE指南的相關(guān)實(shí)踐準(zhǔn)則，并根據(jù)文本性質(zhì)和受眾選取適用準(zhǔn)則指導(dǎo)進(jìn)行了醫(yī)學(xué)報(bào)告的快速譯后編輯(lightpost-editing,LPE)實(shí)踐，對(duì)醫(yī)學(xué)報(bào)告文本譯后編輯實(shí)踐中存在的詞匯錯(cuò)譯、分詞短語錯(cuò)譯、從句錯(cuò)譯以及段落錯(cuò)譯、漏譯等問題進(jìn)行了分析，并對(duì)該指南的實(shí)際指導(dǎo)意義進(jìn)行了總結(jié)與評(píng)價(jià)。

　　關(guān)鍵詞：機(jī)器翻譯;快速譯后編輯;機(jī)器翻譯譯后編輯指南;醫(yī)學(xué)報(bào)告翻譯

機(jī)器翻譯

　　近年來，機(jī)器翻譯質(zhì)量得到了極大改善，信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時(shí)全球化和本地化催生的海量翻譯需求，傳統(tǒng)的純?nèi)斯しg無法滿足且成本相對(duì)較高，新的翻譯業(yè)務(wù)類型與質(zhì)量標(biāo)準(zhǔn)相較以前都有了很多變化，從而促使越來越多的企業(yè)開始用機(jī)器翻譯技術(shù)進(jìn)行初步的翻譯項(xiàng)目處理，也就導(dǎo)致了譯后編輯市場的擴(kuò)大。

　　作為提升機(jī)器翻譯質(zhì)量的新模式，譯后編輯還缺少規(guī)范一致的實(shí)踐原則、質(zhì)量評(píng)估標(biāo)準(zhǔn)等，因此若要該模式得到有效并廣泛的應(yīng)用，還需要清晰明確的各類指導(dǎo)準(zhǔn)則。2016年，翻譯自動(dòng)化用戶協(xié)會(huì)(TranslationAutomationUserSociety，TAUS)發(fā)布了MTPost-editingGuidelines，這是目前可參考的較為完整的機(jī)器翻譯譯后編輯指南。本文根據(jù)該指南對(duì)醫(yī)學(xué)報(bào)告機(jī)器譯文進(jìn)行了快速譯后編輯實(shí)踐，并對(duì)其指導(dǎo)意義及存在的問題進(jìn)行了分析。

　　一、機(jī)器翻譯與譯后編輯

　　(一)機(jī)器翻譯的發(fā)展及缺陷

　　機(jī)器翻譯的廣泛應(yīng)用產(chǎn)生了巨大的社會(huì)效益和經(jīng)濟(jì)效益�；仡櫰浒l(fā)展歷程，主要經(jīng)歷了四個(gè)階段：一是基于規(guī)則(RBMT);二是基于例子(EBMT);三是統(tǒng)計(jì)機(jī)器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯利用已有的大規(guī)模的真實(shí)語料庫來進(jìn)行深度學(xué)習(xí)，從語料庫中自動(dòng)獲取語言特征和規(guī)則，它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)翻譯的機(jī)器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的發(fā)展使機(jī)器譯文質(zhì)量得到了質(zhì)的提升。

　　但即便神經(jīng)機(jī)器翻譯系統(tǒng)使機(jī)器譯文質(zhì)量飛速發(fā)展，機(jī)器譯文仍有很多局限性，自然語言處理仍有許多在實(shí)踐中難以解決的問題，比如從句錯(cuò)譯、詞匯錯(cuò)譯、譯文調(diào)序失敗、符號(hào)錯(cuò)譯、漏譯等問題[2]。醫(yī)學(xué)報(bào)告作為醫(yī)學(xué)文本的一種，其特點(diǎn)就是縮略語、醫(yī)學(xué)術(shù)語使用較多，同時(shí)為表客觀及行文簡潔準(zhǔn)確，被動(dòng)語態(tài)以及分詞結(jié)構(gòu)應(yīng)用較多[3]。機(jī)器在翻譯醫(yī)學(xué)文本時(shí)，往往會(huì)出現(xiàn)術(shù)語錯(cuò)譯、漏譯和詞匯替代錯(cuò)譯問題，同時(shí)也會(huì)出現(xiàn)對(duì)被動(dòng)句以及分詞結(jié)構(gòu)的處理不當(dāng)導(dǎo)致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見本文第三章的實(shí)踐分析。要克服機(jī)器譯文存在的這些缺陷，使譯文質(zhì)量達(dá)到要求，目前最有效快捷的方法就是對(duì)其進(jìn)行人工修改、完善，即進(jìn)行機(jī)器翻譯譯后編輯。

　　(二)譯后編輯概述

　　譯后編輯(post-editing)是在語言或格式方面，對(duì)機(jī)器翻譯的原始產(chǎn)出，即初始譯文，進(jìn)行加工與修改來提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性[4]。2010年TAUS實(shí)踐中的譯后編輯報(bào)告將譯后編輯定義為“用最少的人工改進(jìn)機(jī)器生成的翻譯的過程”[5]。而針對(duì)不同要求和目的，關(guān)于機(jī)器翻譯譯后編輯的ISO18587標(biāo)準(zhǔn)將譯后編輯分為兩個(gè)級(jí)別：快速譯后編輯(LightPost-editing,LPE)、完全譯后編輯(FullPost-editing,FPE)[6]。

　　機(jī)器翻譯譯后編輯模式充分發(fā)揮機(jī)器翻譯的速度(效率)，也充分發(fā)揮人工翻譯的精度(質(zhì)量)，從而既滿足翻譯市場快速發(fā)展的需求，也推動(dòng)了翻譯技術(shù)的發(fā)展，還促進(jìn)了學(xué)界和業(yè)界的交流與合作，豐富了語言服務(wù)產(chǎn)業(yè)鏈的組成[7]。不過譯后編輯作為新的翻譯工作模式，在實(shí)踐過程中除了要識(shí)別并糾正上述機(jī)器譯文各類錯(cuò)誤之外，還需考慮效率、質(zhì)量要求、成本等各方面因素。

　　因此其在發(fā)展過程中還需要獨(dú)立、一致的標(biāo)準(zhǔn)來衡量和約束譯后編輯的質(zhì)量，確定譯后編輯工作量等，幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù)，同時(shí)培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機(jī)器翻譯譯后編輯相關(guān)的大部分實(shí)踐準(zhǔn)則相對(duì)宏觀，如崔啟亮提出的實(shí)踐準(zhǔn)則相對(duì)宏觀，進(jìn)行實(shí)踐時(shí)還需自行確立具體規(guī)則[7]。而MidoriTatsuni提出的對(duì)MTPE譯文相關(guān)的部分要求與TAUS類似，但比較寬泛，并未針對(duì)不同的質(zhì)量要求進(jìn)行細(xì)致劃分，實(shí)際應(yīng)用時(shí)還需綜合考慮各種因素進(jìn)行細(xì)化[8]。目前相對(duì)具體的實(shí)踐準(zhǔn)則是TAUS發(fā)布的MTPOSTEDITINGGUIDELINES，根據(jù)不同的質(zhì)量要求列出了對(duì)應(yīng)的原則，所以本文采用該原則指導(dǎo)了所選文本的譯后編輯實(shí)踐，以檢驗(yàn)其是否可有效提高譯后編輯效率。

　　二、TAUS機(jī)器翻譯譯后編輯指南

　　TAUS成立于2004年，是全球語言和翻譯行業(yè)的資源中心。該協(xié)會(huì)通過自己的數(shù)據(jù)云和質(zhì)量評(píng)估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標(biāo)、基準(zhǔn)和數(shù)據(jù)等。2016年，該協(xié)會(huì)發(fā)行了MTPE指南，旨在促進(jìn)譯后編輯模式的發(fā)展，提升譯后編輯的質(zhì)量和效率，并幫助該行業(yè)選擇、培訓(xùn)高素質(zhì)、高水準(zhǔn)的譯后編輯者。該指南指出，最基本的譯后編輯質(zhì)量評(píng)估準(zhǔn)則有兩條，一是機(jī)器生成的譯文質(zhì)量，二是對(duì)待翻譯材料的最終質(zhì)量預(yù)期，即譯后編輯工作如何進(jìn)行，取決于機(jī)器生成的原始譯文質(zhì)量及客戶對(duì)譯文質(zhì)量的需求[9]。該指南把預(yù)期的最終譯后編輯質(zhì)量大致分為兩個(gè)等級(jí)，一級(jí)為“goodenoughquality”，另一級(jí)為“humantranslationquality”。

　　在選擇適用質(zhì)量要求時(shí)，主要取決于目標(biāo)讀者或客戶對(duì)最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機(jī)器譯文的質(zhì)量。而對(duì)于初始機(jī)器譯文質(zhì)量的評(píng)判，若花費(fèi)太多時(shí)間來確定其是否可用會(huì)得不償失，降低效率。因此可在決策時(shí)間上加一些限制，若在一定時(shí)間內(nèi)查看一個(gè)機(jī)器翻譯片段(在熟悉源文本和目標(biāo)文本之后)，發(fā)現(xiàn)無法輕松理解，那就舍棄機(jī)器譯文。

　　Mesa-Lao在其實(shí)驗(yàn)分析中表明大部分測(cè)試者在初讀機(jī)器譯文上的停留時(shí)間為5～10秒左右，本文的譯后編輯實(shí)踐即以5～10秒原則來判斷是應(yīng)該糾正機(jī)器譯文，還是應(yīng)該刪除并重新翻譯低質(zhì)量的片段[10]。同時(shí)針對(duì)最終譯文質(zhì)量的不同質(zhì)量預(yù)期(是“goodenoughquality”還是“humantranslationquality”)以及機(jī)器生成譯文的不同質(zhì)量，也會(huì)采取不同的譯后編輯策略，即進(jìn)行LPE還是FPE。

　　三、基于TAUS指南進(jìn)行的醫(yī)學(xué)文本

　　譯后編輯實(shí)踐分析醫(yī)學(xué)報(bào)告屬于醫(yī)學(xué)類文本，作為科技文本的一種，對(duì)MTPE模式的適應(yīng)性較強(qiáng)，同時(shí)有海量翻譯需求，對(duì)翻譯效率要求較高。本文選取了TheNewEnglandJournalofMedicine上的醫(yī)學(xué)報(bào)告來進(jìn)行譯后編輯實(shí)踐，關(guān)于多例分析的報(bào)告，發(fā)布于2020年1月24日，全文約3000詞。本文的目的是與醫(yī)學(xué)工作者和研究者共享信息以及時(shí)有效共同應(yīng)對(duì)并預(yù)防疫情，因?yàn)樵摿餍胁魅拘詮?qiáng)，傳播速度快，加之如今交通非常發(fā)達(dá)，人員流動(dòng)頻繁，所以此類文本信息翻譯非常注重準(zhǔn)確性和時(shí)效性。

　　同時(shí)，此類文本譯文目標(biāo)受眾為醫(yī)學(xué)專家或工作者，他們僅需了解原文概述或要點(diǎn)，以幫助自己了解疾病相關(guān)信息，共同做好應(yīng)對(duì)準(zhǔn)備并尋找解決辦法，所以可選擇省時(shí)高效的LPE模式進(jìn)行MTPE，使最終譯文達(dá)到“goodenoughquality”的要求(下文提到的具體準(zhǔn)則均針對(duì)“goodenoughquality”)。

　　本文所選擇的機(jī)器翻譯引擎為谷歌翻譯，在實(shí)踐過程中發(fā)現(xiàn)詞匯錯(cuò)譯、分詞短語錯(cuò)譯、從句錯(cuò)譯以及段落錯(cuò)譯、漏譯問題較多，而此前一直被視為難點(diǎn)的被動(dòng)語態(tài)問題已不明顯。基于神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)大的學(xué)習(xí)能力以及大數(shù)據(jù)的支撐，目前谷歌對(duì)被動(dòng)句的處理表現(xiàn)較為良好，比如，筆者較早時(shí)期實(shí)踐時(shí)發(fā)現(xiàn)的相關(guān)問題，在幾個(gè)月之后再次用谷歌生成譯文時(shí)，發(fā)現(xiàn)其已經(jīng)對(duì)譯文進(jìn)行了改良，符合“goodenoughquality”的要求，可不再作為難點(diǎn)進(jìn)行分析。其他相關(guān)案例具體分析如下。

　　(一)詞匯錯(cuò)譯

　　例1InlateDecember2019,severallocalhealthfacilitiesreportedclustersofpatientswithpneumoniaofunknowncausethatwereepidemiologicallylinkedtoaseafoodandwetanimalwholesalemarketinWuhan,HubeiProvince,China.…Wereporttheresultsofthisinvestigation,identifyingthesourceofthepneumoniaclusters,anddescribeanovelcoronavirusdetectedinpatientswithpneumoniawhosespecimensweretestedbytheChinaCDCatanearlystageoftheoutbreak.

　　綜上，在本次實(shí)踐過程中發(fā)現(xiàn)，相當(dāng)一部分機(jī)器原始譯文已符合TAUS指南中“goodenoughquality”的要求，不用做太多修改。且機(jī)器翻譯質(zhì)量在持續(xù)提高，在醫(yī)學(xué)專有名詞、術(shù)語以及被動(dòng)語態(tài)方面均表現(xiàn)良好，但對(duì)一詞多義的詞匯識(shí)別還不夠準(zhǔn)確，問題較多，同時(shí)對(duì)長句、結(jié)構(gòu)復(fù)雜的句子處理較為糟糕，如定語從句、分詞結(jié)構(gòu)等，轉(zhuǎn)換時(shí)無法對(duì)句子語序進(jìn)行調(diào)整，導(dǎo)致譯文意思出現(xiàn)偏差，甚至在翻譯段落時(shí)出現(xiàn)漏譯現(xiàn)象。通過使用TAUS指南指導(dǎo)LPE的實(shí)踐發(fā)現(xiàn)，指導(dǎo)性較強(qiáng)的是要求(1)(2)(4)，可根據(jù)此三條要求快速做出判斷是否應(yīng)對(duì)機(jī)器譯文進(jìn)行LPE。因本次實(shí)踐中未遇到文化上不妥和侵犯信息，以及因本文為英譯漢，漢語無拼寫問題，所以要求(3)和(5)關(guān)于文化和拼寫問題不用討論。

　　要求(4)在應(yīng)用時(shí)應(yīng)注意盡可能多地保留機(jī)器初始譯文是建立在機(jī)器譯文質(zhì)量較高的基礎(chǔ)上，譯者應(yīng)迅速做出判斷是否舍棄機(jī)器譯文進(jìn)行人工翻譯，否則時(shí)間成本反而更高。要求(6)無需進(jìn)行僅跟文風(fēng)相關(guān)的改正和(7)不需僅為改善譯文流暢度進(jìn)行句子重組，就允許我們保留一些不符合中文語言習(xí)慣但句子含義表達(dá)正確的機(jī)器譯文而無需進(jìn)行修改，如例1僅修改了詞匯錯(cuò)譯的部分，其余均保留機(jī)器譯文，節(jié)約了很多時(shí)間。通過使用TAUS指南，在進(jìn)行譯后編輯時(shí)會(huì)更有目的性，標(biāo)準(zhǔn)更加明確，可盡量避免做一些不必要的修改導(dǎo)致時(shí)間成本和人工成本的浪費(fèi)。當(dāng)然，TAUS指南仍有許多不足之處，依舊不夠具體，有待在實(shí)踐應(yīng)用中繼續(xù)完善。

　　四、總結(jié)

　　語言服務(wù)行業(yè)采用機(jī)器翻譯譯后編輯模式來提高翻譯效率和翻譯質(zhì)量，也需要統(tǒng)一規(guī)范的標(biāo)準(zhǔn)來幫助評(píng)估工作質(zhì)量并定價(jià)，同時(shí)好的規(guī)范還可以促進(jìn)MTPE模式效率和質(zhì)量的進(jìn)一步提升，如本文按照TAUS指南對(duì)“goodenoughquality”的要求進(jìn)行快速譯后編輯時(shí)，目標(biāo)更加明確和清晰，避免譯后編輯過程中因標(biāo)準(zhǔn)不確定進(jìn)行不必要的編輯，導(dǎo)致比純?nèi)斯しg耗時(shí)更長的情況發(fā)生。

　　且此類醫(yī)學(xué)報(bào)告信息交流的時(shí)效性尤為關(guān)鍵，因?yàn)榱餍胁〉膫鞑タ�、傳染性�?qiáng)，信息能夠更快實(shí)現(xiàn)共享，就可能更早更有效地防控疾病更大范圍傳播，就可能幫助各國醫(yī)務(wù)工作者共同合作更早研究出應(yīng)對(duì)方法。因此，采取較高的機(jī)器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則)可幫助譯后編輯者們?cè)诟虝r(shí)間內(nèi)獲得符合預(yù)期的譯文。當(dāng)然，本文所遵循的TAUS指南也依舊存在需要改善或進(jìn)一步細(xì)化的地方，相信隨著機(jī)器翻譯譯后編輯的發(fā)展，更加完善的規(guī)范會(huì)生成，機(jī)器翻譯譯后編輯模式也會(huì)更加成熟高效。

　　參考文獻(xiàn)：

　　馮志偉.機(jī)器翻譯與人工智能的平行發(fā)展[J].外國語,2018，41(6)：35−48.

　　[1]羅季美,李梅.機(jī)器翻譯譯文錯(cuò)誤分析[J].中國翻譯,2012，33(5)：84−89.

　　[2][3]劉玉強(qiáng),賀子瓊.醫(yī)學(xué)英語的文體特征及其翻譯策略[J].英語廣場,2015(10)：35−36.馮全功,崔啟亮.譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢(shì)[J].上海翻譯,2016(6)：67−74,89.

　　[4]TAUS.Post-editinginPractice[EB/OL].(2010-03-10)[2020-08-20].

　　[5]ISO.ISO18587:2017Translationservices—Posteditingofmachinetranslationoutput—Requirements[S].ISO,2017.

　　[6]崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國翻譯,2014，35(6)：68−73.

　　作者：仲晨陽，倪　蓉