亚洲一区人妻,久久三级免费,国模少妇无码一区二区三区,日韩av动漫

國(guó)內(nèi)或國(guó)外 期刊或論文

您當(dāng)前的位置:發(fā)表學(xué)術(shù)論文網(wǎng)文史論文》 TAUS指南在快速譯后編輯(LPE)中的應(yīng)用以醫(yī)學(xué)報(bào)告為例> 正文

TAUS指南在快速譯后編輯(LPE)中的應(yīng)用以醫(yī)學(xué)報(bào)告為例

所屬分類:文史論文 閱讀次 時(shí)間:2021-12-21 10:37

本文摘要:摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算的飛速發(fā)展,機(jī)器翻譯發(fā)生了巨大變化,機(jī)器翻譯譯后編輯(machinetranslationpost-editing,MTPE)模式也應(yīng)運(yùn)而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量,還需要相應(yīng)的規(guī)范和準(zhǔn)則加持,以幫助譯后編輯者識(shí)別

  摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算的飛速發(fā)展,機(jī)器翻譯發(fā)生了巨大變化,機(jī)器翻譯譯后編輯(machinetranslationpost-editing,MTPE)模式也應(yīng)運(yùn)而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量,還需要相應(yīng)的規(guī)范和準(zhǔn)則加持,以幫助譯后編輯者識(shí)別機(jī)器翻譯錯(cuò)誤并快速?zèng)Q策機(jī)器譯文是否需要進(jìn)行編輯。通過(guò)介紹翻譯自動(dòng)化用戶協(xié)會(huì)(TAUS)的MTPE指南的相關(guān)實(shí)踐準(zhǔn)則,并根據(jù)文本性質(zhì)和受眾選取適用準(zhǔn)則指導(dǎo)進(jìn)行了醫(yī)學(xué)報(bào)告的快速譯后編輯(lightpost-editing,LPE)實(shí)踐,對(duì)醫(yī)學(xué)報(bào)告文本譯后編輯實(shí)踐中存在的詞匯錯(cuò)譯、分詞短語(yǔ)錯(cuò)譯、從句錯(cuò)譯以及段落錯(cuò)譯、漏譯等問(wèn)題進(jìn)行了分析,并對(duì)該指南的實(shí)際指導(dǎo)意義進(jìn)行了總結(jié)與評(píng)價(jià)。

  關(guān)鍵詞:機(jī)器翻譯;快速譯后編輯;機(jī)器翻譯譯后編輯指南;醫(yī)學(xué)報(bào)告翻譯

機(jī)器翻譯

  近年來(lái),機(jī)器翻譯質(zhì)量得到了極大改善,信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時(shí)全球化和本地化催生的海量翻譯需求,傳統(tǒng)的純?nèi)斯しg無(wú)法滿足且成本相對(duì)較高,新的翻譯業(yè)務(wù)類型與質(zhì)量標(biāo)準(zhǔn)相較以前都有了很多變化,從而促使越來(lái)越多的企業(yè)開始用機(jī)器翻譯技術(shù)進(jìn)行初步的翻譯項(xiàng)目處理,也就導(dǎo)致了譯后編輯市場(chǎng)的擴(kuò)大。

  作為提升機(jī)器翻譯質(zhì)量的新模式,譯后編輯還缺少規(guī)范一致的實(shí)踐原則、質(zhì)量評(píng)估標(biāo)準(zhǔn)等,因此若要該模式得到有效并廣泛的應(yīng)用,還需要清晰明確的各類指導(dǎo)準(zhǔn)則。2016年,翻譯自動(dòng)化用戶協(xié)會(huì)(TranslationAutomationUserSociety,TAUS)發(fā)布了MTPost-editingGuidelines,這是目前可參考的較為完整的機(jī)器翻譯譯后編輯指南。本文根據(jù)該指南對(duì)醫(yī)學(xué)報(bào)告機(jī)器譯文進(jìn)行了快速譯后編輯實(shí)踐,并對(duì)其指導(dǎo)意義及存在的問(wèn)題進(jìn)行了分析。

  一、機(jī)器翻譯與譯后編輯

  (一)機(jī)器翻譯的發(fā)展及缺陷

  機(jī)器翻譯的廣泛應(yīng)用產(chǎn)生了巨大的社會(huì)效益和經(jīng)濟(jì)效益。回顧其發(fā)展歷程,主要經(jīng)歷了四個(gè)階段:一是基于規(guī)則(RBMT);二是基于例子(EBMT);三是統(tǒng)計(jì)機(jī)器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯利用已有的大規(guī)模的真實(shí)語(yǔ)料庫(kù)來(lái)進(jìn)行深度學(xué)習(xí),從語(yǔ)料庫(kù)中自動(dòng)獲取語(yǔ)言特征和規(guī)則,它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)翻譯的機(jī)器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的發(fā)展使機(jī)器譯文質(zhì)量得到了質(zhì)的提升。

  但即便神經(jīng)機(jī)器翻譯系統(tǒng)使機(jī)器譯文質(zhì)量飛速發(fā)展,機(jī)器譯文仍有很多局限性,自然語(yǔ)言處理仍有許多在實(shí)踐中難以解決的問(wèn)題,比如從句錯(cuò)譯、詞匯錯(cuò)譯、譯文調(diào)序失敗、符號(hào)錯(cuò)譯、漏譯等問(wèn)題[2]。醫(yī)學(xué)報(bào)告作為醫(yī)學(xué)文本的一種,其特點(diǎn)就是縮略語(yǔ)、醫(yī)學(xué)術(shù)語(yǔ)使用較多,同時(shí)為表客觀及行文簡(jiǎn)潔準(zhǔn)確,被動(dòng)語(yǔ)態(tài)以及分詞結(jié)構(gòu)應(yīng)用較多[3]。機(jī)器在翻譯醫(yī)學(xué)文本時(shí),往往會(huì)出現(xiàn)術(shù)語(yǔ)錯(cuò)譯、漏譯和詞匯替代錯(cuò)譯問(wèn)題,同時(shí)也會(huì)出現(xiàn)對(duì)被動(dòng)句以及分詞結(jié)構(gòu)的處理不當(dāng)導(dǎo)致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見本文第三章的實(shí)踐分析。要克服機(jī)器譯文存在的這些缺陷,使譯文質(zhì)量達(dá)到要求,目前最有效快捷的方法就是對(duì)其進(jìn)行人工修改、完善,即進(jìn)行機(jī)器翻譯譯后編輯。

  (二)譯后編輯概述

  譯后編輯(post-editing)是在語(yǔ)言或格式方面,對(duì)機(jī)器翻譯的原始產(chǎn)出,即初始譯文,進(jìn)行加工與修改來(lái)提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性[4]。2010年TAUS實(shí)踐中的譯后編輯報(bào)告將譯后編輯定義為“用最少的人工改進(jìn)機(jī)器生成的翻譯的過(guò)程”[5]。而針對(duì)不同要求和目的,關(guān)于機(jī)器翻譯譯后編輯的ISO18587標(biāo)準(zhǔn)將譯后編輯分為兩個(gè)級(jí)別:快速譯后編輯(LightPost-editing,LPE)、完全譯后編輯(FullPost-editing,FPE)[6]。

  機(jī)器翻譯譯后編輯模式充分發(fā)揮機(jī)器翻譯的速度(效率),也充分發(fā)揮人工翻譯的精度(質(zhì)量),從而既滿足翻譯市場(chǎng)快速發(fā)展的需求,也推動(dòng)了翻譯技術(shù)的發(fā)展,還促進(jìn)了學(xué)界和業(yè)界的交流與合作,豐富了語(yǔ)言服務(wù)產(chǎn)業(yè)鏈的組成[7]。不過(guò)譯后編輯作為新的翻譯工作模式,在實(shí)踐過(guò)程中除了要識(shí)別并糾正上述機(jī)器譯文各類錯(cuò)誤之外,還需考慮效率、質(zhì)量要求、成本等各方面因素。

  因此其在發(fā)展過(guò)程中還需要獨(dú)立、一致的標(biāo)準(zhǔn)來(lái)衡量和約束譯后編輯的質(zhì)量,確定譯后編輯工作量等,幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù),同時(shí)培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機(jī)器翻譯譯后編輯相關(guān)的大部分實(shí)踐準(zhǔn)則相對(duì)宏觀,如崔啟亮提出的實(shí)踐準(zhǔn)則相對(duì)宏觀,進(jìn)行實(shí)踐時(shí)還需自行確立具體規(guī)則[7]。而MidoriTatsuni提出的對(duì)MTPE譯文相關(guān)的部分要求與TAUS類似,但比較寬泛,并未針對(duì)不同的質(zhì)量要求進(jìn)行細(xì)致劃分,實(shí)際應(yīng)用時(shí)還需綜合考慮各種因素進(jìn)行細(xì)化[8]。目前相對(duì)具體的實(shí)踐準(zhǔn)則是TAUS發(fā)布的MTPOSTEDITINGGUIDELINES,根據(jù)不同的質(zhì)量要求列出了對(duì)應(yīng)的原則,所以本文采用該原則指導(dǎo)了所選文本的譯后編輯實(shí)踐,以檢驗(yàn)其是否可有效提高譯后編輯效率。

  二、TAUS機(jī)器翻譯譯后編輯指南

  TAUS成立于2004年,是全球語(yǔ)言和翻譯行業(yè)的資源中心。該協(xié)會(huì)通過(guò)自己的數(shù)據(jù)云和質(zhì)量評(píng)估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標(biāo)、基準(zhǔn)和數(shù)據(jù)等。2016年,該協(xié)會(huì)發(fā)行了MTPE指南,旨在促進(jìn)譯后編輯模式的發(fā)展,提升譯后編輯的質(zhì)量和效率,并幫助該行業(yè)選擇、培訓(xùn)高素質(zhì)、高水準(zhǔn)的譯后編輯者。該指南指出,最基本的譯后編輯質(zhì)量評(píng)估準(zhǔn)則有兩條,一是機(jī)器生成的譯文質(zhì)量,二是對(duì)待翻譯材料的最終質(zhì)量預(yù)期,即譯后編輯工作如何進(jìn)行,取決于機(jī)器生成的原始譯文質(zhì)量及客戶對(duì)譯文質(zhì)量的需求[9]。該指南把預(yù)期的最終譯后編輯質(zhì)量大致分為兩個(gè)等級(jí),一級(jí)為“goodenoughquality”,另一級(jí)為“humantranslationquality”。

  在選擇適用質(zhì)量要求時(shí),主要取決于目標(biāo)讀者或客戶對(duì)最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機(jī)器譯文的質(zhì)量。而對(duì)于初始機(jī)器譯文質(zhì)量的評(píng)判,若花費(fèi)太多時(shí)間來(lái)確定其是否可用會(huì)得不償失,降低效率。因此可在決策時(shí)間上加一些限制,若在一定時(shí)間內(nèi)查看一個(gè)機(jī)器翻譯片段(在熟悉源文本和目標(biāo)文本之后),發(fā)現(xiàn)無(wú)法輕松理解,那就舍棄機(jī)器譯文。

  Mesa-Lao在其實(shí)驗(yàn)分析中表明大部分測(cè)試者在初讀機(jī)器譯文上的停留時(shí)間為5~10秒左右,本文的譯后編輯實(shí)踐即以5~10秒原則來(lái)判斷是應(yīng)該糾正機(jī)器譯文,還是應(yīng)該刪除并重新翻譯低質(zhì)量的片段[10]。同時(shí)針對(duì)最終譯文質(zhì)量的不同質(zhì)量預(yù)期(是“goodenoughquality”還是“humantranslationquality”)以及機(jī)器生成譯文的不同質(zhì)量,也會(huì)采取不同的譯后編輯策略,即進(jìn)行LPE還是FPE。

  三、基于TAUS指南進(jìn)行的醫(yī)學(xué)文本

  譯后編輯實(shí)踐分析醫(yī)學(xué)報(bào)告屬于醫(yī)學(xué)類文本,作為科技文本的一種,對(duì)MTPE模式的適應(yīng)性較強(qiáng),同時(shí)有海量翻譯需求,對(duì)翻譯效率要求較高。本文選取了TheNewEnglandJournalofMedicine上的醫(yī)學(xué)報(bào)告來(lái)進(jìn)行譯后編輯實(shí)踐,關(guān)于多例分析的報(bào)告,發(fā)布于2020年1月24日,全文約3000詞。本文的目的是與醫(yī)學(xué)工作者和研究者共享信息以及時(shí)有效共同應(yīng)對(duì)并預(yù)防疫情,因?yàn)樵摿餍胁魅拘詮?qiáng),傳播速度快,加之如今交通非常發(fā)達(dá),人員流動(dòng)頻繁,所以此類文本信息翻譯非常注重準(zhǔn)確性和時(shí)效性。

  同時(shí),此類文本譯文目標(biāo)受眾為醫(yī)學(xué)專家或工作者,他們僅需了解原文概述或要點(diǎn),以幫助自己了解疾病相關(guān)信息,共同做好應(yīng)對(duì)準(zhǔn)備并尋找解決辦法,所以可選擇省時(shí)高效的LPE模式進(jìn)行MTPE,使最終譯文達(dá)到“goodenoughquality”的要求(下文提到的具體準(zhǔn)則均針對(duì)“goodenoughquality”)。

  本文所選擇的機(jī)器翻譯引擎為谷歌翻譯,在實(shí)踐過(guò)程中發(fā)現(xiàn)詞匯錯(cuò)譯、分詞短語(yǔ)錯(cuò)譯、從句錯(cuò)譯以及段落錯(cuò)譯、漏譯問(wèn)題較多,而此前一直被視為難點(diǎn)的被動(dòng)語(yǔ)態(tài)問(wèn)題已不明顯;谏窠(jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)大的學(xué)習(xí)能力以及大數(shù)據(jù)的支撐,目前谷歌對(duì)被動(dòng)句的處理表現(xiàn)較為良好,比如,筆者較早時(shí)期實(shí)踐時(shí)發(fā)現(xiàn)的相關(guān)問(wèn)題,在幾個(gè)月之后再次用谷歌生成譯文時(shí),發(fā)現(xiàn)其已經(jīng)對(duì)譯文進(jìn)行了改良,符合“goodenoughquality”的要求,可不再作為難點(diǎn)進(jìn)行分析。其他相關(guān)案例具體分析如下。

  (一)詞匯錯(cuò)譯

  例1InlateDecember2019,severallocalhealthfacilitiesreportedclustersofpatientswithpneumoniaofunknowncausethatwereepidemiologicallylinkedtoaseafoodandwetanimalwholesalemarketinWuhan,HubeiProvince,China.…Wereporttheresultsofthisinvestigation,identifyingthesourceofthepneumoniaclusters,anddescribeanovelcoronavirusdetectedinpatientswithpneumoniawhosespecimensweretestedbytheChinaCDCatanearlystageoftheoutbreak.

  綜上,在本次實(shí)踐過(guò)程中發(fā)現(xiàn),相當(dāng)一部分機(jī)器原始譯文已符合TAUS指南中“goodenoughquality”的要求,不用做太多修改。且機(jī)器翻譯質(zhì)量在持續(xù)提高,在醫(yī)學(xué)專有名詞、術(shù)語(yǔ)以及被動(dòng)語(yǔ)態(tài)方面均表現(xiàn)良好,但對(duì)一詞多義的詞匯識(shí)別還不夠準(zhǔn)確,問(wèn)題較多,同時(shí)對(duì)長(zhǎng)句、結(jié)構(gòu)復(fù)雜的句子處理較為糟糕,如定語(yǔ)從句、分詞結(jié)構(gòu)等,轉(zhuǎn)換時(shí)無(wú)法對(duì)句子語(yǔ)序進(jìn)行調(diào)整,導(dǎo)致譯文意思出現(xiàn)偏差,甚至在翻譯段落時(shí)出現(xiàn)漏譯現(xiàn)象。通過(guò)使用TAUS指南指導(dǎo)LPE的實(shí)踐發(fā)現(xiàn),指導(dǎo)性較強(qiáng)的是要求(1)(2)(4),可根據(jù)此三條要求快速做出判斷是否應(yīng)對(duì)機(jī)器譯文進(jìn)行LPE。因本次實(shí)踐中未遇到文化上不妥和侵犯信息,以及因本文為英譯漢,漢語(yǔ)無(wú)拼寫問(wèn)題,所以要求(3)和(5)關(guān)于文化和拼寫問(wèn)題不用討論。

  要求(4)在應(yīng)用時(shí)應(yīng)注意盡可能多地保留機(jī)器初始譯文是建立在機(jī)器譯文質(zhì)量較高的基礎(chǔ)上,譯者應(yīng)迅速做出判斷是否舍棄機(jī)器譯文進(jìn)行人工翻譯,否則時(shí)間成本反而更高。要求(6)無(wú)需進(jìn)行僅跟文風(fēng)相關(guān)的改正和(7)不需僅為改善譯文流暢度進(jìn)行句子重組,就允許我們保留一些不符合中文語(yǔ)言習(xí)慣但句子含義表達(dá)正確的機(jī)器譯文而無(wú)需進(jìn)行修改,如例1僅修改了詞匯錯(cuò)譯的部分,其余均保留機(jī)器譯文,節(jié)約了很多時(shí)間。通過(guò)使用TAUS指南,在進(jìn)行譯后編輯時(shí)會(huì)更有目的性,標(biāo)準(zhǔn)更加明確,可盡量避免做一些不必要的修改導(dǎo)致時(shí)間成本和人工成本的浪費(fèi)。當(dāng)然,TAUS指南仍有許多不足之處,依舊不夠具體,有待在實(shí)踐應(yīng)用中繼續(xù)完善。

  四、總結(jié)

  語(yǔ)言服務(wù)行業(yè)采用機(jī)器翻譯譯后編輯模式來(lái)提高翻譯效率和翻譯質(zhì)量,也需要統(tǒng)一規(guī)范的標(biāo)準(zhǔn)來(lái)幫助評(píng)估工作質(zhì)量并定價(jià),同時(shí)好的規(guī)范還可以促進(jìn)MTPE模式效率和質(zhì)量的進(jìn)一步提升,如本文按照TAUS指南對(duì)“goodenoughquality”的要求進(jìn)行快速譯后編輯時(shí),目標(biāo)更加明確和清晰,避免譯后編輯過(guò)程中因標(biāo)準(zhǔn)不確定進(jìn)行不必要的編輯,導(dǎo)致比純?nèi)斯しg耗時(shí)更長(zhǎng)的情況發(fā)生。

  且此類醫(yī)學(xué)報(bào)告信息交流的時(shí)效性尤為關(guān)鍵,因?yàn)榱餍胁〉膫鞑タ、傳染性?qiáng),信息能夠更快實(shí)現(xiàn)共享,就可能更早更有效地防控疾病更大范圍傳播,就可能幫助各國(guó)醫(yī)務(wù)工作者共同合作更早研究出應(yīng)對(duì)方法。因此,采取較高的機(jī)器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則)可幫助譯后編輯者們?cè)诟虝r(shí)間內(nèi)獲得符合預(yù)期的譯文。當(dāng)然,本文所遵循的TAUS指南也依舊存在需要改善或進(jìn)一步細(xì)化的地方,相信隨著機(jī)器翻譯譯后編輯的發(fā)展,更加完善的規(guī)范會(huì)生成,機(jī)器翻譯譯后編輯模式也會(huì)更加成熟高效。

  參考文獻(xiàn):

  馮志偉.機(jī)器翻譯與人工智能的平行發(fā)展[J].外國(guó)語(yǔ),2018,41(6):35−48.

  [1]羅季美,李梅.機(jī)器翻譯譯文錯(cuò)誤分析[J].中國(guó)翻譯,2012,33(5):84−89.

  [2][3]劉玉強(qiáng),賀子瓊.醫(yī)學(xué)英語(yǔ)的文體特征及其翻譯策略[J].英語(yǔ)廣場(chǎng),2015(10):35−36.馮全功,崔啟亮.譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢(shì)[J].上海翻譯,2016(6):67−74,89.

  [4]TAUS.Post-editinginPractice[EB/OL].(2010-03-10)[2020-08-20].

  [5]ISO.ISO18587:2017Translationservices—Posteditingofmachinetranslationoutput—Requirements[S].ISO,2017.

  [6]崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國(guó)翻譯,2014,35(6):68−73.

  作者:仲晨陽(yáng),倪 蓉

轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///wslw/29151.html