论机器翻译系统的评价体系

论机器翻译系统的评价体系
论机器翻译系统的评价体系

与人工翻译译文质量评价不同的是,对机器翻译的评价除了评价译文质量外,还要评价机器翻译系统的其它性能。近年来,机器翻译的评测越来越受到广泛的重视。在过去几年中,国际上进行了若干次有影响的评测活动,如,信息理解评测(MessageUn-derstandingConference,简称MUC)评测专有名词识别问题,文本检索评估(Text-REtrievalConference,简称TREC)评测信息检索的发展,还有许多机器翻译和语音技术的评测活动,所有这些评测活动都对机器翻译的发展影响很大。

机器翻译适用的范围相对较小,通常是“相对限定的专业领域”,“不是用于文学性很强或文化味很浓的文本,而是用于科普文献、

金融商业交易、行政管理备忘录、法律文件、说明书、农业及医学资料、工业专利、宣传册、报纸报道等”(Hutchins&Somers,

1992:3)。Nagao把机器翻译的适用范围限定在科技文献、文章题目、一般句子,而排除了诗歌、文学作品、法律文件、标书合同等(Nagao,1989)等。因此,人们对机器翻译进行评测时,限制所评测的文本的类型。尽管如此,在具体的机器质量评测上,也存在着不同的标准,它不仅仅只局限在纯粹的译文质量上,而且也涉及机器翻译系统的可操作性、机器翻译的可行性、机器翻译的类型评价、机器翻译的投入与产出比、机器翻译中的不同角色等等,鉴于这些复杂性,人们常常需要综合多个标准,以便全面、客观、公正地评价机器翻译系统。在这个意义上,正好与辜正坤的翻译多元系统互补论中通类基础标准系统(抽

象标准)中的(2)(信的标准:忠实标准、

准确标准、动态等值标准),和非类特殊基础标准系统(具体标准)中的(8)(科学技术著作翻译标准)标准不谋而合。阿诺德(D?Arnold)等人曾建议机器翻译评价应考虑下述因素(Arnoldetal.,1993):

(1)机器翻译商品系统与机器翻译研究应该区

分开来;

(2)从用户的角度评价机器翻译系统;

(3)从需求和结果相适应的角度看待机器翻译质量。

机器翻译评价的指标体系直接决定着机器翻译研发人员的研发路线和机器翻译的发展方向,评价标准对机器翻译的开发与研究都会产生重要影响,上个世纪60年代美国著名的ALPAC报告对MT作出的评价造成的影响很大(Arnoldetal.,1993),所以,怎样客观、

公正地评价一个机器翻译系统,这本身就构成了一个重大研究课题(Bourbeau,1993,

Steiner,1993&Arnoldetal.,1993)。

一、机器翻译类型与评价标准

1995年,布瓦泰(C?Boitet)首先区分了机器翻

译的四种类型:

(1)用于浏览者(forthewatcher),称之为MT-

W,旨在为读者查阅外文资料时提供帮助,这种情况下,他们宁愿接受那种“粗糙”的译文(有时经过一定程度的后编辑),也不愿意一无所获;

(2)用于修订者(forthereviser),称之为MT-R,旨在自动生成“粗糙”的译文,它类似于人工翻译的草稿,因而可以为专业翻译人员免去费时费力的工作,使他们变成修订者;

(3)用于翻译者(forthetranslator),称之为MT-

T,旨在协助翻译人员的工作,提供在线词典、同义词库、翻译实例库等;

(4)用于作者(fortheauthor),称之为MT-A,提

供给希望作品被译成一种或几种文字的作者,该作者愿意在系统控制下写作或者帮助系统消除译本中可能产生的歧义。

论机器翻译系统的评价体系

张政1,王贵明2

(1.北京工商大学

外语系,北京100037;2.北京理工大学

外语学院,北京100081)

要:近年来,机器翻译的应用越来越广泛。本文主要对人们所关注的机器翻译系统的评价问题,就其类型与标

准、系统评价的内容、以及系统评价的主要方法等方面进行较详细的介绍和评议。关键词:机器翻译;评价体系中图分类号:G64

文献标识码:A

文章编号:1009-3370(2008)02-0112-06

收稿日期:2007-12-17

作者简介:张政(1958—),男,教授;王贵明(1960—),男,教授。E-mail:guimingwang@bit.edu.cn

第10卷第2期北京理工大学学报(社会科学版)

Vol.10No.22008年4月

JOURNALOF

BEIJINGINSTITUTEOFTECHNOLOGY(SOCIALSCIENCESEDITION)Apr.2008

同时,布瓦泰提出机器翻译成败的标准可以分为5种标准:概念标准、工程标准、实用标准、商业标准以及交际标准:

(1)概念标准:是否提出令人感兴趣的新概念,并借助模拟或实验原型展示其可行性和优越性,它主要与研究人员有关;

(2)工程标准:是否完成技术革新,或运用更先进的编程技术来建立原形或系统,它主要与系统开发人员有关;

(3)实用标准:是否经济合理地在实用条件下运行实验原形或完备的系统并取得满意的效果,它主要涉及用户;

(4)商品标准:从经济角度来评判,而不是仅仅看安装或销售的数量;

(5)交际标准:决策者或该领域的公司是否树立了良好的形象。

以上标准都是外围的评价标准,或者说是辅助性标准。一个系统输出的译文质量对系统的评价起着关键作用,所以,译文质量的标准制定就显得非常重要。目前世界上普遍采用ALPAC报告对译文质量的评价标准,分为可懂度(Intelligibility)和忠实度(fi-delity)。

ALPAC可懂度等级(ScaleofIntelligibility)(ALPAC,1966:69)分为9级:

9级:完全清楚、易懂,就像读平常的文本,风格贴切;

8级:完全或几乎完全清楚、易懂,但有小的语法错误或小的风格缺陷,和/或者小的用法不当,但容易“更正”;

7级:总体还算清楚、易懂,但在风格、选词和/或者句法安排上不如8级;

6级:中心大意几乎一看就懂,但是由于选词差、风格不当、非习惯的表达方法、未翻译词以及错误的语法影响全面理解,译后编辑才能使译文得到认可;

5级:只有在仔细斟酌之后才能看懂大意,用词不当、古怪的句法、未翻译词、出现上述类似的错误,但尽管有这些“噪音”干扰,可以察觉出中心大意;

4级:句子变了形,实际上,与其说是可懂,还不如说是不可懂。但是,意思可以隐隐约约地领会理解,选词、句法安排和/或者表达古怪,关键词没有译出来;

3级:总的说来不可懂,读起来不全像胡言乱语,但是,仔细推敲和思索、可以假定句子的意思;

2级:读起来不全像胡言乱语,经过大量思索和推敲也无法让人读懂;

1级:根本无法读懂,怎么思索和推敲也无法读懂句子。

遗憾的是,原始的报告中并没有附上忠实度的各项等级。可懂度和忠实度这两个指标能如实反映译文的质量。从概念上来说,这两个指标相互独立,一个译文可以清楚易懂,但缺少忠实,譬如林舒的译文和法国翻译家让-弗朗索瓦?迪西(Jean-FrancoisDucis,1733-1816)(谭载喜,1991:125)的译文,“美丽而不忠实”,但另一方面,也可以是“非常准确、忠实,然而可懂性差”,或者说是“忠实而不美丽”,比如鲁迅的“宁信而不顺”。出现后一种情况,ALPAC认为是原文的可懂度差[APLCA,1966:67]。ALPAC同时给出了信息度(informativeness)的指标,共分为10个等级。信息度的评估,当时由18名以英语为母语、科技俄语阅读能力很强的人来进行评判。具体方法是,让评判的人先读译文,然后读俄语原文句子,再决定读俄语原文句子时是否获得了新的信息。新信息最多时为9,完全没有新信息时为1,新信息增加越少,说明翻译得越准确,译文质量越高。

日本科学技术厅的机器翻译译文评估共分可懂度(共5级)和忠实度(共7级)两个标准,并对可懂度和忠实度的程度作了分级。

可懂度等级(ScaleofIntelligibility):

(1)文章意义明确,没有异议,用词、语法、文体都贴切,无需修改;

(2)文章意义明确,可以理解,但用词、语法、文体上多少有些毛病,不过,这些毛病很容易更正;

(3)文章的意义在总体上可以理解。但由于用词、语法方面的原因,有些细节的理解有疑问,读者不能完全靠自己更正,而想询问懂原文的人;

(4)译文的质量差,用词、语法的问题较多,经过反复、仔细的思考之后,能够在某种程度上猜出原文的意思,让人来修改还不如人工重新翻译;

(5)译文完全不可理解,必须由人重新翻译。

忠实度等级(scaleoffidelity):

(1)译文忠实地反映了原文的内容;

(2)译文忠实地反映了原文的内容,文章的意义也容易理解,只需进行简单的修改;

(3)基本上能忠实地反映了原文的内容,但须进行调整词序等类似的修改;

(4)原文的内容基本上忠实地译出来了,但是,短语与短语之间的关系,过去时、完成时等时态、单复数的区别、副词的位置等有错误,需要译后编辑在结构上作必要的调整;

(5)原文的内容、结构都没有很好地反映出来,而且有一部分漏译,短语、从句的搭配有错误;

论机器翻译系统的评价体系

(6)原文的结构、内容没有很好地译出来,短语、句子有漏译,但大体上还看得出是一个句子;

(7)译文完全不能反映原文的内容和结构,因为脱落了主语或谓语,不成句子。

欧洲共同体EUROTRA采用了另一套评估标准:

(1)识别方面的标准:(a)可懂读,(b)忠实度,(c)连贯性,(d)有用性,(e)读懂速度,(f)可接受性;

(2)经济方面的标准:(a)输入时间,(b)编辑修正时间,(c)誊清时间;

(3)语言方面的标准:(a)句子结构和语义的连贯性,(b)词汇评价,(c)翻译错误;

(4)系统使用的难易度。

IBM的BLEU(BiLingualEvaluationUnderstudy)评测方法认为如果翻译系统的译文越接近人工翻译,那么它的翻译质量就越高。所以,评测关键在于如何定义系统译文与参考译文之间的相似度。BLEU采用的方式是比较并统计共现的N元词的个数,即统计同时出现在系统译文和参考译文中的N元词的个数,最后把匹配到的N元词的数目除予系统译文的单词数目,得到评测结果。BLEU方法简单易行,但是没有考虑到翻译的召回率(recall,指识别出来的某种类型的未登录词的数目和文本中属于该类型的未登录词的总数之比)。

国内对机器翻译评测的研究主要由北京大学计算语言所主持进行。该所在90年代后研究并开发了机器翻译评测系统。该系统使用分类评估法,并建立了机器翻译测试大纲。国家863计划也在不定期组织专家评测,对不同时期的汉英、英汉翻译系统进行了现场评测,评测结果反映了我国当时机器翻译的发展水平。

由上述各类标准可知,机器翻译系统的评价都是以译文质量作为评价的核心,而译文评价的标准也都最后落在了忠实度、可懂度上。

二、机器翻译系统评价的内容

机器翻译译文质量是机器翻译系统研究面临的核心问题,但还有其他很多重要因素需要考虑,有些因素是系统内在的特性,不能用现行的“黑箱(black-box)”加以测定,目前,大家公认机器翻译系统评价中涉及的主要因素有以下7种(Arnoldetal.,1993)。

(1)机器翻译译文的质量

译文质量是机器翻译评价最重要、最核心、最关键的指标。但译文质量很难量化,其评价对人来说仍然是一项十分棘手的任务。两种语言的等价性是一个模糊的概念。同一原语实际上可以有数量不受限制的不同的目标语译文,更何况原语本身也充满歧义。如Timeflieslikeanarrow就有三种解释:(1)时间像箭一样飞;(2)像箭一样测量苍蝇的速度;(3)时间苍蝇喜欢箭。此外,译文中必然会有各种语病,计算机分析病句的技术还不成熟。要进行这样的分析,必然会涉及系统内的核心内容,这方面的资料难以获得。就译文本身的质量而言,评价的标准也不尽相同。目前ALPAC报告中提出的“可理解性(compre-hensibility)”和日本机器翻译系统中采用的“忠实度(fidelity)”影响最广,详见上一节。

(2)应用效率

机器翻译能否提高工作效率是用户,特别是专业翻译公司所关注的另一个重要指标。但是进行这种评价时应将机器翻译置于语言文字信息处理的全过程,如检索(retrieval)、识别(recognition)、输入、前编辑(pre-editing)、翻译、后编辑(post-editing)、输出、排版(type-setting)、印刷、远程通讯(distancecommunication)等,检验机器代替人进行翻译是否节省了大量的时间。

(3)工作方式

安装和使用机器翻译系统必然造成工作方式的改变,特别是译者工作方式的改变,他不必进行草稿翻译,而大部分时间用于对译文的修改。由于这些机器翻译自动生成的译文必然含有大量不同于人工翻译的错误,就要求译者掌握与以往不同的修改技巧。另一方面,机器翻译系统安装时,译者会接受不同的培训,但培训时间越短越好,系统越“友好”越好。因此,工作方式也是机器翻译评价中要考虑的因素之一。

(4)实用环境

使用环境包括机器翻译系统对硬件的要求,对其它软件的依赖,对输入文本的要求,用户界面的质量以及兼容性等等。人机界面是决定机器翻译系统的一个主要因素,一般情况下,用户愿选择译文质量稍差但便于译文修改的系统,而不愿选择译文质量稍好但不便于修改的界面。

人机界面分面向用户与面向开发维护人员(包括语言学家)两种。面向用户的界面应具有方便的前编辑、后编辑、辞典扩充等功能。面向开发维护人员的界面应能方便地修改词典、规则、语言模型,并能提供词频、句型、错误类型等统计数据。

(5)维护性和扩展性

维护性是指一个机器翻译系统能否方便解决实际应用中出现的问题,或者弥补系统的不足。而扩展性涉及该系统能否容易地扩展它的词汇或语言结构覆盖范围,它包括系统的扩展能否在用户工作现场

北京理工大学学报(社会科学版)2008年第2期

完成、完成扩展所需的语言学知识以及说明文档是否清楚地揭示用户应该怎样做,有无词汇添加的用户接口、性能情况,是否可以引进其他语言资源等。

(6)机器翻译系统性能价格比

机器翻译系统运行的速度、前后编辑时间、容量、外部配置等诸多因素,以求获得最佳的性能价格比。

(7)健壮性(即robustness,音译为鲁棒性)

健壮性,指系统在处理系统认为是非法的(包括处理范围以外的)输入时的性能。鲁棒性高的系统,遇到处理范围以外的内容不容易崩溃,但鲁棒性与质量存在一定反比关系。

除了这七个因素外,阿诺德还讨论了其它几个相对抽象的深层系统特性,这些因素“可能无法让用户直接判断,但却相当重要,在有关的评价论述中容易被忽视。列举如下:

(1)模块性

系统的划分应与所涉及任务的逻辑和经验性的特点相统一,而且各个部分之间的接口应该清晰,例如词法分析要与转换分开,数据与算法混合等。模块好的系统容易维护、便于扩展。

(2)陈述性

数据和算法划分明确,算法处理的数据应以独立的解释而存在,即不依赖算法数据也可以被理解,因而可以预测系统的变更或更新的效果。

(3)单调性

系统升级后的每一个优点都不会使系统“退步”,即独立的升级可以成功地结合在一起,彼此间能够避免冲突,“和谐共处”。

(4)概念支持

一个系统能否实现了一些较清楚的理论原则,尤其是关于语言结构的一些理论。

由于计算机技术性能大幅度的提高和计算机技术的成熟,系统之间的运算速度、实用环境、维护性和可扩展性差别不大,机器的价格性能比大同小异,译文质量的比重显得更加重要,实际上很多机器系统的测评只测评译文质量,这也是近几年来机器翻译系统测评发展的新趋势。

三、机器翻译系统评价的主要方法

目前世界上机译评估异彩纷呈,就评估方法而言,机译评估大致可归纳为以下四类。

1.操作性评价

操作性评价(OperationalEvaluation)也叫实用性评估,有时也称作经济评估(EconomicEvaluation)。这种评估所关心的是机器翻译系统的经济价值,考虑机器翻译的成本,每个字的价格和译后编辑的开销,侧重机译与人译的花费以及时间比。基于这种思想,斯赖坡(G?V?Slype)于1982年提出了机器翻译系统的“效益评价”(Evaluationofeffectiveness)的观点。这一方法也被人们称为实用性评价或经济性分析(EconomicAnalysis)。但该评价方法会受到以下几个方面的限制:(1)待测样本的限制;(2)译者水平训练;(3)质量控制;(4)词典更新。另外,操作性评价对一个用户来说代价过高,耗时较长;又很难使评价环境完全模拟实际情况,一般的用户都忽略这种评价方法。

2.说明性评价

说明性评估(DeclarativeEvaluation)又称质量评价(QualitativeEvaluation),这种评估又叫输出评价(OutputEvaluation)[赵铁军,2000:361],也被称为是一种标准评价方法。这种方法不拘泥个别用户的特殊情况,而是力图给机器翻译系统更一般、更广泛的评价,它往往集中于译文质量上,侧重通过评测译文质量,评价机器翻译系统的性能。这一类评价的经典范例是卡洛尔(J?B?Carroll)在1966年进行的研究,其结果后来成为ALPAC报告的一部分。这种方法经济、实用、直观、快捷,还能测评译文质量的各个基本特性,得出的结果具有普遍性,与文本生成的过程无关。这种方法还可使第三方对各种机器翻译系统的质量进行比较测试,通过对机器翻译译文质量的评价,达到对机器翻译系统的评价。但这种评价只注重译文质量,容易忽视机器翻译系统的内在性质、不容易说明什么因素影响到译文质量,也不能说明某一个特定的语言现象、一个机器翻译系统的表现如何等。因此,使用这种方法时,至少有三个方面需要考虑:

(1)用于测试的语料:选材要慎重、公平,不同的语料对同一个机器翻译系统的评价影响很大;

(2)实验设计中的打分:打分的依据具有主观色彩因素,而且常常环境、时间、工作劳动强度的影响,因此,需要较多的评测人员对更多的样本进行评分以取得统计学上的意义;

(3)结果分析:结果只表明译文的质量情况,得到的数据难以深加工。

3.分类评估

分类评估法(TypologicalEvaluation)的核心是全面探究机器翻译系统的语言现象覆盖范围[赵铁军,2000:363]。实现分类评估大致有两种途径:第一种途径类似于语言教学中的“错误分析法”,即根据错误多少为系统评分,有时也根据错误类型进行加权评分;第二种途径是预先制定覆盖面广的系统测

论机器翻译系统的评价体系

试集,测试集中每一个测试项目代表机译系统可能遇到或者它应该了解的语言现象,然后根据各机器翻译系统对测试集中句子的翻译情况记录下它生成的“好译文”、“差译文”或是“未翻译”的现象,予以评分。

机器翻译系统的评估,一般由人来进行,难免会带有测试者个人的主观因素,造成评估数据不准确,因此,一些机器翻译研究人员使用计算机来进行评估,建立机器翻译的计算机评估系统。乔姆斯基认为语言是有限规则的无限应用,英语原文的句子是无限的,汉语译文的句子也是无限的,为了测试英汉机器翻译系统的质量,可以将测试点约束在有限的范围内,并将测试点划分若干等级,当机器翻译系统通过了某个登记的测试点的集合,则认为该系统达到了相应的水平。北京大学设计的MTE系统还设计了一种测试文本描述语言(TextDescriptionLanguage简称TDL)。利用TDL瞄准测试点,可以描述一个或若干个英语句子所得到的各种水平的答案及其所属科目的得分。TDL解释程序的工作就是将这种预先准备好的各种答案同机器翻译的译文进行比较,从而决定译文分值。

这种方法对研制者非常有用,不仅能评估系统的译文质量,而且能发现机译系统对哪些语言点处理不好,提供系统的弱点所在,而且反复应用同一测试集可以比较出后继的改进是否奏效,测出系统的改进程度,还可以针对机器翻译过程的各个阶段来进行评估,即针对形态分析、结构分析、词汇转换、结构转换、结构生成、形态生成等不同阶段,准备不同的测试数据,从而判断错误是在哪一个阶段造成的,为规则的调整、辞典的补充、算法的改进提出可靠的数据。

因此,这种评估方法简便易行、节省人力、物力,但这种测试系统的开发前期投入大、要求测试点的选择合理、科学、全面。

4.自动评价和人工评价

自动评价和人工评价(AutomaticEvaluationandManualEvaluation)是根据评价方法来划分的。所谓自动评价就是利用计算机的评价译文。汤普森(H?Thompson)系统是目前世界上能够实现评价与评分过程全部自动化的一种,该系统以段落为评价单位,而北京大学计算语言所研制的MTE评估系统则以句子为单位,IBM的BLEU采用的自动评测是以词为单位,这些评估系统对机器翻译系统的质量能做出比较客观的评价。所谓人工评价就是利用人工根据制定的评分标准对机器翻译系统输出的译文进行评分。这种方法,简单适用、前期投入少,不足之处是主观因素大,同一个译文,不同的参评人员的评分也不同。ALPAC报告的评分就是采用这种方法,欧洲一些国家和日本大多采用这种方法。

综上所述,不难看出,机器翻译的质量完善以及对机器翻译系统评估的体系完善都是复杂而漫长的过程。如果说,现在机器翻译的结果还不尽人意,计算机辅助翻译的方式有待革命,那么我们应该从什么方面寻找突破口,使计算机翻译能够更真正智能化?当今的语言交流信息的量度和快捷度,要求一种适应全球交流速通的新技术,建构一种真正能适应快捷而且大容量语言信息交流的多文种数字化交互平台。也许我们可以从一种新的语码转换方式中找到明天的曙光。

参考文献:

[1]ALPAC.Languageandmachines:computersintranslationandlinguistics[R].AreportbytheAutomatickj,.languageProcessingAdvisoryCommittee.DivisionofBehavioralScience,NationalResearchCouncil.Washington,D.C.:NationalAcademyofSciences-NationalResearchCouncil,1966.

[2]Arnold,D.&Louisa,S.Evaluation:AnAssessment[A].Arnold,D.&Lee,H.eds.MachineTranslation:SpecialIssueonEvaluationofMTSystems[C],8(1-2).Dordrecht:KluwerAcademicPublishers.1993,1-24.

[3]Arnold,D.&Dave,M.AutomaticTestSuiteGeneration[A].MachineTranslation:SpecialIssueonEvaluationofMTSystems[C],8(1-2).Dordrecht:KluwerAcademicPublishers.1993,29-38.

[4]Bar-Hillel,Y.Thepresentstatusofautomatictranslationoflanguages[J].AdvancesinComputers,91-163.1960(1).

[5]Hutchins,W.J.MachineTranslation:Past,Present,andFuture[M].Chichester,England:EllisHorwoodLimited,1986.

[6]Hutchins,W.J.&Somers,H.L.AnIntroductiontoMachineTranslation[M].London:AcademicPress,1992.[Hutchins&Somers,1992,p3]

[7]Nagao,M(transbyCook,N.D.)MachineTranslation,HowFarCanItGo?[M].Oxford:OxfordUniversityPress,1989.

[8]辜正坤.中西诗比较鉴赏与翻译理论[M].北京:清华大学出版社,2003.

[9]李晓敏,等.译文评价标准新探索[J].上海科技翻译,2003,(3).

[10]谭载喜.西方翻译简史[M].北京:商务印书馆,2000.

[11]赵铁军.机器翻译原理[M].哈尔滨:哈尔滨工业大学出版社,2002.

北京理工大学学报(社会科学版)2008年第2期

论机器翻译系统的评价体系

OntheEvaluationSystemsofMechineTranslationSystem

ZHANGZheng1,WANGGui-ming2

(1.BeijingIndustrialandCommercialUniversity,Beijing100037;2.BeijingInstituteofTechnology,Beijing100081)

Abstract:Withthewideruseofmachinetranslationinrecentyears,morepeopleareconcernedaboutitsevaluationsystem.Thispaperintroduces,indetail,theevaluationsystemsofmachinetranslationfromthetypesandstandards,themainitemsofthesystem,andthemainmodesofthesystematicevaluation,andmeanwhileitmakessomecommentsontherelevantconceptions.

Keywords:machinetranslation;evaluationsystem

[责任编辑:萧姚]!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(上接第86页)

LossofCulturalImplicationsforRelationalVocativesintheEnglish

VersionofADreamofRedMansions

SIDong-hong,CAIZhong-yuan

(DepartmentofForeignLanguage,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016)

Abstract:AstherearesomanycharactersandmanycomplexrelationalvocativeswhicharebestreflectedbyChinesetraditionalcultureinADreamofRedMansions,itisnecessarytoanalyzethesubstantialdifferencesbetweenChineseandEnglishrelationalvocatives.ThisthesisexaminesthelossofculturalcontentsbycomparingtheEnglishandChineserelationalvocatives,andattemptstofindoutsomefeasibleremediesasfromtheEnglishversionofADreamofRedMansionsbyYangXianyi.

Keywords:lossofculturalcontents;adreamofredmansions;translatingprocess;relationalvocatives

[责任编辑:箫姚]

机器翻译技术的现状及发展

机器翻译技术的现状及发展 篇一:翻译技术领域的现状与展望 翻译技术领域的现状与展望 作者/王华伟闫栗丽 翻译技术在中国的发展起步相对较晚,但近年来随着中国在全球化进程中扮演着越来越重要的角色,催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上,于2007~2008年间在翻译技术领域取得了一系列成就,也还存在一些亟需改进的方面,而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动 翻译技术的发展直接关乎整个翻译行业的翻译质量及效率,具备巨大的行业经济效益。对此,科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中,中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛,着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放 词典是使用范围最广的工具,它以使用便利的优势,几乎占据了每个计算机的桌面,无论语言学习者还是专业翻译人员,几乎都是必备工具。词典的发展从最早的单机版本发展至今,已经有很多种产品

类型,我们可以见到的有:电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展,如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出,将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等,并取得了显著的成功。另外,类似Google这样的搜索引擎,因为信息量大,检索便利而成为很多专业翻译人员查词的重要辅助工具。 值得一提的是,最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源,为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现,加快了信息传播的速度,也提高了用户对新词更新的速度要求,为了方便新词汇的发布,词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统,用户可自由发起词典编纂项目,自发组织人员参与项目,发起人可以按照需要给小组成员分配不同的权限,将词汇添加等基本工作和审核人员明确区分,既确保了词典的专业性,也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活 谷歌语言工具的推出打破了互联网语言的藩篱,用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上,这也是机器翻译软件的一个应用领域,而国内的相关软件如金山快译等,专注于为普通网民提供更为友好的英中日网站浏览体验,并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

搭建属于自己的机器翻译系统

搭建属于自己的机器翻译系统——MTI专业“技术小白”走进小牛翻译开源社区的心得 搭建属于自己的机器翻译系统 ——MTI专业“技术小白”走进小牛翻译开源社区的心得首先,自我介绍一下。我是一个MTI(翻译硕士)专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟,任职于一家网络科技公司的市场部门,之前的工作中需要做些翻译工作,有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题,但是对于一些涉及我们商业机密的数据,由于担心泄密,只能借助于有道词典查查词,然后再自己形成翻译结果。很早之前我就想,要是能有自己的机器翻译系统就好了。 我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建议,“学好翻译技术,有前途。对于仍在迷茫MTI的同学,我建议学机器翻译设计与开发,走出迷茫。”非常非常幸运的是,我一个东大毕业的同学告诉我,东北大学自然语言处理实验室(国内搞机器翻译最好的团队之一)联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”,社区中有一项内容,就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是,我走进社区,按照社区里的相关说明,亲身体验了搭建过程。下面,我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。 小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下,NiuTrans开源系统在国际上比较有名,据说是目前国际上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses)。这些内容对MT(机器翻译)的专业学者应该很有用吧,但是对于我这个非科班出身的人来说,其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获——快速搭建实用的机器翻译系统。 一、搭建过程详细说明 需要说明的是,我是在在网页指导与人工指导下才在自己的电脑(Windows7 64位系统,硬盘500G,内存8G)上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导,还需要人工指导。身为“技术小白”的我,虽然网页上的操作指导写的很规范,但是第一次接触这么“高大上”的东西,还是有点小紧张的。于是,我加入了小牛翻

机器翻译评测大纲

机器翻译评测大纲 一、评测对象 本次评测的对象包括:汉-英、英-汉、汉-日、日-汉机器翻译系统中的核心技术。 二、评测内容 本次评测组织两种语料的评测,一种是篇章语料,一种是对话语料。领域是面向奥运的相关领域,包括体育赛事、天气预报、交通住宿、旅游餐饮等。 本次评测的评测指标包括译文质量和翻译速度。 三、评测方法 1. 评测方式 本次评测为现场评测。采用的是以人工评测为主,人工评测和自动评测相结合的方式。 人工评测方式是:由评测组织单位将各个评测单位提交的评测结果汇总在一起,然后用计算机随机打乱译文句子的排列顺序。再将所有译文句子提交给多位专家进行人工评测。将专家评测的结果汇总,用计算机还原成原来的排列顺序,分别计算出各个评测单位的总得分。 2.评测步骤 ?在评测单位统一提供的评测环境上安装被测系统 ?评测单位给出评测数据 ?被测单位运行系统,提交评测结果 ?评测单位运行自动评测程序,得出自动评测结果 ?评测单位事后进行人工评测 ?公布评测结果 3.评测标准 (1)自动评测标准

机器翻译的自动评测目前比较成熟的标准有BLEU标准、NIST标准等。本次评测采用NIST标准。具体评测标准见附件。 (2)人工评测标准 本次评测按0 - 6个等级层次打分,最后采用百分制换算评测结果。 总的可理解率=(T1*20%+T2*40%+T3*60%+T4*80%+T5*90%+T6*100%)/ 总句数 其中:Ti为被评为第i等级的句数。

(3)翻译速度评测标准 由主持评测的工作人员现场记录翻译时间,各系统自动显示从第一个句子翻译开始到所有句子翻译完毕所用的时间(不计系统初始化所用时间,只记开始翻译到所有句子翻译完毕所用时间)。 4. 输入输出文件格式 下面以汉英机器翻译为例,说明输入输出文件格式。其中p标签为段落标记,s标签为句子标记。输入文件中每个s标签内部为一个句子。输出文件中每个s 标签与输入文件中的s标签一一对应。由于一个源语言句子可能翻译成一个或多个目标语言句子,所以输出文件中每个s标签内部可以有不只一个句子。Lang 为语言代码,汉语用“zh”表示,英语用“en”表示,日语用“ja”表示。汉语、英语、日语的输入和输出文件统一采用GBK编码。 (1)输入文件格式: 玻利维亚举行总统与国会选举 (法新社玻利维亚拉巴斯电)玻利维亚今天举行总统与国会选举,投票率 比预期更高,选民希望选出的新领导阶层能够振兴经济,改善人民的生活水准,抑制这个南美洲最贫穷国家的劳工骚动。 投票所于下午四时(台北时间七月一日清晨四时)关闭,选务人员说,选 举结果将于两小时之后开始发布。 稍早,玻利维亚总统与参与选举的候选人援引巴西赢得世足赛冠军为 例,鼓励民众踊跃投票,虽然联邦法律规定,凡达投票年龄的玻利维亚人都必须 投票。

巴比情结与机器翻译系统的研发

巴比情结与机器翻译系统的研发 [摘要]重建巴比塔的情结促使科学家和语言学家联合起来试图利用计算机来进行自然语言的翻译和转换工作。介绍了机器翻译的起源,论述了基于规则和基于语料库的机器翻译系统的特点和实例,探讨了目前机器翻译系统的缺陷及其将来研发方向。 [关键词]巴比情结机器翻译机器翻译系统的研发基于规则基于语料库 一、前言 《圣经》旧约中“创世纪”里巴比塔的故事发生在远古时代,但从那时到现在多少代人以来,人们还在不断地怀有一种情结,构筑同一个梦想:重建巴比塔,让世界各地操不同语言的人通过一种有效的方式可以任意沟通起来。不过构筑语言的“巴比塔”绝非易事,因为虽然大多数语言有共性,但是其差异却很巨大。这种浓厚的巴比情结积聚已久,人们长期无法释怀。20世纪中期计算机的诞生又让人们萌生了新的希望,促使科学家和语言学家联合起来试图利用计算机来进行自然语言的翻译和转换工作,这就是机器翻译。 机器翻译是用计算机把一种语言(源语)翻译成另外一种语言(目标语)的一门新学科,涉及到语言学、计算机科学、数学等许多领域,是典型的多边缘交叉学科。多年以来,人们在不断孜孜追求,对不同种类的机器翻译系统进行了研发,希冀找到一个适当方法解决语言之间的快速和准确翻译问题。虽然时光发展到二十一世纪,计算机早已渗透到人们生活的方方面面,计算机技术的发展和运用已经达到了一个令人瞠目的程度,但是机器翻译却依然没有达到理想的水平。机器翻译研究涉及到很多方面,由于文章篇幅限制,本文将集中讨论机器翻译系统的研发。 二、机器翻译的起源 用机器来进行翻译的理念最早可以追溯到古希腊时代,他们提出各种方案来替代种类繁多而形式各异的自然语言,其中就有用机械手段来分析语言的问题。20世纪30 年代,法国人阿尔楚尼明确提出用机器来进行语言翻译的设想。1933年,前苏联发明家特洛扬斯基设计了机械方法把一种语言翻译成另一种语言的机器,但由于当时技术水平的限制,他的翻译机没有制成。 1946年世界上第一台电子计算机诞生,它惊人的运算速度启发了人们考虑翻译技术的革新问题。有关机器翻译的设想从那时起开始活跃起来,当时许多科学家相信可以通过对计算机编程实现“人工智能”。冷战开始后,当时美国情报部门需要大量的有关前苏联的情报,由于情报是俄文资料,需要进行大量的俄英翻译,而由于人工翻译速度慢,需要进行机器的快速翻译。在此时代背景下,Andrew Booth有幸得到了洛克菲勒基金的资助进行语言翻译的研究。Booth和Weaver

一个汉英机器翻译系统的设计与实现

一个汉英机器翻译系统的 计算模型与语言模型* 刘群+詹卫东++常宝宝++刘颖+ (+中国科学院计算技术研究所二室北京100080) (++北京大学计算语言学研究所北京100871) 摘要:本文介绍我们所设计并实现的一个汉英机器翻译系统。在概要介绍本系统的主要目标和设计原则的基础上,着重说明系统的计算模型和语言模型,最后给出实验结果和进一步的打算。 关键词:自然语言处理机器翻译中文信息处理 一、引言 我国的机器翻译研究近年来取得了很大的发展。特别是英汉机器翻译系统的研制已经取得了较大的成功,达到了初步实用的阶段。相对而言,汉英机器翻译的研究却进展比较缓慢,离实用化还有相当的距离[1]。我们的目的是利用目前最新的计算机软件技术、相对成熟的机器翻译方法和先进的汉语语法理论,构造一个初步实用的汉英机器翻译系统。本文将对我们所开发的系统所采用的计算模型和语言模型作一个总体性的介绍,而不涉及过多的细节。 下面我们简要介绍一下本系统的几个主要设计原则: ⑴采用成熟的技术 我们的目的是构造一个真正实用的汉英机器翻译系统,因而在可供选择的若干技术路线面前,我们将尽量选用比较成熟的技术,而在现有技术难以解决问题时再尝试一些新技术。 ⑵开放的体系结构 开放的体系结构主要体现在系统的实现上所采用的软件构件技术[8]。整个系统采用一些相对独立的软件构件组成,因而可以方便地对系统进行修改、维护和扩充。翻译的过程严格按照独立分析、独立生成的原则进行组织,每一阶段的算法相互独立,对其中一个阶段算法的修改不会对其他算法造成影响。 ⑶方便的调试环境 本系统强调为语言工作者提供一个方便的调试环境。系统提供多窗口图形界面的知识库调试工具,支持课题组中多人同时通过网络对一个知识库进行操作。提供对翻译过程直观显示,用户可以清晰地看到翻译过程的每一步操作。提供翻译出错原因查找机制,用户 *本项目的研究受到863-306资助,合同号为863-306-03-06-2

机器翻译技术介绍

机器翻译技术介绍
常宝宝 北京大学计算语言学研究所 chbb@https://www.360docs.net/doc/a616510475.html,

什么是机器翻译
研究目标:研制出能把一种自然语言(源语言)的文 本翻译为另外一种自然语言(目标语言)的文本的计 算机软件系统。 制造一种机器,让使用不同语言的人无障碍地自由交 流,一直是人类的一个梦想。 随着国际互联网络的日益普及,网上出现了以各种语 言为载体的大量信息,语言障碍问题在新的时代又一 次凸显出来,人们比以往任何时候都更迫切需要语言 的自动翻译系统。 但机器翻译是一个极为困难的研究课题,无论目前对 它的需求多么迫切,全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。

机器翻译的基本方法
机器翻译的基本方法 ? 基于规则的机器翻译方法 ? 直接翻译法 ? 转换法 ? 中间语言法 ? 基于语料库的机器翻译方法 ? 基于统计的方法 ? 基于实例的方法 ? 混合式机器翻译方法
目前没有任何 一种方法能实现机 器翻译的完美理 想,但在方法论方 面的探索已经使得 人们对机器翻译问 题的认识更加深 刻,而且也确实带 动了不少不那么完 美但尚可使用的产 品问世。
20世纪90年代以前,机器翻译方法的主流一直是基于规则的方 法,不过,统计方法后来居上,目前似乎已成主流方法,从学术 研究的角度看,更是如此。(Google translate)

机器翻译的基本方法
20世纪90年代以前,机器翻译方法的主流一直是基于 规则的方法,因此基于规则的方法也称为传统的机器 翻译方法。 直接翻译法 ? 逐词进行翻译,又称逐词翻译法(word for word translation) ? 无需对源语言文本进行分析 ? 对翻译过程的认识过渡简化,忽视了不同语言之间 在词序、词汇、结构等方面的差异。 ? 翻译效果差,属于早期过时认识,现已无人采用 How are you ? 怎么 是 你 ? How old are you ? 怎么 老 是 你 ?

机器翻译

机器翻译 1 概述 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。 2 国内外现状 机器翻译思想的萌芽关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann JoachimBecher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯(JohnWilkins)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项,在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。机械脑于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法安装使用。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是ein mechanisches Uebersetzen)这个术语。 真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

机器翻译技术的探讨

机器翻译技术的探讨 六院五队-徐允鹏-12060143 摘要随着国际交流的日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用得到了蓬勃发展。本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法,并讲述了机器翻译的评估方法,最后介绍了机器翻译技术的最新进展。 关键词:机器翻译;基于规则;语料库;评估方法 1.机器翻译概述 随着国际化交流的普遍性,信息通信的日益膨胀,高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通过专业翻译人员完成,利用语言学知识进行自然语言之间的互译,帮助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术的不断进步,利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language

Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系[1]。 机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论意义。国际间的合作与交流,语言的差异是一个非常重要的障碍,各行各业的人们面对大量他们不熟悉的语言的文档资料,如果单纯的依靠人工翻译,这些日益的待翻译材料将是一种非常沉重的负担,而机器翻译可大幅度减轻这种负担。同时,机器翻译对于了解人类语言和思维的基本机制,探讨人工智能技术有着重要的意义。 2.机器翻译方法 人们一直在寻求更好的解决机器翻译问题的方法,目前机器翻译方法主要有基于规则的机器翻译,基于语料库的机器翻译和混合式机器翻译方法。 2.1基于规则的机器翻译方法 2.1.1基于分析和转换的机器翻译方法 人作翻译时,把一个源语言句子译成目标语言句子,设计到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段,这被称为基于分析和转换的机器翻译系统,也被认为是模拟人类翻译活动最恰当的机

机器翻译的自动评测技术 机器翻译技术

机器翻译的自动评测技术机器翻译技术 本文介绍了机器翻译评测的基本原理以及常用评测标准,包括人工评测方法、基于n元匹配的BLEU和NIST自动评测方法。机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法 进行评价,我们称其为机器翻译评测。由于机器翻译所处理的对象――语言本身存在某种程度的歧义,无法像数学公式或者物理模型那样简单客观地描述出来,这使得为机器翻译结果进行客观的打分变得非常困难。最早的方法是人工评测,这种方法得到的结果一般是十分准确的,但评测的成本太高,周期过长(评测过程可能长达几周甚至数月),评价结果也会随着评价人的变化和时间的推移而不同,这使得评价结果不可重复,缺乏客观性,因此,机器翻译的自动评测应运而生。实践证明,机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大,对研究发展和技术进步起着非常重要的引导作用。 基于n元匹配的自动评测方法 如果一个机器翻译评测系统只根据源语言文本就能自动地为若干译文打分并选择出其中最好的结果,那么这个评测系统本身就是一

个质量更好的机器翻译系统了。因此,自动评测最初的出发点就是给出一些标准的翻译结果,然后比较机器生成的译文与这些翻译之间的相似程度。我们称这些标准的翻译为参考译文(或者参考答案)。同一个句子可以有多个不同的参考译文,这些参考译文都表达同一个含义,但可能使用了不同的词汇,或者虽然使用了相同的词汇但在句中的词序不同。这样一来,机器翻译自动评测的问题转换为比较机器翻译系统输出的一个翻译结果和多个通过人工产生的正确的参考译文之间 的相似度的问题,使用不同的相似度计算方法即可得到不同的自动评测方法。 例如,考虑如下两个机器翻译系统生成的翻译结果: 源语言文本: 今年前两月广东高新技术产品出口37.6亿美元 系统译文1: The new high-tech products in Guangdong exported 3.76 billion dollars in the first two months this year

机器翻译测试大纲

2004年度机器翻译评测大纲 一、评测对象 本次评测的对象包括:汉-英、英-汉、汉-日、日-汉、汉-法、法-汉机器翻译系统中的核心技术。 二、评测内容 本次评测组织两种语料的评测,一种是篇章语料,一种是对话语料。领域是通用领域和奥运的相关领域,包括体育赛事、天气预报、交通住宿、旅游餐饮等。 本次评测的评测指标包括译文质量和翻译速度。 三、评测方法 1. 评测方式 本次评测为现场评测。 结果评估采用的是以人工评估为主、自动评估为辅方式。 人工评估采用可理解率指标。评估方式是:由评测组织单位将提交的评测结果汇总在一起,然后用计算机随机打乱译文句子的排列顺序。再将所有译文句子提交给多位专家进行可理解率的人工评估。将专家评测的结果汇总,用计算机还原成原来的排列顺序,计算出总的可理解率。 自动评测采用基于n元语法的BLEU和NIST方法。 2.评测步骤 (1) 在评测单位统一提供的评测环境上安装被测系统。系统应安装在指定的目录中。 (2) 评测单位给出评测数据。评测数据存放在指定目录中。给出评测数据以后被测单位不得再更改系统参数。 (3) 被测单位运行系统,提交评测结果。被测单位应指导评测人员学会操作方法,所有操作由评测人员进行,系统运行时各单位人员应离场。系统的运行应该是批处理方式的,系统读入一个脚本文件(格式后面说明),脚本

中存放输入文件名和对应的输出文件名。 (4) 评测单位事后进行人工评估。 (5) 公布评测结果。 3.评测标准 (1)人工评测标准 本次评测按0.0 –5.0分打分,可含一位小数,最后采用百分制换算评测结果。 总的可理解率= 所有句子得分之和/总句数/5×100% (2)翻译速度评测标准 由主持评测的工作人员现场记录翻译时间,各系统自动显示从第一个句子翻译开始到所有句子翻译完毕所用的时间(不计系统初始化所用时间,只记开始翻译到所有句子翻译完毕所用时间)。

人工智能与机器翻译期末复习题

一、名词解释(5X3‘)15’ 1.兼类(P121):一个单词既可以作名词动词又可以作其他词类 2.机器翻译:用计算机软件代替人做的书面翻译 3.组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。 4.交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。 5.人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。 6.人工智能软件的三大技术:知识表示、知识推理、知识获取。 7.语料库:单词、短语和句子组成的数据库。 8.知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就 是通过智能软件而建立的专家系统) 9.深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。 10.语用分析:分析成语和习惯用语的方法。 二、题解P36 例2.1 、2.2 例2.1 设有下列语句: (1)高山比他父亲出名。 (2)刘水是计算机系的一名学生,但他不喜欢编程序。 (3)人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y):x比y出名 COMPUTER(x):x是计算机系的学生 LIKE(x,y):x喜欢y LOVE(x,y):x爱y

M(x):x是人 定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x)) (2)COMPUTER(刘水)∧∽LIKE(刘水,程序) (3)(?x)(M(x) →LOVE(x,劳动)) 例2.2 设有下列语句: (1)自然数都是大于零的整数。 (2)所有整数不是偶数就是奇数。 (3)偶数除以2是整数。 定义谓词如下: N(x):x是自然数 I(x):x是整数 E(x):x是偶数 O(x):x是奇数 GZ(x):x大于零 另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为: (?x)(N(x) →GZ(x)∧I(x)) (?x)(I(x) →E(x)∨O(x)) (?x)(E(x) →I(S(x))) 三、论述(4X5‘)20’ 1.阐述深度、广度、代价驱动搜索方法。(P68) 答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

机器翻译系统评测规范

语言文字规范 GF 2006 — _______________________________________________________________________________ 机器翻译系统评测规范 (Assessment Specifications of Machine Translation Systems) 2006--发布 2006--试行_______________________________________________________________________________ 中华人民共和国教育部国家语言文字工作委员会发布

目录 前 言 1适用范围 (5) 2规范性引用文件 (5) 3术语和定义 (5) 4评测的一般原则和方法 (6) 5机器翻译系统的用户类型 (6) 6机器翻译评测题目的编制原则 (6) 7机器翻译的评测标准 (8) 8机器翻译评测的其他内容 (10)

前 言 本标准规定了机器翻译系统的评测规范。 本标准由教育部语言文字信息管理司提出立项,负责解释。 本标准由教育部语言文字信息管理司归口。 本标准由国家语言文字工作委员会语言文字规范(标准)审定委员会审定。本标准起草单位:教育部语言文字应用研究所 本标准主要起草人:冯志伟、肖航、富丽、章云帆

中华人民共和国教育部 国家语言文字工作委员会语言文字规范 GF2006 - 机器翻译系统评测规范 (Assessment Specifications of Machine Translation Systems) 1 适用范围 本标准规定了机器翻译系统的评测规范。 本标准适用于机器翻译系统的评测以及有关的管理工作。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准中的条款。 ISO11179-3信息技术数据元的规范与标准化第3部分:数据元的基本属性 GB/T 12200.1 汉语信息处理词汇 01部分:基本术语 GB/T 13725 信息处理用现代汉语分词规范 GB3259-92 中文书刊名称汉语拼音拼写法 GB/T 15834-1995 标点符号用法 GB/T 15835-1995 出版物上数字用法的规定 GB/T 16159-1996 汉语拼音正词法基本规则 第一批异形词整理表 第一批异体字整理表 部分计量单位名称统一用字表 中国人名汉语拼音字母拼写法 中国地名汉语拼音字母拼写规则 普通话异读词审音表 3 术语和定义 下列术语和定义适用于本规范。 3.1 信息处理系统(information Processing systems) 基于计算机技术、网络互联技术、现代通讯技术和各种软件技术,集各种理论和方法于一体,提供信息服务的人机系统,是由人和计算机等共同组成的,能进行信息的收集、传输、分析、加工、处理、存储、更新和维护的系统。 3.2 评测规范(assessment specifications) 用于评测的规范,包括评测的一般原则、评测内容、评价指标、评测方法和文件格式等。 3.3 自然语言(natural language) 规则是根据当前用法而不是用显式的方式规定的语言。如汉语、英语、德语等。 3.5 中文信息处理(Chinese information processing, CIP) 用计算机对汉语的语音、语法、词汇、语义、语用等信息进行处理,又称汉语信息处理。

论机器翻译系统的评价体系

与人工翻译译文质量评价不同的是,对机器翻译的评价除了评价译文质量外,还要评价机器翻译系统的其它性能。近年来,机器翻译的评测越来越受到广泛的重视。在过去几年中,国际上进行了若干次有影响的评测活动,如,信息理解评测(MessageUn-derstandingConference,简称MUC)评测专有名词识别问题,文本检索评估(Text-REtrievalConference,简称TREC)评测信息检索的发展,还有许多机器翻译和语音技术的评测活动,所有这些评测活动都对机器翻译的发展影响很大。 机器翻译适用的范围相对较小,通常是“相对限定的专业领域”,“不是用于文学性很强或文化味很浓的文本,而是用于科普文献、 金融商业交易、行政管理备忘录、法律文件、说明书、农业及医学资料、工业专利、宣传册、报纸报道等”(Hutchins&Somers, 1992:3)。Nagao把机器翻译的适用范围限定在科技文献、文章题目、一般句子,而排除了诗歌、文学作品、法律文件、标书合同等(Nagao,1989)等。因此,人们对机器翻译进行评测时,限制所评测的文本的类型。尽管如此,在具体的机器质量评测上,也存在着不同的标准,它不仅仅只局限在纯粹的译文质量上,而且也涉及机器翻译系统的可操作性、机器翻译的可行性、机器翻译的类型评价、机器翻译的投入与产出比、机器翻译中的不同角色等等,鉴于这些复杂性,人们常常需要综合多个标准,以便全面、客观、公正地评价机器翻译系统。在这个意义上,正好与辜正坤的翻译多元系统互补论中通类基础标准系统(抽 象标准)中的(2)(信的标准:忠实标准、 准确标准、动态等值标准),和非类特殊基础标准系统(具体标准)中的(8)(科学技术著作翻译标准)标准不谋而合。阿诺德(D?Arnold)等人曾建议机器翻译评价应考虑下述因素(Arnoldetal.,1993): (1)机器翻译商品系统与机器翻译研究应该区 分开来; (2)从用户的角度评价机器翻译系统; (3)从需求和结果相适应的角度看待机器翻译质量。 机器翻译评价的指标体系直接决定着机器翻译研发人员的研发路线和机器翻译的发展方向,评价标准对机器翻译的开发与研究都会产生重要影响,上个世纪60年代美国著名的ALPAC报告对MT作出的评价造成的影响很大(Arnoldetal.,1993),所以,怎样客观、 公正地评价一个机器翻译系统,这本身就构成了一个重大研究课题(Bourbeau,1993, Steiner,1993&Arnoldetal.,1993)。 一、机器翻译类型与评价标准 1995年,布瓦泰(C?Boitet)首先区分了机器翻 译的四种类型: (1)用于浏览者(forthewatcher),称之为MT- W,旨在为读者查阅外文资料时提供帮助,这种情况下,他们宁愿接受那种“粗糙”的译文(有时经过一定程度的后编辑),也不愿意一无所获; (2)用于修订者(forthereviser),称之为MT-R,旨在自动生成“粗糙”的译文,它类似于人工翻译的草稿,因而可以为专业翻译人员免去费时费力的工作,使他们变成修订者; (3)用于翻译者(forthetranslator),称之为MT- T,旨在协助翻译人员的工作,提供在线词典、同义词库、翻译实例库等; (4)用于作者(fortheauthor),称之为MT-A,提 供给希望作品被译成一种或几种文字的作者,该作者愿意在系统控制下写作或者帮助系统消除译本中可能产生的歧义。 论机器翻译系统的评价体系 张政1,王贵明2 (1.北京工商大学 外语系,北京100037;2.北京理工大学 外语学院,北京100081) 摘 要:近年来,机器翻译的应用越来越广泛。本文主要对人们所关注的机器翻译系统的评价问题,就其类型与标 准、系统评价的内容、以及系统评价的主要方法等方面进行较详细的介绍和评议。关键词:机器翻译;评价体系中图分类号:G64 文献标识码:A 文章编号:1009-3370(2008)02-0112-06 收稿日期:2007-12-17 作者简介:张政(1958—),男,教授;王贵明(1960—),男,教授。E-mail:guimingwang@bit.edu.cn 第10卷第2期北京理工大学学报(社会科学版) Vol.10No.22008年4月 JOURNALOF BEIJINGINSTITUTEOFTECHNOLOGY(SOCIALSCIENCESEDITION)Apr.2008

机器翻译的现状和发展趋势_岳涛

72 计算机教育 2005.4 人/才/培/养/与/就/业机器翻译(Machine Trans-lation)是通过计算机来实现不同自然语言之间的翻译。机器翻译是自然语言处理(Natural LanguageProcessing)的一个分支,机器翻译与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展,因此机器翻译可以说是一个跨学科的综合性系统工程。人类步入21世纪以来,随着国际互联网(Internet)的迅猛发展,网络信息急剧膨胀,国际交流日益频繁以及地球村的形成,机器翻译正在逐渐成为克服人们之间进行交流时所面临的语言障碍的重要手段,同时也面临着很大的市场机遇和挑战。 历史的回顾 从美国人维弗(Warren?Weaver)于1949年发表《翻译》备忘录并正式提出机器翻译的思想以来,机器翻译已经走过了50多个风风雨雨的春秋。在这期间,机器翻译可以说经历了一条曲折而漫长的 发展道路。 1954年,在美国乔治敦大学(Georgetown University)进行了 人类历史上的第一次机器翻译的公开演示。尽管演示尚不算很成功,但是它却具有划时代的意义,因为它拉开了人们研究机器翻译 的序幕。 从20世纪50年代开始到20世纪60年代的前半期,机器翻译的研 究呈不断上升的趋势。美国和前苏联两个超级大国出于军事和政治经济目的,纷纷对机器翻译项目提供了大量的资金支持,而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视。 1966年,美国科学院发表的ALPAC报告使当时正在蓬勃发展的机器翻译陷入了停滞的状态。现在来看,该报告是非常片面、狭隘和短视的。 从20世纪60年代中后期到整个70年代,整个机器翻译领域处于一个相对平稳发展的时期,而在某些国家,特别是加拿大和欧盟,机器翻译的研究却取得了比较显著的进步。尤其是在加拿大,由于双语文 化的影响,政府积极支持机器翻译的研发工作,1976年,加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了提供天气预报服务的实用性机器翻译系统TAUM-METEO,该系统的成功开发标志着 机器翻译已经在某些领域达到了实用化的程度。 进入20世纪80年代以来,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译在全世界范围内开始复苏,并在随后的90年代取得了长足的进步。 20世纪90年代以来的机器翻译技术的新进展 1.机器翻译的分类 进入20世纪90年代,机器翻译领域的的研究方法基本上可以分为两大类,即基于规则(Rule-Based)和基于语料库(Corpus-Based)的方法。基于规则的方法又可以分为基于转换的方法和基于中间语言的方法,基于语料库的方法又可以分为基于统计的方法和基于实例的方法。传统的基于规则的方法又可以 机器翻译的现状和发展趋势 中国软件与技术服务股份有限公司 岳涛/文 ◆ 课外新知 ◆

人工智能与机器翻译 自动分词

人工智能与机器翻译自动分词 人工智能与机器翻译-自动分词2010-10-21 16:48部著作中的词语逐个逐个的切分出来。汉语不象拼音文字那样有自然切分标志,而且词语长短不一,词 语的定义也不统一,语言学中对词的定义多种多样,造成切分的多样性,这也自然给自动分词的同一性带来很大困难。汉语中词语本身的词素、词、词组无明显 的区分界限,没有一个统一的标准,许多东西都是凭经验和语感来划分。.这项工作如果全部交给计算机来作,就没有那么简单了。 尽管计算机自动分词在诸多方面存在着许多困难,但是由于自动分词是许多应用工作的第一步(也是自动翻译的第一步),这就促进了研究的持续不断,提出 了不少方法,它们各有优缺点,也可能是基于特定环境的。 5.2.1典型的自动分词方法 正向最大匹配法和逆向最大匹配法 正向最大匹配法是最早提出的自动分词方法,它的基本思想是先取一句话的前六个字查字库,若不是一个词,则删除六个字的最后一个字再查,这样一直查下去,至找到一个词为止。句子剩余部分重复此工作,直到把所有的词都分出为止。逆向最大匹配法也一样,每次匹配不成功时去掉汉字串中最前面的一个字。 两法思路清晰,易于计算机实现,但由于试图用相对稳定的词表来代替灵活 多变,充满活力的词汇,把词库搜索作为判词的唯一标准,因而具有很大的主观性和局限性。另外,这两种方法实际上否认了语言中的歧义现象。 在实际应用中,方法有所变化。如下述算法我们初始不是取六个字而是取长度最短词的个数。 A1:一条汉语语句分划成单一字符X1,X2,…,XM。 A2:决定语词中可能出现的词最大字符长度Lmax,最小字符长度Lmin。

A3:逆向匹配,取语句最后的Lmin个字查关键词库,若查不到,加入一个字 重复此工作,直至字符数为Lmax为止。 A4:若实施A3查不到词,去掉语句中最后一个字,再实施A3,直至整个语句 只剩下Lmin为止。 高频优选法 这一方法基于词频的统计、字与字之间的构成结合律和歧义切分等现象的 分析而提出来的。根据《现代汉语频率词典》,对于报刊和政论性文章,不同 音节词的词频构成为:双音节词大约有74%;三音节词大约有3.7%;单音节词 大约有17.2%;而五以上字音节词则大约只有0.4%左右。汉语是一字一音节, 因而也可以说,两字组词的频率比其它所有方式的概率加起来都还要多。自动 分词时首先考虑两字词,然后再考虑单字词,如此频率低的词语最后才考虑。 这种方法提高了分词效率,但对歧义问题也无能为力,出错率并不低。 其它方法 设立切分标志 切分标志有自然和非自然之分。自然切分标志是指文章的非文字符号,例 如标点符号等等;非自然切分标志是利用词缀和不构成词的词(单字词等等)。 设立切分标志方法的基本思想就是通过建立非自然切分标志的一张表存储于计 算机中用程序来识别所有的非自然标志。这样一来,一个句子链将被化为若干 短链,然后再用其它切分方法进行各种细加工,这种多方法合作的综合应用, 途径增多,可以大大提高效率。 扩充转移网络分词法 它是以有限状态机概念为基础的方法。有限状态机只能识别正则语言,对 有限状态机作的第一次扩充可以使其具有递归能力,这样就形成递归转移网络(RTN)。在RTN中,弧线上的标志不仅可以是终极符(语言语句中的各种词语)或非终极符(还没有推导完的词类、符号等等,例如名词N,动词V,形容词A等等),还可以调用另外的子网络名字的非终极符(例如字或字串的成语条件)。这样,计算机在运行某个子网络时,就可以调用另外的子网络,还可以递归调用。

相关文档
最新文档