机器翻译的自动评测技术机器翻译技术

本文介绍了机器翻译评测的基本原理以及常用评测标准，包括人工评测方法、基于n元匹配的BLEU和NIST自动评测方法。机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法

进行评价，我们称其为机器翻译评测。由于机器翻译所处理的对象――语言本身存在某种程度的歧义，无法像数学公式或者物理模型那样简单客观地描述出来，这使得为机器翻译结果进行客观的打分变得非常困难。最早的方法是人工评测，这种方法得到的结果一般是十分准确的，但评测的成本太高，周期过长（评测过程可能长达几周甚至数月），评价结果也会随着评价人的变化和时间的推移而不同，这使得评价结果不可重复，缺乏客观性，因此，机器翻译的自动评测应运而生。实践证明，机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大，对研究发展和技术进步起着非常重要的引导作用。

基于n元匹配的自动评测方法

如果一个机器翻译评测系统只根据源语言文本就能自动地为若干译文打分并选择出其中最好的结果，那么这个评测系统本身就是一

个质量更好的机器翻译系统了。因此，自动评测最初的出发点就是给出一些标准的翻译结果，然后比较机器生成的译文与这些翻译之间的相似程度。我们称这些标准的翻译为参考译文(或者参考答案)。同一个句子可以有多个不同的参考译文，这些参考译文都表达同一个含义，但可能使用了不同的词汇，或者虽然使用了相同的词汇但在句中的词序不同。这样一来，机器翻译自动评测的问题转换为比较机器翻译系统输出的一个翻译结果和多个通过人工产生的正确的参考译文之间

的相似度的问题，使用不同的相似度计算方法即可得到不同的自动评测方法。

例如，考虑如下两个机器翻译系统生成的翻译结果:

源语言文本: 今年前两月广东高新技术产品出口37.6亿美元

系统译文1: The new high-tech products in Guangdong exported 3.76 billion dollars in the first two months this year

系统译文2: This year,the former two of Guangdong,the export of hi-tech products 37.6 yi US dollars

从直观上看，上面两个翻译结果的质量有较大的差别，第一个

翻译结果明显通顺、流畅、易于理解，如何将这种人的直观印象与具体的客观分数统一起来？这里引入三个人工翻译的参考译文来进行

比较:

参考译文1: Guangdong’s export of new high technology products amounts to US$3.76 billion in first two months of this year

参考译文2: Guangdong’s Exports US$3.76 Billion Worth of High Technology Products in the First Two Months of This year

参考译文3: In the first 2 months this year,the export volume of new high-tech products in Guangdong Province reached 3.76 billion US dollars

可以看出，质量较好的系统译文1与三个参考译文共现了很多

个翻译片段: 与参考译文1共现“3.76 billion”，与参考译文3共现“dollars”，与参考译文2共现“in the first two months”和

“this year”。相比而言，系统译文2与上述三个参考译文的共现片段比较少。

通过上述比较，可以很容易地写出一个评价算法来评价上述翻译结果的质量。通过引入一个称为n元匹配的概念，可对翻译结果1给出比翻译结果2更高的分数。n元匹配的含义是: 翻译结果与参考译文句子中的任意连续n个单词完全相同，这里的n值可以取任意正整数。基于n元匹配的策略非常与常用的准确度的计算思想类似，首先统计系统译文与参考译文中共现的n元匹配的个数，再除以相应的系统译文中n元词的总数，用这个比值来表示相应的n元准确率。

机器翻译评测领域目前使用最为广泛的自动评测方法是BLEU （ Bilingual Evaluation Understudy），就基于n元匹配的这一类方法中的典型代表，由IBM于xx年提出。类似的方法还包括NIST方法，该方法由美国标准和技术研究所提出并命名，它在BLEU方法的基础上，综合考虑了每个n元词的权重，对于那些在参考译文中出现次数更少的词赋给更高的权重以体现其所包含的信息量。

BLEU和NIST是最常用的两种机器翻译自动评测方法，但这一类评测方法并不是在真正地评价系统译文与原文的一致程度，而是根据若干个参考译文为系统译文打分而已。系统得分似乎与待翻译的原

文没有关系，参考译文的数量多寡与质量好坏才是影响评测结果的关键因素。

基于准确率和

召回率的自动评测方法

基于n元匹配的自动评测方法是一种基于准确率的方法，与参考译文越相似的系统译文可获得越高的分数。研究人员提出了一些同时考虑召回率的自动评测方法，其中比较典型的是纽约大学提出的GTM评测方法。该方法应用了图的最大匹配算法来计算词的共现次数。

图1描述了这个计算过程。图1中的黑点表示参考译文和系统译文共现的词的位置。图中的B和C都存在两次以上的共现，这些点被认为是互相冲突的，在实际计算时应避免重复，只保留一个即可。使用图搜索算法找到最大匹配的区块，如图中灰色部分所示，并在此基础上计算最大匹配块长度MMS，准确率和召回率都通过MMS进行计算，在上例中分别为4.6/8和4.6/10。系统最终的得分使用准确率和召回率的调和平均值F值来表示。

基于GTM的评测标准最大的优点在于，没有人为地设置匹配时的最高阶数值（即n元匹配中的n的最大值，BLEU方法一般只考虑

到4元或者5元匹配），图的最大匹配算法会自动地寻找针对某个参考译文的最大匹配词数。据称这种基于F值的自动方法与人工评测的一致性可以比BLEU或者NIST更高。其缺点在于，计算MMS本身是一个“NP难”的问题，比较费时。

引入语言知识的自动评测方法

BLEU、NIST以及GTM方法都是基于字面的完全匹配，并没有理解系统译文和参考译文的含义，引入多个参考译文只能在一定程度上减轻这方面的缺陷。研究人员尝试使用基于更多语言学知识的评测方法来评价翻译质量的好坏。早在十几年前，北京大学计算语言学研究所的俞士汶教授就提出了一种基于测试点的机器翻译自动评价方法。这种方法并不直接评价译文句子，而是考虑系统译文在给定的测试点上的质量。其基本原理类似于在考试出题时设置考点，考生答题时答到相应的考点即可得分。基于测试点的评测方法是一种非常巧妙的方法。使用这种评测方法，通过对评测结果进行细致深入的分析，很容易知道系统在哪些语言问题上处理得不够好，有针对性地对系统进行改进即可进一步提高系统翻译的质量。

近几年来研究人员又提出了一些融合了语义知识的机器翻译评测方法，由美国南加州大学信息科学研究所的Zhou Liang等人提出的ParaEval方法通过引入语义对BLEU方法进行改进，中科院计算所

的刘洋等人在GTM自动评测方法的基础上，引入模糊匹配的策略。这些机器翻译自动评测方法试图利用更多的语言学知识，更好地评价机器翻译系统译文的质量，使其结果与人工评价更为接近。

（本文作者刘洋为中科院计算技术研究所助理研究员，博士研究生）

内容仅供参考

机器翻译技术的现状及发展

机器翻译技术的现状及发展篇一：翻译技术领域的现状与展望翻译技术领域的现状与展望作者/王华伟闫栗丽翻译技术在中国的发展起步相对较晚，但近年来随着中国在全球化进程中扮演着越来越重要的角色，催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上，于2007~2008年间在翻译技术领域取得了一系列成就，也还存在一些亟需改进的方面，而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动翻译技术的发展直接关乎整个翻译行业的翻译质量及效率，具备巨大的行业经济效益。对此，科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中，中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛，着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放词典是使用范围最广的工具，它以使用便利的优势，几乎占据了每个计算机的桌面，无论语言学习者还是专业翻译人员，几乎都是必备工具。词典的发展从最早的单机版本发展至今，已经有很多种产品

类型，我们可以见到的有：电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展，如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出，将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等，并取得了显著的成功。另外，类似Google这样的搜索引擎，因为信息量大，检索便利而成为很多专业翻译人员查词的重要辅助工具。值得一提的是，最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源，为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现，加快了信息传播的速度，也提高了用户对新词更新的速度要求，为了方便新词汇的发布，词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统，用户可自由发起词典编纂项目，自发组织人员参与项目，发起人可以按照需要给小组成员分配不同的权限，将词汇添加等基本工作和审核人员明确区分，既确保了词典的专业性，也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活谷歌语言工具的推出打破了互联网语言的藩篱，用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上，这也是机器翻译软件的一个应用领域，而国内的相关软件如金山快译等，专注于为普通网民提供更为友好的英中日网站浏览体验，并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

机器翻译

机器翻译 1 概述机器翻译（machine translation），又称为自动翻译，是利用计算机把一种自然源语言转变为另一种自然目标语言的过程，一般指自然语言之间句子和全文的翻译。它是自然语言处理（Natural Language Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（ Natural Language Understanding）之间存在着密不可分的关系。 2 国内外现状机器翻译思想的萌芽关于用机器来进行语言翻译的想法，远在古希腊时代就有人提出过了。在17世纪，一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡（Descartes）和莱布尼兹（Leibniz）都试图在统一的数字代码的基础上来编写词典。在17世纪中叶，贝克（Cave Beck）、基尔施（Athanasius Kircher）和贝希尔（Johann JoachimBecher）等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯（JohnWilkins）在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语（Interlingua）是这方面最著名的成果，这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码，有规则地列出并描述所有的概念和实体，并根据它们各自的特点和性质，给予不同的记号和名称。本世纪三十年代之初，亚美尼亚裔的法国工程师阿尔楚尼（G.B. Artsouni）提出了用机器来进行语言翻译的想法，并在1933年7月22日获得了一项“翻译机”的专利，叫做“机械脑”（mechanical brain）。这种机械脑的存储装置可以容纳数千个字元，通过键盘后面的宽纸带，进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户，尤其适合于作机器词典。在宽纸带上面，每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项，在另外一条纸带上对应的每个词项处，记录着相应的代码，这些代码以打孔来表示。机械脑于1937年正式展出，引起了法国邮政、电信部门的兴趣。但是，由于不久爆发了第二次世界大战，阿尔楚尼的机械脑无法安装使用。1903年，古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出，德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik)，这种语法加上词典的辅助，可以利用机械将一种语言翻译成其他多种语言，首次使用了“机器翻译” （德文是ein mechanisches Uebersetzen）这个术语。真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用，世界经济一体化进程的加速以及国际社会交流的日渐频繁，传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求，人们对于机器翻译的需求空前增长，机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开，中国也取得了前所未有的成就，相继推出了一系列机器翻译软件，例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下，商用机器翻译系统迈入了实用化阶段，走进了市场，来到了用户面前。中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家，60年代中期以后一度中断，70年代中期以来有了进一步的发展。现在，中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

机器翻译技术介绍

机器翻译技术介绍
常宝宝北京大学计算语言学研究所 chbb@https://www.360docs.net/doc/719719499.html,

什么是机器翻译
研究目标：研制出能把一种自然语言（源语言）的文本翻译为另外一种自然语言（目标语言）的文本的计算机软件系统。制造一种机器，让使用不同语言的人无障碍地自由交流，一直是人类的一个梦想。随着国际互联网络的日益普及，网上出现了以各种语言为载体的大量信息，语言障碍问题在新的时代又一次凸显出来，人们比以往任何时候都更迫切需要语言的自动翻译系统。但机器翻译是一个极为困难的研究课题，无论目前对它的需求多么迫切，全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。

机器翻译的基本方法
机器翻译的基本方法 ? 基于规则的机器翻译方法 ? 直接翻译法 ? 转换法 ? 中间语言法 ? 基于语料库的机器翻译方法 ? 基于统计的方法 ? 基于实例的方法 ? 混合式机器翻译方法
目前没有任何一种方法能实现机器翻译的完美理想，但在方法论方面的探索已经使得人们对机器翻译问题的认识更加深刻，而且也确实带动了不少不那么完美但尚可使用的产品问世。
20世纪90年代以前，机器翻译方法的主流一直是基于规则的方法，不过，统计方法后来居上，目前似乎已成主流方法，从学术研究的角度看，更是如此。(Google translate)

机器翻译的基本方法
20世纪90年代以前，机器翻译方法的主流一直是基于规则的方法，因此基于规则的方法也称为传统的机器翻译方法。直接翻译法 ? 逐词进行翻译，又称逐词翻译法(word for word translation) ? 无需对源语言文本进行分析 ? 对翻译过程的认识过渡简化，忽视了不同语言之间在词序、词汇、结构等方面的差异。 ? 翻译效果差，属于早期过时认识，现已无人采用 How are you ? 怎么是你 ? How old are you ? 怎么老是你 ?

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇，尹存燕，陈家骏，郑国梁（南京大学计算机软件新技术国家重点实验室，南京 210093）（南京大学计算机科学与技术系，南京 210093）摘要：本文回顾机器翻译研究的历史，介绍典型的机器翻译方法，包括：基于规则、基于统计以及基于实例的机器翻译方法；针对机器翻译的研究现状，详细介绍和分析了基于混合策略的机器翻译方法，对统计以及机器学习方法在机器翻译中的应用进行了描述；论文还介绍了当前机器翻译评测技术；最后对机器翻译进行总结和展望。关键字：机器翻译，基于规则，基于统计，基于实例，混合策略，机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract：This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords：Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助（编号：2001AA114102, 2002AA117010-04）戴新宇博士生，主要研究自然语言处理；尹存燕助教，主要研究自然语言处理；陈家骏教授，博士生导师，主要研究自然语言处理、软件工程；郑国梁教授，博士生导师，主要研究软件工程。

机器翻译评测大纲

机器翻译评测大纲一、评测对象本次评测的对象包括：汉－英、英－汉、汉－日、日－汉机器翻译系统中的核心技术。二、评测内容本次评测组织两种语料的评测，一种是篇章语料，一种是对话语料。领域是面向奥运的相关领域，包括体育赛事、天气预报、交通住宿、旅游餐饮等。本次评测的评测指标包括译文质量和翻译速度。三、评测方法 1. 评测方式本次评测为现场评测。采用的是以人工评测为主，人工评测和自动评测相结合的方式。人工评测方式是：由评测组织单位将各个评测单位提交的评测结果汇总在一起，然后用计算机随机打乱译文句子的排列顺序。再将所有译文句子提交给多位专家进行人工评测。将专家评测的结果汇总，用计算机还原成原来的排列顺序，分别计算出各个评测单位的总得分。 2.评测步骤 ?在评测单位统一提供的评测环境上安装被测系统 ?评测单位给出评测数据 ?被测单位运行系统，提交评测结果 ?评测单位运行自动评测程序，得出自动评测结果 ?评测单位事后进行人工评测 ?公布评测结果 3.评测标准（1）自动评测标准

机器翻译的自动评测目前比较成熟的标准有BLEU标准、NIST标准等。本次评测采用NIST标准。具体评测标准见附件。（2）人工评测标准本次评测按0 - 6个等级层次打分，最后采用百分制换算评测结果。总的可理解率=（T1*20%+T2*40%+T3*60%+T4*80%+T5*90%+T6*100%）/ 总句数其中：Ti为被评为第i等级的句数。

（3）翻译速度评测标准由主持评测的工作人员现场记录翻译时间，各系统自动显示从第一个句子翻译开始到所有句子翻译完毕所用的时间（不计系统初始化所用时间，只记开始翻译到所有句子翻译完毕所用时间）。 4. 输入输出文件格式下面以汉英机器翻译为例，说明输入输出文件格式。其中p标签为段落标记，s标签为句子标记。输入文件中每个s标签内部为一个句子。输出文件中每个s 标签与输入文件中的s标签一一对应。由于一个源语言句子可能翻译成一个或多个目标语言句子，所以输出文件中每个s标签内部可以有不只一个句子。Lang 为语言代码，汉语用“zh”表示，英语用“en”表示，日语用“ja”表示。汉语、英语、日语的输入和输出文件统一采用GBK编码。（1）输入文件格式： ~~玻利维亚举行总统与国会选举~~ (法新社玻利维亚拉巴斯电)玻利维亚今天举行总统与国会选举，投票率比预期更高，选民希望选出的新领导阶层能够振兴经济，改善人民的生活水准，抑制这个南美洲最贫穷国家的劳工骚动。 ~~投票所于下午四时(台北时间七月一日清晨四时)关闭，选务人员说，选举结果将于两小时之后开始发布。~~ 稍早，玻利维亚总统与参与选举的候选人援引巴西赢得世足赛冠军为例，鼓励民众踊跃投票，虽然联邦法律规定，凡达投票年龄的玻利维亚人都必须投票。

人工智能与机器翻译期末复习题

一、名词解释（5X3‘）15’ 1.兼类（P121）：一个单词既可以作名词动词又可以作其他词类 2.机器翻译：用计算机软件代替人做的书面翻译 3.组合型歧义：一个字与前面的字成词,与后面的字成词,合起来也成词。 4.交集型歧义（P117）：一个字与前面的字成词,与后面的字也成词。 5.人工智能：用计算机硬件、软件模拟人的行为，解决人类目前尚未认识清楚的问题。 6.人工智能软件的三大技术：知识表示、知识推理、知识获取。 7.语料库：单词、短语和句子组成的数据库。 8.知识工程：包括人工智能软件技术的工程。（知识工程是以知识为基础的系统，就是通过智能软件而建立的专家系统） 9.深度学习：一步一步在丰富起来的特征规律引导下，由浅入深完成推理的方法。 10.语用分析：分析成语和习惯用语的方法。二、题解P36 例2.1 、2.2 例2.1 设有下列语句：（1）高山比他父亲出名。（2）刘水是计算机系的一名学生，但他不喜欢编程序。（3）人人爱劳动。为了用谓词公式表示这些语句，应先定义谓词： BIGGER(x,y):x比y出名 COMPUTER(x):x是计算机系的学生 LIKE(x,y):x喜欢y LOVE(x,y):x爱y

M(x):x是人定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为：（1）BIGGER(高山，father(x)) （2）COMPUTER(刘水)∧∽LIKE（刘水，程序）（3）（?x）（M(x) →LOVE(x,劳动)）例2.2 设有下列语句：（1）自然数都是大于零的整数。（2）所有整数不是偶数就是奇数。（3）偶数除以2是整数。定义谓词如下： N(x):x是自然数 I(x):x是整数 E(x):x是偶数 O(x):x是奇数 GZ(x):x大于零另外，用函数S（x）表示x除以2。此时，上述三个句子可用谓词公式表示为：（?x）(N(x) →GZ(x)∧I(x)) (?x)（I(x) →E(x)∨O(x））（?x）(E(x) →I(S(x))) 三、论述（4X5‘）20’ 1.阐述深度、广度、代价驱动搜索方法。（P68）答：广度优先搜索法：对全部节点沿广度进行横向扫描，按各节点生成的先后次序，

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史现代机器翻译的研究应该是从20世纪50年代开始，但是早在这以前很多人已经提出了相应的想法，甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。在1946年，美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时，英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时，就提出了利用计算机实现语言的自动翻译的想法。在1949年，韦弗发表了一份名为《翻译》的备忘录，正式提出了机器翻译问题。他提出了两个主要观点：第一，他认为翻译类似于解读密码的过程。第二，他认为原文与译文“说的是同样的事情”，因此，当把语言A翻译为语言B时，就意味着从语言A出发，经过某一“通用语言”或“中间语言”，可以假定是全人类共同的。在这一段时间由于学者的热心倡导，实业界的大力支持，美国的机器翻译研究一时兴盛起来。 1964年，美国科学院成立语言自动处理咨询委员会，调查机器翻译的研究情况，给出了“在目前给机器翻译以大力支持还没有多少理由”的结论，随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期，随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容经过50多年的发展，在机器翻译领域中出现了很多的研究方法，总结如下：●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法基于实例的方法（含模板、翻译记忆方法）基于统计的方法在当前的研究中，更多的是基于统计的方法进行的，因为基于统计的方法可以充分的利用计算机的计算能力，并且并不需要过多的语言学知识作为支撑，可以让更多的计算机科学家投入到实用系统的研究中，极大的促进了统计机器翻译的发展。下面对各个方法逐一的进行介绍。

机器翻译技术的探讨

机器翻译技术的探讨六院五队-徐允鹏-12060143 摘要随着国际交流的日益增多，在计算机、互联网等相关技术日新月异的基础上，机器翻译的技术与应用得到了蓬勃发展。本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法，并讲述了机器翻译的评估方法，最后介绍了机器翻译技术的最新进展。关键词：机器翻译；基于规则；语料库；评估方法 1.机器翻译概述随着国际化交流的普遍性，信息通信的日益膨胀，高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通过专业翻译人员完成，利用语言学知识进行自然语言之间的互译，帮助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术的不断进步，利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。机器翻译（machine translation），又称为自动翻译，是利用计算机把一种自然源语言转变为另一种自然目标语言的过程，一般指自然语言之间句子和全文的翻译。它是自然语言处理（Natural Language

Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（Natural Language Understanding）之间存在着密不可分的关系[1]。机器翻译是21世纪要解决的科技难题之一，主要困难是自然语言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论意义。国际间的合作与交流，语言的差异是一个非常重要的障碍，各行各业的人们面对大量他们不熟悉的语言的文档资料，如果单纯的依靠人工翻译，这些日益的待翻译材料将是一种非常沉重的负担，而机器翻译可大幅度减轻这种负担。同时，机器翻译对于了解人类语言和思维的基本机制，探讨人工智能技术有着重要的意义。 2.机器翻译方法人们一直在寻求更好的解决机器翻译问题的方法，目前机器翻译方法主要有基于规则的机器翻译，基于语料库的机器翻译和混合式机器翻译方法。 2.1基于规则的机器翻译方法 2.1.1基于分析和转换的机器翻译方法人作翻译时，把一个源语言句子译成目标语言句子，设计到四个基本操作：目标语言单词的检索、调序、删词、增词；机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段，这被称为基于分析和转换的机器翻译系统，也被认为是模拟人类翻译活动最恰当的机

浅谈机器翻译存在的问题

机器翻译及其问题浅析摘要：由于信息技术高速发展，国际交流日益频繁，如何克服语言障碍已经成为国际社会共同面对的问题，而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势，但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。关键词：机器翻译问题语法应用一、引言机器翻译（Machine Tanslation，简称MT），又称自动翻译，是利用计算机来进行不用的自然语言之间的翻译，它是自然语言处理（Natural Language Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（Natural Language Understanding）之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科，也是信息时代语言应用的一个重要领域。二、机器翻译的简介（一）机器翻译简史人类在近代就萌发了机器翻译的梦想，但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生，同一年，美国科学家韦弗（W. Weaver）和英国工程师布斯（A. D. Booth）在讨论电子计算机的应用范围时，提出了利用计算机进行语言自动翻译的想法。1949年，韦弗（W. Weaver）发表《翻译备忘录》，正式提出机器翻译的思想。经过六十年的曲折发展，到目前互联网的普遍应用，以及人们对翻译需求的迅猛增长，给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下，商用机器翻译系统迈入了实用化阶段，走进了市场，来到了用户面前。（二）机器翻译的主要方法机器翻译的过程一般可简化为三个阶段：原文分析、原文译文转化和译文生成。表象上，机器翻译的核心问题是翻译的准确性；实质上，体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面，机器翻译系统可分为基于规则（Rule-Based ）和基于语料库（Corpus-Based）两大类。基于规则（Rule-Based ）就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库，覆盖了相当大范围的语言现象，但却难以

机器翻译测试大纲

2004年度机器翻译评测大纲一、评测对象本次评测的对象包括：汉－英、英－汉、汉－日、日－汉、汉－法、法－汉机器翻译系统中的核心技术。二、评测内容本次评测组织两种语料的评测，一种是篇章语料，一种是对话语料。领域是通用领域和奥运的相关领域，包括体育赛事、天气预报、交通住宿、旅游餐饮等。本次评测的评测指标包括译文质量和翻译速度。三、评测方法 1. 评测方式本次评测为现场评测。结果评估采用的是以人工评估为主、自动评估为辅方式。人工评估采用可理解率指标。评估方式是：由评测组织单位将提交的评测结果汇总在一起，然后用计算机随机打乱译文句子的排列顺序。再将所有译文句子提交给多位专家进行可理解率的人工评估。将专家评测的结果汇总，用计算机还原成原来的排列顺序，计算出总的可理解率。自动评测采用基于n元语法的BLEU和NIST方法。 2.评测步骤 (1) 在评测单位统一提供的评测环境上安装被测系统。系统应安装在指定的目录中。 (2) 评测单位给出评测数据。评测数据存放在指定目录中。给出评测数据以后被测单位不得再更改系统参数。 (3) 被测单位运行系统，提交评测结果。被测单位应指导评测人员学会操作方法，所有操作由评测人员进行，系统运行时各单位人员应离场。系统的运行应该是批处理方式的，系统读入一个脚本文件（格式后面说明），脚本

中存放输入文件名和对应的输出文件名。 (4) 评测单位事后进行人工评估。 (5) 公布评测结果。 3.评测标准（1）人工评测标准本次评测按0.0 –5.0分打分，可含一位小数，最后采用百分制换算评测结果。总的可理解率= 所有句子得分之和/总句数/5×100％（2）翻译速度评测标准由主持评测的工作人员现场记录翻译时间，各系统自动显示从第一个句子翻译开始到所有句子翻译完毕所用的时间（不计系统初始化所用时间，只记开始翻译到所有句子翻译完毕所用时间）。

机器翻译的现状和发展趋势_岳涛

７２计算机教育 2005.4 人／才／培／养／与／就／业机器翻译（Ｍａｃｈｉｎｅ　Ｔｒａｎｓ－ｌａｔｉｏｎ）是通过计算机来实现不同自然语言之间的翻译。机器翻译是自然语言处理（Ｎａｔｕｒａｌ　ＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ）的一个分支，机器翻译与计算语言学（ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ）、自然语言理解（Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展，因此机器翻译可以说是一个跨学科的综合性系统工程。人类步入２１世纪以来，随着国际互联网（Ｉｎｔｅｒｎｅｔ）的迅猛发展，网络信息急剧膨胀，国际交流日益频繁以及地球村的形成，机器翻译正在逐渐成为克服人们之间进行交流时所面临的语言障碍的重要手段，同时也面临着很大的市场机遇和挑战。历史的回顾从美国人维弗（Ｗａｒｒｅｎ?Ｗｅａｖｅｒ）于１９４９年发表《翻译》备忘录并正式提出机器翻译的思想以来，机器翻译已经走过了５０多个风风雨雨的春秋。在这期间，机器翻译可以说经历了一条曲折而漫长的发展道路。１９５４年，在美国乔治敦大学（Ｇｅｏｒｇｅｔｏｗｎ　Ｕｎｉｖｅｒｓｉｔｙ）进行了人类历史上的第一次机器翻译的公开演示。尽管演示尚不算很成功，但是它却具有划时代的意义，因为它拉开了人们研究机器翻译的序幕。从２０世纪５０年代开始到２０世纪６０年代的前半期，机器翻译的研究呈不断上升的趋势。美国和前苏联两个超级大国出于军事和政治经济目的，纷纷对机器翻译项目提供了大量的资金支持，而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视。１９６６年，美国科学院发表的ＡＬＰＡＣ报告使当时正在蓬勃发展的机器翻译陷入了停滞的状态。现在来看，该报告是非常片面、狭隘和短视的。从２０世纪６０年代中后期到整个７０年代，整个机器翻译领域处于一个相对平稳发展的时期，而在某些国家，特别是加拿大和欧盟，机器翻译的研究却取得了比较显著的进步。尤其是在加拿大，由于双语文化的影响，政府积极支持机器翻译的研发工作，１９７６年，加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了提供天气预报服务的实用性机器翻译系统ＴＡＵＭ－ＭＥＴＥＯ，该系统的成功开发标志着机器翻译已经在某些领域达到了实用化的程度。进入２０世纪８０年代以来，由于计算机科学、语言学研究的发展，特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用，机器翻译在全世界范围内开始复苏，并在随后的９０年代取得了长足的进步。２０世纪９０年代以来的机器翻译技术的新进展１．机器翻译的分类进入２０世纪９０年代，机器翻译领域的的研究方法基本上可以分为两大类，即基于规则（Ｒｕｌｅ－Ｂａｓｅｄ）和基于语料库（Ｃｏｒｐｕｓ－Ｂａｓｅｄ）的方法。基于规则的方法又可以分为基于转换的方法和基于中间语言的方法，基于语料库的方法又可以分为基于统计的方法和基于实例的方法。传统的基于规则的方法又可以机器翻译的现状和发展趋势中国软件与技术服务股份有限公司岳涛／文 ◆　课外新知　◆

搭建属于自己的机器翻译系统

搭建属于自己的机器翻译系统——MTI专业“技术小白”走进小牛翻译开源社区的心得搭建属于自己的机器翻译系统 ——MTI专业“技术小白”走进小牛翻译开源社区的心得首先，自我介绍一下。我是一个MTI(翻译硕士)专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟，任职于一家网络科技公司的市场部门，之前的工作中需要做些翻译工作，有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题，但是对于一些涉及我们商业机密的数据，由于担心泄密，只能借助于有道词典查查词，然后再自己形成翻译结果。很早之前我就想，要是能有自己的机器翻译系统就好了。我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建议，“学好翻译技术，有前途。对于仍在迷茫MTI的同学，我建议学机器翻译设计与开发，走出迷茫。”非常非常幸运的是，我一个东大毕业的同学告诉我，东北大学自然语言处理实验室（国内搞机器翻译最好的团队之一）联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”，社区中有一项内容，就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是，我走进社区，按照社区里的相关说明，亲身体验了搭建过程。下面，我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下，NiuTrans开源系统在国际上比较有名，据说是目前国际上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses)。这些内容对MT(机器翻译)的专业学者应该很有用吧，但是对于我这个非科班出身的人来说，其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获——快速搭建实用的机器翻译系统。一、搭建过程详细说明需要说明的是，我是在在网页指导与人工指导下才在自己的电脑（Windows7 64位系统，硬盘500G，内存8G）上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导，还需要人工指导。身为“技术小白”的我，虽然网页上的操作指导写的很规范，但是第一次接触这么“高大上”的东西，还是有点小紧张的。于是，我加入了小牛翻译开源社区的QQ群（群号群主很热心的帮我讲解，在服务方面我的用户体验很好。下面我就与大家分享我如何一步步完成在自己电脑上搭建机器翻译系统的。

机器翻译现状

机器翻译的现状与发展摘要：随着经济全球化的飞速发展以及人类命运共同体的提出，各国之间人民之间的交流必将日益频繁，各个国家语言之间转换需求也必定与日俱增，人为地学习千百种语言实在不易，机器翻译的作用也就越来越受到重视。它涉及计算机语言学、数学和语言学等各个学科，其中语言学为其提供了机译数据库和技术支撑。然而，目前机器翻译还存在许多不足，需要多方面深入研究。本文对机器翻译发展历程、研究方法、存在问题及其应对方法进行了综述，以期机器翻译更进一步发展。关键词：机器翻译；发展历程；研究方法；语言学理论；问题；应对方法机器翻译是通过计算机来实现不同自然语言之间的转换，也称为自动翻译，一般是指自然语言之间的部分句子或全文的翻译。它作为应用语言学的一个分支，是建立在语言学、数学和计算机科学基础上的跨学科研究。由于需要通过电脑数据库和翻译软件来完成操作，因此，机器翻译的发展与计算机科学、数学、人工智能、语言学等各学科的发展密不可分，可以说，机器翻译的推进需要这些学科的技术支撑和理论支持。人类进入21世纪以来，随着经济的发展，国际交流合作日益频繁，对机器翻译的需求日益增大。机器翻译是规避国家间交流障碍的有效手段，但作为综合性的学科，它的发展受到多方面牵制，因此需要相关研究人员和学者对其相关学科进行更深入的研究。 1机器翻译发展历史机器翻译的历史最早可以追溯到20世纪30年代相关学者提出其雏形，如今处于高速发展的阶段。然而在初期机器翻译受到过阻碍，一度陷入低潮期。直到移动互联网时代的到来，一方面，随着计算机网络技术快速发展，人们要求用计算机实现语言翻译的愿望越来越强烈。另一方面自1990年统计机器翻译模型提出以来，基于大规模语料库的统计翻译翻译方法迅速发展，机器翻译再次成为人们关注的热门研究课题，取得了一些令人瞩目的成果。但是，在机器翻译飞速发展的同时，也遇到了很多难题，在目前的技术条件下翻译的质量还不能够达到人们的期望的程度，想让机器让人类一样去理解和分析语言还远不能行。在当今信息大数据时代，机器翻译正发挥越来越重要的作用。机器翻译的发展可以归结为以下几个发展阶段： 1.1机器翻译人员的独立工作阶段 20世纪50年代初期，随着第一台计算机的问世，美国的科学家W.Weaver和英国工程师A.D. Booth就发表了翻译备忘录，提出了利用计算机进行翻译的设想。随后，通过不懈的努力和试验，美国的乔治伦敦大学和IBM公司合力推出了首个MT系统，为各国的机器翻译奠定了坚实的实践基础。但是由于受到计算机硬件局限性的限制，尤其是内存不足和存储速度慢，以及缺乏高级编程语言，研究人员无法完全依赖机器来完成大规模、高质量的翻译任务。同时，由于研究是在没有句法学家和语义学家的协助下独立进行的，翻译的质量难以保证。在这样的背景下，早期研究者意识到，无论开发出什么样的系统都只能产生出低质量的输出，因此专家建议，先发展对有控制的语言进行翻译，并限定于某些特定领域。 1.2进入高质量的翻译输出 20世纪60年代，受到改进了的计算机硬件和编程语言的鼓舞，研究人员对机器翻译产生了盲目的乐观。编程语言在句法分析上取得的长足进步让翻译人员感受到了技术革新的成果，他们相信机器翻译有巨大的前景，几年之内就可以达到高质量的输出，这一乐观论调很快传遍了全世界。研究人员还提出假设：机器翻译的目标是产出高质量翻译的全自动系统。研究的重点在于寻求完善的翻译理论和方法。 1.3翻译软件和工具的发展 20世纪70年代以来，随着科技发展和各国间频繁交流，大规模翻译需求日益增加，对计算机翻译的依赖更加突出，机器翻译进入了新的发展阶段。实用性翻译和软件系统如雨后春笋频频出现，如Weinder系统、EURPOTRA多国种翻译系统、TAUM-METEO系统等。80年代产生了大量连接网络和大容量存储的微型计算机，各种翻译工具也应运而生，如词典和术语资料库、多语文字处理、词汇和术语资源的管理、信息传递的

机器翻译系统评测规范

语言文字规范 GF 2006 — _______________________________________________________________________________ 机器翻译系统评测规范（Assessment Specifications of Machine Translation Systems） 2006－－发布 2006－－试行_______________________________________________________________________________ 中华人民共和国教育部国家语言文字工作委员会发布

目录前言 1适用范围 (5) 2规范性引用文件 (5) 3术语和定义 (5) 4评测的一般原则和方法 (6) 5机器翻译系统的用户类型 (6) 6机器翻译评测题目的编制原则 (6) 7机器翻译的评测标准 (8) 8机器翻译评测的其他内容 (10)

前言本标准规定了机器翻译系统的评测规范。本标准由教育部语言文字信息管理司提出立项，负责解释。本标准由教育部语言文字信息管理司归口。本标准由国家语言文字工作委员会语言文字规范（标准）审定委员会审定。本标准起草单位：教育部语言文字应用研究所本标准主要起草人：冯志伟、肖航、富丽、章云帆

中华人民共和国教育部国家语言文字工作委员会语言文字规范 GF2006 －机器翻译系统评测规范（Assessment Specifications of Machine Translation Systems） 1 适用范围本标准规定了机器翻译系统的评测规范。本标准适用于机器翻译系统的评测以及有关的管理工作。 2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准中的条款。 ISO11179-3信息技术数据元的规范与标准化第3部分：数据元的基本属性 GB/T 12200.1 汉语信息处理词汇 01部分：基本术语 GB/T 13725 信息处理用现代汉语分词规范 GB3259－92 中文书刊名称汉语拼音拼写法 GB/T 15834－1995 标点符号用法 GB/T 15835－1995 出版物上数字用法的规定 GB/T 16159－1996 汉语拼音正词法基本规则第一批异形词整理表第一批异体字整理表部分计量单位名称统一用字表中国人名汉语拼音字母拼写法中国地名汉语拼音字母拼写规则普通话异读词审音表 3 术语和定义下列术语和定义适用于本规范。 3.1 信息处理系统（information Processing systems）基于计算机技术、网络互联技术、现代通讯技术和各种软件技术，集各种理论和方法于一体，提供信息服务的人机系统，是由人和计算机等共同组成的，能进行信息的收集、传输、分析、加工、处理、存储、更新和维护的系统。 3.2 评测规范（assessment specifications）用于评测的规范，包括评测的一般原则、评测内容、评价指标、评测方法和文件格式等。 3.3 自然语言（natural language）规则是根据当前用法而不是用显式的方式规定的语言。如汉语、英语、德语等。 3.5 中文信息处理（Chinese information processing, CIP）用计算机对汉语的语音、语法、词汇、语义、语用等信息进行处理，又称汉语信息处理。

机器翻译技术的研究和应用综述

机器翻译技术的研究和应用综述 ACM Matrix_68 摘要：随着互联网的日益发展，网络信息的激增，国际社会交流愈加频繁，机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。本文回顾机器翻译研究的历史，介绍典型的机器翻译方法，在分析机器翻译内涵的基础上，阐述了机器翻译的现状，探讨了机器翻译所面临的问题及机器翻译的发展趋势，对统计以及机器学习方法在机器翻译中的应用进行了描述；论文还介绍了当前机器翻译评测技术；最后对机器翻译进行总结和展望。关键字：机器翻译；自然语言；基于规则；基于统计；基于实例；混合策略；机器学习 1引言近年来，自然语言处理的研究已经成为热点，而机器翻译作为自然语言研究领域的一个重要分支，同时也是人工智能领域的一个课题，同样为大家所关注。当电子计算机1946年问世的时候，人们就提出了机器翻译的想法，并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用（语言信息检索、文本自动分类、自动文摘、信息提取等等）相比，机器翻译却是进展最慢的。从上个世纪40年代英国工程师Booth 和美国工程师Weaver提出利用计算机进行翻译的想法，到50年代欧美国家投入大量的人力、物力致力于机器翻译的研究，再到60年代ALPAC置疑报告的提出，机器翻译走向沉寂。学者们倾其大半生精力、商家投入为数可观的资金，经历五十多年不懈的研究和开发，得到的成果或者产品却常常不能令人满意。最近的二十年，随着语言学理论的发展、计算机技术的进步以及统计学和机器学习方法在自然语言处理领域中的广泛应用，人们对机器翻译本身的应用背景、目标等也有了更加准确的认识，机器翻译在此背景下取得了长足的发展，基于统计、基于实例等新的机器翻译方法也都是在这一时期出现，一些机器翻译系统也从实验室走向了市场。本文第二节介绍了机器翻译的历史现状；第三节介绍了机器翻译面临的问题；第四节介绍几种经典的机器翻译方法；第五节给出近期机器翻译的发展趋势，介绍基于混合策略的机器翻译方法，对统计机器学习在机器翻译中的应用进行总结；第六节讨论当前机器翻译的评测系统；最后，对机器翻译研究进行总结和展望。 2机器翻译的历史现状机器翻译的研究历史可以追溯到20世纪三四十年代。20世纪30年代初，法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年，苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器，并在同年9月5日登记了他的发明；但是，由于30年代技术水平还很低，他的翻译机没有制成。1946年，第一台现代电子计算机ENIAC诞生，随后不久，信息论的先驱、美国科学家W.Weaver和英国工程师A.D.Booth在讨论电子计算机的应用范围时，于1947年提出了利用计算机进行语言自动翻译的想法。1949年，W.Weaver发表《翻译备忘录》，正式提出机器翻译的思想。走过六十年的风风雨雨，机器翻译经历了一条曲折而漫长的发展道路，学术界一般将其划分为如下四个阶段： 2.1机器翻译的开创期（1947-1964） 1954年，美国乔治敦大学（GeorgetownUniversity）在IBM公司协同下，用IBM-701计算机首次完成了英俄机器

一个汉英机器翻译系统的设计与实现.doc

一个汉英机器翻译系统的计算模型与语言模型* 刘群+詹卫东++常宝宝++刘颖+ (+中国科学院计算技术研究所二室北京100080) (++北京大学计算语言学研究所北京100871) 摘要：本文介绍我们所设计并实现的一个汉英机器翻译系统。在概要介绍本系统的主要目标和设计原则的基础上，着重说明系统的计算模型和语言模型，最后给出实验结果和进一步的打算。关键词：自然语言处理机器翻译中文信息处理一、引言我国的机器翻译研究近年来取得了很大的发展。特别是英汉机器翻译系统的研制已经取得了较大的成功，达到了初步实用的阶段。相对而言，汉英机器翻译的研究却进展比较缓慢，离实用化还有相当的距离[1]。我们的目的是利用目前最新的计算机软件技术、相对成熟的机器翻译方法和先进的汉语语法理论，构造一个初步实用的汉英机器翻译系统。本文将对我们所开发的系统所采用的计算模型和语言模型作一个总体性的介绍，而不涉及过多的细节。下面我们简要介绍一下本系统的几个主要设计原则： ⑴采用成熟的技术我们的目的是构造一个真正实用的汉英机器翻译系统，因而在可供选择的若干技术路线面前，我们将尽量选用比较成熟的技术，而在现有技术难以解决问题时再尝试一些新技术。 ⑵开放的体系结构开放的体系结构主要体现在系统的实现上所采用的软件构件技术[8]。整个系统采用一些相对独立的软件构件组成，因而可以方便地对系统进行修改、维护和扩充。翻译的过程严格按照独立分析、独立生成的原则进行组织，每一阶段的算法相互独立，对其中一个阶段算法的修改不会对其他算法造成影响。 ⑶方便的调试环境本系统强调为语言工作者提供一个方便的调试环境。系统提供多窗口图形界面的知识库调试工具，支持课题组中多人同时通过网络对一个知识库进行操作。提供对翻译过程直观显示，用户可以清晰地看到翻译过程的每一步操作。提供翻译出错原因查找机制，用户 *本项目的研究受到863-306资助，合同号为863-306-03-06-2

机器翻译的自动评测技术 机器翻译技术