如何利用语料库辅助语言教学与研究(BNC)

如何利用语料库辅助语言教学与研究(BNC)
如何利用语料库辅助语言教学与研究(BNC)

如何利用语料库辅助语言教学与研究(BNC)

一、绪言

语料库是专门用于语言材料检索和统计的工具,包括为某一目的而收集的大量电子文本(加标注或未加标注)和专门的语料检索和管理程序。其最大的特点是能快速提供大量真实的语言材料并进行相关统计(如词频和搭配词等),已广泛运用于词典、教材、语法书和词汇表等的编纂及语言研究中。然而,语料库在日常外语课堂教学和学生自主学习中并没有得到广泛运用,至少在中国是如此。这一方面是由于对语料库在教学中的运用缺乏有力推广,加价格、市场等因素使得购买商用语料库有难度,自己建设语料库又需花费较大精力,另一方面人们对如何获取网上免费语料库资源缺乏了解。

语料库在日常英语课堂教学和学生自主学习中能够起到多种作用。作为一种高效的语言检索工具,它所提供的大量真实语言实例能提示从构词、词短语到句法结构乃至语篇几乎所有语言单位的语言生态(language ecology),包括语境、搭配规律、使用频率、语义和语用等。语料库的获得和个人建设虽然面临诸多困难,但幸运的是,开放的互联网为广大英语教师和英语学习者提供了接触和使用语料库的机会。

二、网络语料库的运用

1.英语单语语料库

目前,语料库运用于日常英语课堂教学的主要还是英语单语语料库,互联网上的情况也是如此。网上有许多大型通用语料库(单语)提供在线检索,其免费服务虽功能有所限制,但已能满足中学英语教学和学生自主学习的需求。如1亿词次的英语国家语料库(BNC)()和5600万词次的柯林斯在线词库(Collins Wordbanks Online)(www. Collins. https://www.360docs.net/doc/614814301.html,/corpus/CorpusSearch.aspx)。二者均是当今较权威的英语语料库,其语料语域广泛,有较好代表性,且均做了词性赋码(Part-of-speech tags)。这些在线检索提供通配符功能(wildcard)、连续和非连续的词组或搭配检索功能(word combination),并能指定检索词词性,功能强大,检索方便,可在日常中学英语教学中加以运用。

1)提供语用实例

语料库在线检索在日常英语课堂教学中最常见的用途是提供大量典型语例。当传统方法(如词典)无法提供足够的典型例句时就可检索网上语料库。如“wet”一词语义很丰富,而其动词用法在教学中关注不多,词典也没有提供足够的语用信息。利用以上语料库在线检索(此处指柯林斯,检索表达式为“wet/VERB”,详细用法参见检索页使用说明),便可呈现它作动词时的大量语用实例,下面是部分检索行实例(concordance line)(经过整理):

对于词汇的某一具体用法,如该词的“wet the / one’s bed”,词典就更缺少语用信息。为了解其实际使用状况,如语境、使用频率等可用该结构做检索词进一步检索,通过大量真实的语例使学习者感性地认识到本族语者确实广泛地使用该用法,这能提高学习者语言输出的信心和质量。下面是从柯林斯检索获取的部分例子:

(1) Even dry children may wet the bed under stress, like a change of school, a divorce or moving house.

(2) 1982 found that one-third of normal 3-year-olds still wet three or more times a week.

2) 揭示搭配规律

展示语言搭配规律是语料库最主要的特色。搭配也是目前中学英语教学中常常被忽视的地方,这和教师对语言的认识、对搭配的敏感程度及自身拥有的搭配能力密切相关。语料库的运用正好能提供大量的搭配信息,弥补英语非母语教师搭配能力的不足。其呈现形式也有助于提高教师和学生的搭配意识

语料库辅助的大学英语词汇教学初探

语料库辅助的大学英语词汇教学初探 发表时间:2012-08-30T09:32:30.327Z 来源:《时代报告》2012年第6期作者:毛晓迎[导读] 因此,教师在语言教学中应该推广并充分利用网络中的可用语料库资源。 毛晓迎(武汉科技大学外国语学院,湖北武汉 430065) 中图分类号:H319.3 文献标识码:A 文章编号:1033-2738(2012)06-0063-01 摘要:分析了语料库的辅助大学英语词汇教学的的必要性和可行性,认为本族语语料库和学习者语料库相结合,可以促进学习者词汇搭配、词义以及词汇语义韵等方面的学习,满足教师课堂词汇教学的需要,提高学习者的词汇能力,提高大学英语词汇教学和学习的效率。关键词:语料库;英语词汇教学;词汇能力 一、引入 词汇是标志外语学习者语言能力的核心成分之一,语言的习得和运用离不开词汇的积累和灵活掌握。学习者只有掌握了足够的词汇量才能理解他人的话语或文章,才能通过口头或书面等方式表达自己的所思和所想。反之,则会影响正常的语言交际。由此可见,词汇教学是外语教学中的一个必不可少的重要环节,起着举足轻重的作用。 二、关于语料库 根据欧洲语料库语言学的开拓者辛克莱尔( J. Sinclair)的定义,语料库( Corpus) 是指为研究语言,用计算机处理和储存的书面和口头的语言材料(吴耀武, 2009)[2] 。语料库作为一种辅助性工具应用于语言教学中,还属一个新兴领域。随着计算机辅助语言教学( Computer AssistedLanguage Learning) 的不断发展,语料库的使用正渐渐普及,以计算机为基础的语料库的产品越来越丰富,为语言教学提供大量鲜活、客观的教学资源,尤其为词汇教学提供了直观、科学的教学依据,能够快捷、准确地提供与某一关键词有关的大量真实语料,以全新的方式促进了外语教学与研究的发展,使人们更加认识到语料库在现代外语教学中正发挥着越来越重要的作用。因此,教师在语言教学中应该推广并充分利用网络中的可用语料库资源。 三、语料库在英语词汇教学中的应用 一般来说,传统的高职英语词汇教学是泛讲,往往脱离一定的上下文语境而孤立的谈某些词汇现象,不是选择对有代表性的词汇进行详细讲解。以往对某一单词进行讲解,所涉及到的主要内容大多是词典里面对该单词解释的繁杂罗列,包括单词的发音、拼写、词性、固定搭配、例句等基本信息。毫无疑问,这些信息是学习一门语言必须要掌握的基础知识,具有重要意义。 四、BNC和CLEC辅助词汇学习的必要性和可行性 BNC中的1亿词汇基本涵盖了人物、文学、体育、科学、军事、经济、政治、艺术、航天以及其他学科领域的高频词汇。学习者可以检索并在同一个语义场丰富的语料输入中学习与目标词(target word)相关的搭配、文体和语用等知识。可以充分缓解教学内容繁多与课时不足的矛盾,提供给学生大量的语言事实并营造真实的语言环境,弥补教师凭借自己直觉经验来讲解词汇的不足,从而减少学习者的语言失误;同时更重要的是BNC中大量真实的语言有利于培养学习者的预感。 五、CLEC和BNC辅助英语词汇学习 众所周知,教师经常在课堂上能否为学生举出比较适合英语习惯的、鲜活的英语例句而发愁。另外,一个主要的问题是:仅仅用课堂上有限的例句来让学习者全面掌握词的不同词义、搭配等知识可能性不大。因此,在课堂的英语词汇教学中,教师很有必要采取“预防”措施,即从CLEC中检索出已经标注好的语料分析归纳不同水平英语学习者(如大学英语四、六级以及英语专业)经常犯的词汇拼写和搭配错误,对这些高频语言错误反复强调和训练,然后,通过检索BNC归纳要学的目标词搭配和语义韵等知识,通过大量的例子让学习者逐渐学习不同词汇的各种知识。 (一)词汇搭配的学习。 词汇搭配是大学英语学习的重点和难点之一,在这方面,CLEC和BNC语料库为我们提供了有效探索词汇教学的途径。例如,在词序方面,这样的词序往往困扰一些学生,“such+a/an+形容词+名词”与“so+形容词+a/an+名词”,运用这两种语料库我们可以轻而易举地解决这个问题,只要在BNC或CLEC的查询框中键入“such(a/an)”或so,我们可以得到大量的包含这一结构的样句。表 BNC中检索出的部分语料 (二)语义韵的学习。 语义韵(semantic prosody)是Sinclair借用Firth的“音韵”(prosody)一词而新创的一个专为语料库语言学研究使用的术语。Firth 首先使用prosody这个词来表示跨音段语音色彩。而“语义韵”则表示超越词界的联想色彩。跨越词界的联想色彩主要是指词义的感情色彩。感情意义指词语的褒贬色彩,如statesman(政治家)和politician(政客);修辞意义指的是词语的委婉、夸张、讽刺、戏谑等色彩,如die (死亡)可以说成是pass away(逝世)或go to the west(上西天)等,one's wife(妻子)可以戏谑地说是one's better half(较好的那一半);动词cause(导致,造成)搭配使用的词群,发现该词染有较强的“贬韵”,充当其宾语的往往是accident,concern,trouble,damage,death之类的词。但是好多中国英语学习者经常把cause和表示褒义的词联用,例如,cause my sensation,cause a good result 等。通过分析CLEC中的有关cause的语料就可以知道学习者对该词语义韵的掌握情况,然后教师通过检索BNC中相关的搭配,分析并且归纳常出现在cause之后的名词,让学习者知道cause后面经常接表示“后果”而非“结果”的名词。 语料库辅助的英语教学为教师课堂词汇教学提供了丰富、真实的语料,教师可以通过这些语料归纳总结,和学习者语料库中的语料进行对比,找到学习者经常出现错误的原因,进行对症的单词教学。而且语料库使用比较方便,学生在课后可以直接在线检索并接触语料库,直接接触现代真实的语言信息,学生会感到事业宽阔,有如在外语海洋里畅游。

语料库翻译学_问题与展望_龙绍赟

江西社会科学2012.12 244 语料库翻译学:问题与展望 ■龙绍眖语料库翻译学在汲取语料库语言学、描写性译学及其他相关学科营养的同时,不断丰富和发展自己的研 究内容和研究方法,颠覆了传统译学的研究方法,形成了自己独特的研究对象,拓展和深化了翻译学研究的外延和内涵。然而,语料库翻译学研究也存在内容上的缺陷。因此,未来的语料库翻译学研究应紧密结合翻译学的跨学科属性,构建并完善语料库翻译学的理论体系,发挥其方法优势,突破自身的缺陷,实现其发展预期。 [关键词]语料库翻译学;跨学科属性;代表性;应用文体;深度与广度 [中图分类号]H0[文献标识码]A[文章编号]1004-518X(2012)12-0244-05 龙绍眖(1969—),男,江西师范大学外国语学院副教授,硕士生导师,主要研究方向为语料库语言学。(江西南昌330022) 20世纪以来,描写性译学悄然兴起,语料库语言学蓬勃发展。20世纪90年代,以英国曼彻斯特大学翻译与跨文化研究中心Mona Baker为代表的一批学者相继将语料库应用于翻译学研究,开启了全新的译学研究范式—— —语料库翻译学。语料库翻译学注重实证研究,强调数据统计与理论分析的有机结合,主张从大量翻译事实或现象出发,在对获取数据进行统计分析的基础上来阐明翻译本质、翻译过程、翻译策略及翻译活动的制衡因素,有效地弥补了定性研究的缺陷与不足。短短十几年的发展,语料库翻译学已逐渐形成自己独特的研究领域,并发展为翻译研究领域不可或缺的学科。但语料库翻译学研究在技术层面、研究方法、研究广度和深度等层面还有很多不足,本文就此提出一些建议与策略。 一、语料库翻译学的发展概况 语料库翻译学,指以语料库为基础,以真实的双语语料或翻译语料为研究对象,以数据统计和理论分析为研究方法,依据语言学、文学和文化理论及翻译学理论,系统分析翻译本质、翻译过程和翻译现象等内容的研究。[1]语料库翻译学最早由Mona Baker于1996年正式提出[2],Tymoczko将该领域的研究命名为“Corpus Trans-lation Studies”(语料库翻译学研究)。[3]语料库翻译学是语料库语言学和描写性译学相互影响、相互结合的产物。Sara Laviosa认为:语料库语言学和翻译研究的结合形成了“一种连贯的、全面而丰富的研究范式。该范式涉及翻译理论、描写和实践等方面的问题,业已成为当代描写性译学研究的新范式”。[4]相应的,语料库翻译学具有这两个研究领域的特征,即语料库方法的运用与注重描写与实证。[1] 语料库翻译学已成为语料库翻译学区别于传统译学研究不可或缺的研究领域。译学研究语料库的建设应属语料库翻译学的研究内容之一。不同于以学者直觉和

语料库辅助的词汇教学

语料库辅助的词汇教学 《普通高中英语课程标准(2003)》提倡词汇教学应为学生创设一些运用的语境,并提供语言支持,使学生在运用中加深理解,学会运用。语料库特有的语境共现界面能够批量地呈现目标词的使用语境,由此带出由目标词与周围的词共建短语词块的词汇搭配范式、语法范式、语义功能以及语用功能等,使词汇教学落实到深层知识的理解和应用。 高三学生在每次月考中反映困难最大的就是词汇问题:生词太多或者对熟悉的词的新含义不了解。针对这一现象,研究者从2012年9月高三开学起,手工加工学生正在学习的模块10的语料库,在学生学习每个单元的前后利用课文语料库使目标词汇在学生眼前多次重现,达到对词汇深层理解。具体做法如下(以模块10第一单元Reading为例): 1)要求学生上新课前预习Reading部分的生词和课文。 2)把Reading部分语料库中的所有生词用“________”代替,并打印出来,在上新课前让学生用5-8分钟练习。下面举其中的第一段为例: Teach a man to fish In 1985, there was little 1____________ in Ethiopia, which led to poor harvests and the death of many of the country’s cattle. The 2____________ of the situation shocked Bob Geldof, an Irish musician, so he organized a charity concert called Live Aid to raise money for victims of hunger in 3_____________. The concert took place on 13 July 1985 in two places---LondonandPhiladelphia---and included the biggest stars of the time. Geldof intended the concert to raise money for hunger relief and to make the public more aware of the problem. In the end, $100 million was raised, which was used to buy food and to provide help with development projects inEthiopia. The concert also made the 4____________ around the world, and 5_____________________ 6______________ and 7_____________ to do something about the problem of world hunger. 说明:如果学生在没有任何提示的情况下完成该练习有困难,可以把所有生词打乱顺序摆在练习的最上端供学生选择。 3)学习完该单元后,再针对学生在学习过程中的遇到的重点和难点词汇、短语,重新设置“________”进行练习,达到词汇在正确的使用语境中重复练习的目的。 三、结语 由于研究者经验不足和能力有限,《牛津高中英语》教材语料库的建设和应用还存在以下问题:

基于语料库语学的英语词汇教学.doc

基于语料库语言学的英语词汇教学- 传统的语言学把词汇分成可以借助语法规则进行自由组合的单词和不能用语法规则解释的固定短语,因此传统上的词汇教学即指单词教学(蒋利,2003)。我国传统的词汇教学主要以词义驱动为主,学生往往只通过机械记忆单词或短语的形式及与其对应的中文意思来扩大词汇量(刁琳琳,2004)。教师在备课及授课过程中也很少涉及词块、搭配、语用规则和语义韵等较深层次的内容。而当把学生已机械记忆的单词放进具体语篇时,学生在理解和应用上都会出现问题。因此,在教学实践中,如果将语料库方法引入词汇教学,有助于区分词汇学习的不同层面及意义类型,并能切实改进词汇教学效果。 一、用语料库方法教授词汇的搭配、类联结与语义韵 卫乃兴(2001:100)将词汇的搭配定义为:在文本中实现一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。词汇学习不是简单地记忆单词的读音与拼写,不了解词汇的搭配范围就很难真正习得了这些词汇,因此,词语搭配是词汇学习及研究的重点。类联结是发生于词语搭配中的语法结构和框架,因此它较之词汇搭配更抽象一些。甄凤超(2005:19-28)指出通过建立类联结,我们可以发现词汇的语法模式,并且词汇与语法密不可分。语法形式和词汇行为相关,并和意义发生联系。关于语义韵,卫乃兴(2002)指出词项的搭配行为显示一定的语义趋向即一定的词项会习惯性地吸引某一类具有相似语义特点的词项,构成搭配。由于这些具有相同语义特点的词项及其搭配在文本中高频共现,整个语境就弥漫了某种语义氛围,这种氛围被称

作语义韵。语义韵概念的引入对于区分同义词或近义词能起到很好的解释作用。由于受篇幅限制,本文主要探讨基于语料库语言学的词汇搭配教学。 二、语料库在词汇搭配教学中的应用 近年来语料库语言学发展迅速,基于语料库的搭配研究越来越被重视,逐步成为语言研究与教学的重要领域。在语言教学中引入索引工具,让学习者从大量的地道真实的语料中考察词语的搭配模式,有利于提高学习者的搭配水平、语言使用能力和自主学习能力。现以make和have为例讨论学习者通过接触真实语料,可以分析不同搭配在文体以及句法等方面存在的差异。首先使用AntConc检索工具从COCA和BNC中搜集部分与make和have搭配的常见词。如表2.1所示: 英语动词make的核心含义为制造,然而事实证明只了解单词的汉语意义显然不够,对以它们为中心词的各种搭配进行分析能促进学生更好地掌握其语义及使用差异。根据表格我们可以观察到如make后常跟change / corrections / comment / contribution / decision / effort / excuse / friend等。动词have的核心含义之一为经历,与其搭配频率较高的名词有accident / argument / break / conversation / difficulty / dream / experience / good time / problem 等。词汇教学中引入语料库方法,可以有效帮助学生掌握词汇的不同搭配更好地理解词之间的语义差异。学会并灵活使用大量的搭配词语有助于全面提高语言学习效率及应用能力。 三、结语 利用语料库工具辅助英语词汇教学具有重要意义。首先,提供给学生大量真实语料,营造真实语言环境,能够保证学生语言输入的质量;其次,用语料库检索工具使关键词在其索引行中

Corpus Linguistics and Translation Studies Mona Baker 1993 语料库翻译学文献

Corpus Linguistics and Translation Studies Implications and Applications Mona Baker Cobuild, Birmingham Abstract The rise of corpus linguistics has serious implications for any discipline in which language plays a major role. This paper explores the impact that the availability of corpora is likely to have on the study of translation as an empirical phenomenon. It argues that the techniques and methodology developed in the field of corpus linguistics will have a direct impact on the emerging discipline of translation studies, particularly with respect to its theoretical and descriptive branches. The nature of this impact is discussed in some detail and brief reference is made to some of the applications of corpus techniques in the applied branch of the discipline. 0.Introduction A great deal of our experience of and knowledge about other cultures is mediated through various forms of translation, including written translations, sub-titling, dubbing, and various types of interpreting activities. The most obvious case in point is perhaps literature. Most of us know writers such as Ibsen, Dostoyevsky and Borges only through translated versions of their works. But our reliance on translation does not stop here. Our understanding of political issues, of art, and of various other areas which are central to our lives is no less dependent on translation than our understanding of world literature. Given that translated texts play such an important role in shaping our experience of life and our view of the world, it is difficult to understand why translation has traditionally been viewed as a second-rate activity, not worthy of serious academic enquiry, and why translated texts have been regarded as no more than second-hand and distorted versions of …real? text s. If they are to be studied at all, these second-hand texts are traditionally analysed with the (233) sole purpose of proving that they inevitably fall short of reproducing all the glory of the original. A striking proof of the low status accorded to translated texts comes from the young but by now well-established field of corpus linguistics. A recent survey commissioned by the Network of European Reference Corpora, an EEC-funded project, shows that many corpus builders in Europe specifically exclude translated text from their corpora.1 This

语料库检索分析在高级英语语篇教学中的应用_语料库检索

语料库检索分析在高级英语语篇教学中的应用_ 语料库检索 语料库检索分析在高级英语语篇教学中的应用_语料库检索摘要语料库语言学通过对自然文本的检索、统计,实现文本的语篇结构、文体风格、语言特征等的量化分析。语料库软件工具如Wordsmith、Concordancer软件等为语篇教学提供了量化分析手段。本文依据语料库语言学的研究方法,主要运用Wordsmith、Antconc软件,以课文"Blackmail"为小型教学语料库,探索高级英语语篇教学的新途径。 关键词语料库检索分析;高级英语;语篇教学1.引言高级英语是英语专业高年级阶段的一门主干课程,其教学目标是"通过阅读和分析内容广泛的材料,扩大学生知识面,加深学生对社会和人生的理解,培养学生对名篇的分析和欣赏能力、逻辑思维与独立思考的能力,巩固和提高学生英语语言技能"1。鉴于此,围绕高级英语课程的教学研究与改革长期以来备受专家、学者和广大师生的关注,如朱传枝2、杨志亭3、刘采敏和楚向群4、李洁平5、黄文英6等。十多年来,随着语言教学理论研究的深入以及计算机网络和多媒体技术的快速发展,高级英语课程改革成绩斐然,教学效果显著提高。然而,在语篇教学中不难发现,由于缺乏科学的文本分析手段和工具,学生对语篇的分析和欣赏"多来自

教师在反复阅读全文的基础上根据某种理论框架或自身独特的理解能力及审美取向所做的解释"7,或者依赖于教学参考书籍上的注解,学习效果大打折扣,成为了困扰教师的一大教学瓶颈。语料库语言学的出现为高级英语语篇教学提供了有力的理论和技术支持,对于解决教学中存在的难题有着重大的启示和意义。 2.语料库与语料库检索分析软件的应用20世纪90年代以来,语料库语言学的迅速发展"给语言研究以及语言应用研究带来了一场革命性的变化"8,而"基于语料库的研究方法已经逐渐扩展到语言教学、话语分析、翻译研究、词典编纂和自然语言处理等多个领域"9。语料库语言学以真实的语言数据为研究对象,通过对大量语言事实进行分析,寻找语言应用的规律和模式。由于语料库研究中的统计数据以实际使用中语言现象的出现概率为依据,且基于语料库而得到的数据避免了偶然性,从而提升了分析结果的可信度。 因此,语料库语言学为语言研究和教学提供了一种全新的模式。 随着计算机信息技术的日新月异,语料库为语言研究提供了空前广泛的语言资料。目前,国际上影响较大的语料库有英国COBUILD语料库(CollinsBirminghamUniversityInternationalLanguageDatabas e)、BNC英语国家语料库(TheBritishNationalCorpus)、CIC 语料库CambridgeInternationalCorpus、ICE语料库

语料库翻译学研究内容

研讨五语料库翻译学 1. 什么是语料库翻译学? 2. 语料库翻译学的理论基础? 3. 语料库翻译学的研究内容? 4. 什么是翻译共性? 根据研究课题的来源,语料库翻译学的研究领域分为三类。 第一类源自传统译学研究,包括基于语料库的文学翻译、翻译史、翻译教学、翻译实践、机器翻译和口译等领域的研究。 基于语料库的文学翻译研究以文学翻译作品的文本分析为基础,研究文学翻译理论与实践的相关课题。这些课题具体为: 1) 意象和人物形象的再现与变形,2) 文学风格的再现与重构,3) 文学翻译的创造性,4) 译者风格,5) 文学作品空白和未定性的翻译,6) 文化负载词的翻译,7) 误译和漏译研究。 基于语料库的翻译史研究利用历时性平行语料库对名家译作进行文本分析,揭示翻译家在翻译策略应用、翻译风格和翻译语言等方面所表现出的个性特征及其所遵循的翻译规范。目前,翻译史研究大多将翻译家的观点或言论视为客观现实,满足于翻译事实的罗列,对于翻译规范和历史语境关注不够。事实上,翻译家的所做与所言往往不一致,翻译家所言并不能反映其翻译作品的特征。此外,翻译是一种特殊的社会文化行为,受特定规范的制约。这些规范因时代或文化的差异而不同。利用语料库分析翻译文本的具体特征,归纳不同历史时期的翻译规范,可以阐明翻译家的所作所为,还原历史的真实面貌。另外,该领域的研究还通过提取语料库的篇头信息,对于具体某一历史时期的翻译活动进行客观描述。这些信息包括出版商、出版时间、作品主题、译者姓名和性别等内容。应当指出,语料库翻译学与翻译史均强调对研究对象进行客观描写,重视还原语境方法( contextualization) 的应用。这些共性为语料库在翻译史研究中的应用提供了作为空间。 以上研究均属语料库翻译学理论层面的研究,而基于语料库的翻译教学、翻译实践和机器翻译研究都是应用层面的研究。前者侧重于探讨语料库在翻译评估、翻译教材编写和翻译教学模式中的应用,后者主要关注双语词汇和句式之间的对应关系、翻译策略和方法的应用等问题。基于语料库的机器翻译研究是指利用语料库的核心技术,建设具有海量信息的知识库,以满足机助翻译或自动翻译的需求。 基于语料库的口译研究侧重于分析口译语料词汇、句法和语篇等层面的特征,研究口译语言特征、口译规范、口译策略和方法等。该领域的研究是综合性研究,既有理论层面的探讨,也有实践层面的分析。 第二类研究领域源自描写性译学研究,涵盖翻译共性、翻译规范和批评译学等领域的研究。 翻译共性是指由于翻译过程而形成的翻译文本所具有的区别于原创文本的特征,与源语和目的语之间差异无关,具体表现为显化、隐化、简化和范化等。翻译规范是“译者在具体时间或社会文化环境中所做出的规律性或习惯性选择”。“翻译规范是关于翻译作品和翻译过程正确性的规范,体现了具体某一社会或历史时期关于翻译的价值观和行为原则”。翻译规

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

基于语料库的海明威作品《雨中的猫》分析

基于语料库的海明威作品《雨中的猫》分析 ——以写作风格和小说主题为例 王树振 (天津师范大学外国语学院,天津, 300387) 【摘要】美国著名作家厄内斯特·海明威的短篇小说《雨中的猫》(1922),自发表以 来便引起文学评论界的极大关注。在作品中,通过对一个日常生活片段的叙述,作者 揭示了女性生存困境的主题。而基于语料库的文学研究,则是通过利用语料库检索软 件来考察作者的写作风格、解读作品的主题。在前人研究的基础之上,笔者拟运用语 料库语言学的方法对这部小说进行更深入的研究。通过使用Wordsmith和AntConc等 语料库检索软件,笔者拟对《雨中的猫》进行词语、句子及篇章结构进行统计分析, 最后不仅能够分析得出海明威用词简单、句子简短的写作风格,还能利用关键词检索 和自动生成的语境,来了解小说的主要内容和人物形象的塑造,这为解读小说的主题 提供了新的研究方法和途径。 【关键词】语料库检索;写作风格;主题 近年来, 国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件对文本进行分析, 如Sinclair(1991)、Biber(2000)、张厚振(2004)、肖普勤(2005)等。他们的研究大胆创新,为后来的文学研究者带来很大的启示。正如Sinclair(1991: 36)所论述的那样,“(语料库检索)最激动人心的方面不是对描述进行直观的分类,而是为找到新的方法、新的证据以及新的描述提供可能。在这里,计算机技术的客观性和表面的正当性变成了一种优势,而不是没有放弃直觉前提下的一种责任。当然,我们要尽力找到符合证据的解释,而不是为了迎合现有的解释而去修改我们的证据。” 《雨中的猫》是美国著名小说家海明威的著名短篇,故事情节主要围绕一只雨中的猫展开,叙述了旅居意大利的一对美国夫妻的一段生活场景。本文用Wordsmith及AntConc的Wordlist、Concordance和Keyword对《雨中的猫》的文本特征、主要内容、人物形象和文本主题进行分析,以展示语料库检索软件在文学分析方面的强大功能。 一、基于词表的文本总体特征分析 基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对文本的基本信息进行统计,自动生成词表(图1)。它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。

双语对应语料库翻译教学平台的应用初探_王克非

语言技术与外语教学研究 *版权所有 文责自负* 双语对应语料库翻译教学平台的应用初探 王克非1 ,秦洪武2 ,王海霞 2 (1.北京外国语大学中国外语教育研究中心,北京 100089;2.曲阜师范大学外语学院,山东曲阜 273165) 摘 要:本文通过语料呈现实验探讨双语对应语料库翻译教学平台的应用效果。实验显示,学生在观察语料后能够归纳和总结出有意义的翻译技巧,并能据此评估或反思自己的翻译行为。实验表明,在翻译课堂教学中使用语料资源有助于自主学习和发现式翻译教学环境的创建,也有助于学习者形成 稳定的翻译技巧。 关键词:对应语料库;翻译教学;发现式学习;语料呈现中图分类号:H 319.3 文献标识码:A 文章编号:1001-5795(2007)12-0003-0006 近20年来,语料库的创建和应用取得了长足发展。对应语料库大都在上世纪九十年代开始创建,起步较晚,但已展现出广阔的应用前景。在欧美,这类语料库有十多个,涉及近20个语种,如H ansard(法-英对应语料库)和ENPC (英语-挪威语对应语料库)(V ron is 2000:14-15);在中国,有中科院计算所的大规模汉英对应语料库、北京大学的/B ABLE 汉英平行语料库0,以及北京外国语大学的/通用汉英对应语料库0(该库现有可检索语料2千万字/词以上,见王克非2004a),后者是本项研究使用的主要工具。对应语料库的创建有两个主要目的:一是用于语言与翻译研究,二是用于外语教学。用于前者的研究成果丰富,涉及语言对比、双语词典编纂和翻译研究(Lav i o sa 1997;Baker 1999;Serpellet 2000;H unston 2002)。用于后者尤其是用于翻译教学的研究也已取得不少成果,如Zanetti n 1998、Pearson (2003:15-24)和Bernardini (2004b :97-111),但大都研究平行语料为翻译训练提供的可能的资源和手段,还没有研究探讨大型对应语料库在课堂教学中的实际应用问题。 1 研究内容 有关运用语料库提高翻译效率和质量的研究还没有全面展开,而将对应语料库应用于翻译教学的研究则是刚刚开始(Bo w ker 2003;Ber nardi n i 2004b)。从理 论上看,语料库用于教学有利于自主学习环境的创建(Bernardini 2004a :22;秦洪武、王克非2007)。自主性学习主要表现在两个方面:研究性学习和发现式学习(learning as discovery)。前者假定学习者和教师研究兴趣相投、研究能力相当;后者则鼓励学习者自行调节兴趣点,并给他们提供机会来提高自己观察和处理问题的能力,使他们对两种语言的特征和差异有敏锐的觉识。本文认为,研究和发现虽不矛盾,但在以技能培养为核心的翻译教学中,不宜过分强调学生的研究能力,发现式学习这一提法更合适一些。 近年来,国内也有研究关注语料库在翻译教学中的应用问题。有些研究探讨了语料库在翻译教学中的用途(郭红2004;于连江2004;王克非2004b),但还没有研究系统地探讨对应语料在课堂教学中的应用方式和应用效果,也没有研究关注学生对于语料使用的态度。鉴于此,我们以/通用汉英对应语料库0为翻译教学平台,探讨在现有技术条件下翻译语料用于翻译教 作者简介:王克非:男,教授,博士生导师。研究方向:语言学、翻译学。 秦洪武:男,教授,博士。研究方向:语言学、翻译学。王海霞:女,讲师,硕士。研究方向:翻译学。 收稿日期:2007-03-18 基金项目:本文是国家社科基金课题/基于大型英汉对应语料库的翻译研究与翻译教学平台0的阶段性成果(编号05BYY 013),并获得曲阜师范大学科研启动基金资助(编号Bsqd2007022)。 # 3#第118期2007年12月 外语电化教学 C AFLE N o .118D ec . 2007

方案-基于语料库语言学的英语词汇教学

基于语料库语言学的英语词汇教学 '基于语料库 学的 词汇教学 传统的语言学把词汇分成可以借助语法规则进行自由组合的单词和不能用语法规则解释的固定短语,因此传统上的词汇教学即指单词教学(蒋利,2003)。我国传统的词汇教学主要以“词义驱动”为主,学生往往只通过 记忆单词或短语的形式及与其对应的中文意思来扩大词汇量(刁琳琳,2004)。教师在备课及授课过程中也很少涉及词块、搭配、语用规则和语义韵等较深层次的内容。而当把学生已机械记忆的单词放进具体语篇时,学生在理解和 上都会出现问题。因此,在教学 中,如果将语本文由 联盟 收集整理料库方法引入词汇教学,有助于区分词汇学习的不同层面及意义类型,并能切实改进词汇教学效果。 一、用语料库方法教授词汇的搭配、类联结与语义韵 卫乃兴(2001:100)将词汇的搭配定义为:“在文本中实现一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。”词汇学习不是简单地记忆单词的读音与拼写,不了解词汇的搭配范围就很难真正习得了这些词汇,因此,词语搭配是词汇学习及研究的重点。类联结是发生于词语搭配中的语法结构和框架,因此它较之词汇搭配更抽象一些。甄凤超(2005:19-28)指出“通过建立类联结,我们可以发现词汇的语法模式,并且词汇与语法密不可分。语法形式和词汇行为相关,并和意义发生 。”关于语义韵,卫乃兴(2002)指出词项的搭配行为显示一定的语义趋向即一定的词项会习惯性地吸引某一类具有相似语义特点的词项,构成搭配。由于这些具有相同语义特点的词项及其搭配在文本中高频共现,整个语境就弥漫了某种语义氛围,这种氛围被称作语义韵。语义韵概念的引入对于区分同义词或近义词能起到很好的解释作用。由于受篇幅限制,本文主要探讨基于语料库语言学的词汇搭配教学。 二、语料库在词汇搭配教学中的应用 近年来语料库语言学 迅速,基于语料库的搭配研究越来越被重视,逐步成为语言研究与教学的重要领域。在语言教学中引入索引工具,让学习者从大量的地道真实的语料中考察词语的搭配模式,有利于提高学习者的搭配水平、语言使用能力和自主学习能力。现以make和have为例讨论学习者通过接触真实语料,可以分析不同搭配在文体以及句法等方面存在的差异。首先使用AntConc检索工具从COCA和BNC中搜集部分与“make”和“have”搭配的常见词。如表2.1所示: 英语动词“make”的核心含义为“制造”,然而事实证明只了解单词的汉语意义显然不够,对以它们为中心词的各种搭配进行分析能促进学生更好地掌握其语义及使用差异。根据表格我们可以观察到如“make”后常跟“change / corrections / comment / contribution / decision / effort / excuse / friend”等。动词“have”的核心含义之一为“经历”,与其搭配频率较高的名词有“accident / argument / break / conversation / difficulty / dream / experience / good time / problem”等。词汇教学中引入语料库方法,可以有效帮助学生掌握词汇的不同搭配更好地理解词之间的语义差异。学会并灵活使用大量的搭配词语有助于全面提高语言学习效率及应用能力。

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

语料库检索程序concapp使用简介

Wikipedia:语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。百度百科:关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。 Concapp由香港理工大学虚拟语言学习中心发布,是一款针对语料库的检索软件,主要支持英语语料的处理,汉语和日语语料的处理不够理想。 Concapp在英文科技论文写作中,可以帮助我们了解其他文献(尤其是native speaker的论文)中一些词的用法。 使用: 1.concapp只能处理txt格式的文档,首先应将所用文献由pdf转为txt。 2.Concapp无需安装,直接双击exe文件(小于1M)即可运行。

3.单击菜单栏concordance选项,单击concordance search(F5)。 或直接单击菜单栏下的图标(图中标黑框)。 弹出对话框

其中Unicode是使用双字节对字符进行编码的统一码。一般选择ANSI,单击OK。 弹出对话框 对话框中,在Search string栏输入检索词。 File栏:Open是对打开的文件进行检索,Directory则是对目标文件夹中的文件进行检索。Search Option栏:Word/phrase: 搜索单词和短语,Prefix:搜索前缀,Suffix: 搜索后缀,Any string: 搜索出现在任何位置 例如,输入检索词efficiency。单击OK

弹出对话框 从中可以选择文件。可以选择一个或几个txt文档,或者单击最下面的Select all matching files,从而选中该文件夹中的全部txt文档。 弹出窗口

相关文档
最新文档