美国当代英语语料库_COCA_的自主学习应用_方玲

美国当代英语语料库_COCA_的自主学习应用_方玲
美国当代英语语料库_COCA_的自主学习应用_方玲

1 引言

自20世纪80年代以来,基于语料库的语言学和语言教育研究愈来愈受到重视。语料库将大量语言使用者的语言直觉汇集起来,从而使语言分析更为客观。自然发生的语言数据的最大优势是可观察性和可检验性,基于语料库的观察本质上比内省式的判断更经得起实证检测(McEnery & Wilson,2001:14)。以其最大限度的取样及丰富性,语料库语言学的量化比经验主义语言学中的量化更有意义,在数据取得、数据丰富以及数据的自然性等方面具有优势(i b i d,131-2)。常宝宝和俞士汶(2009:43)将语料库定义为一定规模的真实语言样本的集合,其应具有以下三个特性:(1)收入语料库的语言材料取自实际使用的真实文本,对于其应用目标而言,所收录的语言材料应该具有代表性;(2)语料库应是机器可读的,是运用计算机技术获取、编码、存储和组织的,并支持基于计算机技术的分析和处理;(3)收入语料库的语言材料经过适当的标注和加工处理,例如经过词语切分或者词类标注处理。

近年来,外语教育中学习者逐渐在外语学习中处于主体地位,语料库作为一种辅助性工具应用于语言教学成为必然的趋势。曾用强(2002:33)认为利用语料库对语言的特征以及学习者的语言使用特征等方面作出分析,其分析结果可应用于指导语言教学的实践,如语言现象的分布和频率等信息可以用来指导教师确定教

方向。

2 美国当代英语语料库Contemporary American www. 国杨伯翰大学(Brigham Mark 语料库以及D a v i 2008)

D a v i e s (2005)指了一个好语料库的三项最(s i z e) 、速度(s p e e (a n n o t a t i on)。C O C 摘 要: 本主题词:COCA;语料库;自主学习;搭配

中图分类号:H319 文献标识码:A 文美国当代英语语料库(C O C 学习应用

方 玲 汪兴富

重庆大学

机配置而定,高达4.1亿词汇库容在8个2.4G H z 的服务器上同时计算,因此绝大多数查询都能在几秒内呈现结果;词性标注使用的是英语语料广泛采用的C L A W S7软件。C O C A已收集过去20年(1990年起)美国境内多个领域的语料,每年约2 000万词汇,并且每年还会进行至少两次的数据更新。目前其他免费公共英语语料库都不能很好地达到这样的要求。C O C A 涵盖美国这一时期的口语、小说、流行杂志、报纸和学术期刊五大类型的语料,并且在这五个类型方面基本呈均匀分布,在每五年的时段中也是基本均匀分布的。

依据D a v i e s(2005)做的C O C A与其他语料库的比较,我们不难看出C O C A语料库在各方面的优势(见表1)。

表1 COCA语料库与其他常见语料库比较

特色COCA BNC ANC BOE OEC

获取方式Free / web Free / web Free$1150/year(Limited)语料库规模(百万)40010022455 1 898

时间跨度1990—

2009

1970s—

1993

2000—

2005

1970s—20052000—2006

每年新增词数(百万)200000

能否观察英语实时变化Yes No No(Limited)(Limited)

语料类型广泛与否Yes Yes No(Yes)(Yes)

口语规模(百万)831046282

口语为无文本型的谈话(Mostly)Yes Yes(Some)(Some)

语言地域American British American Br / Am +Am / Br +

语料库界面BYU BYU*Open ANC Sketch Engine Sketch Engine *注:BNC还有Sketch Engine、BNCweb、VISL和PIE等界面。

语料库

要观察语言的实时变化,Davies认为语料库应该具有五个方面的条件:(1)语料足够大;(2)文本要新(越新越好);(3)各语域之间要平衡;(4)每年的语域应平衡;(5)具有能查各时段词频的界面,并且能在各时段间作词频比较。C O C A是唯一具备上述五项条件的,如D a v i e s所言,该语料库从一开始就旨在建成一个“窗口语料库”(m o n i t o r corpus),用于观察语言的历时变化。(汪兴富,Davies,2010)

3COCA的自主学习应用

本文的自主学习是指学习者不在教师的监督指导之下自发查阅校验所查询的语料库数据的学习活动。学习者可以进行以下丰富的语言查询以进行独立自主式的学习。

3.1 简单查询示例

在词汇学习方面,学生应该对积极词汇足够重视。积极词汇是语言中不需要多少刺激就可激活的高频心理词汇。被动词汇也是语言记忆中的词汇,是人们能部分理解,但却还不能积极使用的词汇(C o r s o n,1996:45)。词汇是语言的基石,掌握积极词汇的多少会直接反映学生的主观语言表达水平。教师可采用Head-and-Tail词汇练习方法去激活学生的被动词汇,最终将其转化为积极词汇(汪兴富,2002)。方法是随意开始一个词,然后要求学生用该词的最后一个字母作为第二个词的首字母,将第二个词的尾字母作为下一个词的首字母,以此类推,直至学生“词穷”为止,或设定练习的时间。如:meditate — establish —humorous — subway — yell — lucrative —... 等。可以给学生设定很多限定条件,如开始时可以不限单词长度,练习一段时间后要求写6个字母以上的单词,或限定所写单词的词性,如名词(甚至专有名词)、动词或形容词。也可以要求学生写合成词及自由搭配短语(非固定结构)等。

C O C A对该练习的辅助应用为:由于英语词汇有许多以e字母开头并且又以e字母结尾,因此学生可能会进入这样一个循环而不易跳出“e词带”的约束。在C O C A查询e*e.[n*](*是通配符wildcard,表示任意长度的字母串),可查到频率很高的e字母开头并且以e字母结尾的名词;输入e*e.[v*]可查到e字母开头并且以e字母结尾的动词,同样输入e*e.[j*]可查到e字母开头并且以e字母结尾的形容词。如果只输入e*e则可以查e字母开头并且以e字母结尾的任一词性词语。见表2所示。

表2作为示例,展示了该查询类型的前20个

如果学生希望陈述做得更专业一点,例如想获取与f l o w e r共现的生物学类的词汇,那么就需要使用到该语料库的互信息查询。互信息(mutual information)是信息理论中的—个基本概念,用于描述两个概念间的统计相关性,或者是—个概念中所包含的另—个概念中信息的多少。在以上查询flower条件不变的情况下,在S O R T I N G A N D L I M I T S下的S O R T I N G框中选R E L E V A N C E(框后会显示M U T I N F O),此时M I N I M U M框自动选定F R E Q U E N C Y为10,表示10个以上的出现频次才显示(也可以修改该值的大小),得到如下结果(见表4):

表4 COCA中名词flower的最大词距(-9,+9)内的互信息名词

序号名词TOT ALL%MI

1 pistil 14 67 20.90 9.22

2 stamen 3

3 20

4 16.18 8.85

3 Foxhall 10 67 14.93 8.74

4 petal 256 1 90

5 13.44 8.58

5 lobelia 10 108 9.2

6 8.05

6 nectar 62 780 7.95 7.83

7 arranger 18 239 7.53 7.75

8 phlox 12 232 5.17 7.21

9 buttonhole 10 201 4.98 7.15

10 pollinator 18 392 4.59 7.04

11 chrysanthemum 15 341 4.40 6.97

12 dahlia 23 571 4.03 6.85

13 aster 16 398 4.02 6.84

14 bumblebee 10 252 3.97 6.83

15 pollen 64 1 681 3.81 6.77

16 pollination 13 346 3.76 6.75

17 hibiscus 11 345 3.19 6.51

18 bud 153 4 892 3.13 6.48

19 carnation 13 450 2.89 6.37

20 florist 23 822 2.80 6.32

该表第1行的信息分别是:T O T表示该词在最大为9的上下文词距中出现的频次;A L L 表示该词在C O C A中的总频次;%表示T O T和ALL的商,MI为该名词与目标词(flower)的互信息值。以上结果不管从词长还是词的相对低频(仅p e t a l和b u d属于单纯词频查询的前20位词汇)均可看出该查询结果所得到的词语属于专业性较强的词汇,激活的要么是上义词,要么是下义词,或者是同级词汇。查读这些词汇能有效激活学生相关方面的概念,对于相关的专业知识陈述有很大帮助。

另外,教师可以运用C O C A帮助学生掌握常见词搭配,如中国学生经常做的命题作文涉及的success、pollution、education、crisis、skill、pressure、development、ability等概念,都可以在C O C A中进行如上方式的头脑风暴式的多条件查询,以开阔视野、激活知识点和寻求表达方式与内容的多样化。

3.3 语义查询

桂诗春教授主持的 “中国英语学习者语料库” (Chinese Learners’ English Corpus) 是国际上首部公开发布的学习者语料库,该研究发现中国学生的对数词型/词次比(log type / token ratio)、平均词长、平均句长、常用词和超用词(overused words) 的使用等都和以英语为母语的人不同。前者掌握的词型要少,但使用率要高,很多常用词都成为超用词(曾用强,2002:33)。

超用词现象在学习者所犯的错误中非常普遍,究其原因之一是因为使用者对相关词汇掌握不够,在话语情景中无法激活同一概念的同义词、近义词或反义词,因而出现对某些词的过度依赖。学生最先掌握的常用词很可能升格为“原型词”,即由于先入为主的缘由而使得其他更符合表述的词汇变成了边缘词汇。

在言语失误的分析方面,按失误的类型看,居于前四位的词形、词汇、句法和动词词组的失误率加起来占了所有失误的一半。除词汇外,其他三项均是随着学习水平的提高而递减。(曾用强,2002:33)也就是说词汇失误是学习者的一大痼疾,无法轻易改变。王沁在“语言迁移中词汇失误的语料分析”一文中对英语专业八级考试(T E M-8)试卷中翻译题错误类型进行分析,得出考生们所犯错误数量居于首位的便是词汇失误,并举例分析了失误频次较高的四种类型——词类失误、替代型失误、冗余型失误、选用一一对应中文词汇。但细数

语谚语在C O C A中的使用情况,对谚语的熟识度、活用度进行了研究,分析了用于激活语义的谚语框架(semantic frame),从而给学习者提供活用用法信息,指导其正确合理使用英语谚语。

以下是C O C A中部分谚语活用例子,通过逐项查询原型和变体谚语在语料库中的频次得到如下结果:

a. An apple a day keeps the doctor away.

用法:原型使用11次;变体使用an apple a day符合该定义的却有20次。

b. A friend in need is a friend indeed.

用法:原型使用仅2次;变体使用a friend in need的有12次,变体使用friends in need的有9次。

c. Birds of a feather flock together.

用法:原型使用8次;变体使用35次;变体通常仅使用birds of a feather部分。

d. Where there is a will there is a way.

用法:原型使用8次;变体使用10次,变体多表现为仅使用there is a will。

e. Leave well enough alone.

用法:原型使用92次;变体使用leave bad enough alone的有3次;使用leave good enough alone的有1次。

该研究还对每一常见谚语的活用进行概括分析和归类,并对谚语出处进行上下文考察,以分析所出现的语言体裁等信息。在语料库中检测谚语能告诉使用者谚语的语用意义和语用倾向。因此结合真实语料库对谚语进行研究有其很大的价值和意义,对谚语单纯而孤立的分析与评价只能是研究者的内省结果而非现实语言展现。

4结语

C O C A是一个英语本族语者的语料库,是用法相对规范的语言范例的集合;而学习者语料库则主要是对学生的语言表现进行查缺纠错。因而使用本族语语料库能对学习者起到良好的指导作用,学习者语料库的使用对象应该是教师和研究者,但本族语语料库的使用者却可以直接是学习者。如上所述,基于该语料库可以帮助学习者培养自主学习能力、提高语言知识和丰富英语文化知识。由于C O C A的收集语料的局限性,因此对有的词语查询不能很好地反映用法,如在语言学习中经常提到的native-like概念在COCA中只有1项,而在G o o g l e中却可以检索出154 000余条,这都是由于语料的选择性带来的。但如果重视以上对通用词汇的查询和筛选,学习者能有效提高英语语言直觉,为更加流利地表达自己的思想和认识美国社会文化起到很好的指引作用。

本文举例的方法与卫乃兴(2009)所说的语料库例证的方法(corpus-illustrated)似有相似之处,但我们进行了量化的数据统计处理以及频数信息描述,而不只是用来佐证特定观点。本文举例只起一个示范的作用,语料库使用者可以结合自身需求进行无穷尽的查询。我们的目的是让大家在真实数据的海洋里获得一个良好的指引,以引导大家更好地使用C O C A 这一免费大型语料库中的宝藏,提升自己的英语语言水平和知识面。

注释

① 本研究为重庆大学语言认知及语言应用研究

基地项目和重庆市教委项目(09S K A02)部分

研究成果。

参考文献

[1] A ston, G. Corpora in language pedagogy:

Matching theory and practice[A]. In G. Cook & B. Seidelhofer (eds). Principle and Practice

in Applied Linguistics: Studies in Honour of

HG Widdowson [C]. Oxford: Oxford University Press, 1995.

[2] C orson, D. Using English Words[M].NY:

Springer, 1996.

[3] D avies, M. The advantage of using relational

databases for large corpora: Speed, advanced queries, and unlimited annotation [J]. International

Journal of Corpus Linguistics, 2005 (10).

[4] d e Souza Hodne, L.C. Collocations and teaching

[D]. University of Bergen, 2009.

[5] M cEnery, T., A. Wilson. Corpus Linguistics (2nd

edition ) [M]. Edinburgh: Edinburgh University Press, 2001.

[6] W i d d o w s o n, H.G. Aspects of Language

T eaching [M]. Oxford: Oxford University Press, 1990.

[7] 常宝宝, 俞士汶. 语料库技术及其应用 [J]. 外

语研究, 2009 (5).

[8] 王沁. 语言迁移中词汇失误的语料分析.

http: //https://www.360docs.net/doc/1c5842539.html,/doc/su200907/su 20090706.pdf

[9] 汪兴富, Mark Davies. 基于语义和学习者为中

心的COCA语料库. 待出a.

[10] 汪兴富等. 基于C O C A语料库的英语谚语分

析. 重庆市社科项目研究报告. 待出b. [11] 汪兴富, Mark Davies, 刘国辉. 美国当代英语

语料库 (COCA) ——英语教学与研究的良好

平台 [J].外语电化教学, 2008 (5).

[12] 汪兴富. 激活学生英语表达潜能研究 [MA].

重庆大学硕士学位论文, 2002.

(下转91页)

2018年北航外国语言学及应用语言学(050211)考试科目、招生人数、参考书目、复习指导---新祥旭考研

2018年北航外国语言学及应用语言学(050211)考试科目、招生人数、 参考书目、复习指导 一、招生信息 所属学院:外国语学院 招生人数:22 所属门类代码、名称:文学[05] 所属一级学科代码、名称:外国语言文学[0502] 二、研究方向: 01 二语习得 02 认知语言学 03 社会语言学 04 翻译理论与实践 05 语料库语言学 06 理论语言学 三、初试考试科目: ①101思想政治理论 ②202俄语或243日语二外或244德语二外或245法语二外 ③721基础英语 ④821英语语言文学 四、参考书目 721基础英语 《英语国家概况》外语教学与研究出版社 《当代英国概况》(修订版)上海外语教育出版社 《当代美国概况》上海外语教育出版社出版的 821英语语言文学

《The Study of Language》外语教学与研究出版社(2002年) 《语言学教程》(第四版)北京大学出版社(2011年) 《高级英汉翻译理论与实践》清华大学出版社(2008年) 《英汉互译实用教程》武汉大学出版社(2003年) 《英国文学简史》河南人民出版社(1993年) 《英国文学选读》上海译文出版社(1981年) 《美国文学简史》南开大学出版社(2004年) 《美国文学选读》南开大学出版社(2002年) 五、复习指导 1、参考书的阅读方法 (1)目录法:先通读各本参考书的目录,对于知识体系有着初步了解,了解书的内在逻辑结构,然后再去深入研读书的内容。 (2)体系法:为自己所学的知识建立起框架,否则知识内容浩繁,容易遗忘,最好能够闭上眼睛的时候,眼前出现完整的知识体系。 (3)问题法:将自己所学的知识总结成问题写出来,每章的主标题和副标题都是很好的出题素材。尽可能把所有的知识要点都能够整理成问题。 2、学习笔记的整理方法 (1)第一遍学习教材的时候,做笔记主要是归纳主要内容,最好可以整理出知识框架记到笔记本上,同时记下重要知识点,如假设条件,公式,结论,缺陷等。记笔记的过程可以强迫自己对所学内容进行整理,并用自己的语言表达出来,有效地加深印象。第一遍学习记笔记的工作量较大可能影响复习进度,但是切记第一遍学习要夯实基础,不能一味地追求速度。第一遍要以稳、细为主,而记笔记能够帮助考生有效地达到以上两个要求。并且在后期逐步脱离教材以后,笔记是一个很方便携带的知识宝典,可以方便随时查阅相关的知识点。 (2)第一遍的学习笔记和书本知识比较相近,且以基本知识点为主。第二遍学习的时候可以结合第一遍的笔记查漏补缺,记下自己生疏的或者是任何觉得重要的知识点。再到后期做题的时候注意记下典型题目和错题。 (3)做笔记要注意分类和编排,便于查询。可以在不同的阶段使用大小合适的不同的笔记本。也可以使用统一的笔记本但是要注意各项内容不要混杂在以前,不利于以后的查阅。同时注意

基于语料库的中国学生英语学习认知特征分析

基于语料库的中国学生英语学习认知特征分析 英语中介词使用频率相当高,也是二语学习者难以把握的词类之一,本文采取以语料库为基础的,以英语空间介词on , over 为例,从语料库CLE中随机选取,抽样分析,对中国学生使用空间介词on , over错误现象进行分析,发现中国学生在以英语作为第二语言的学习过程中的认知 规律。 语料库;空间介词;介词错误 杨卉卉,男,江苏省泰州人,1979年出生,学历本科,职称江苏泰州学院外国语学院讲师,研究方向认知语言学,英语教学。 [] H31 []A []1002-2139(2018)-27--02 一、引言 介词是英语中使用频率较高的词类,语义多样,用法复杂,对于以英语作为第二语言的中国学生来说,介词使用错误在所难免。认知语言学认为,语言来自人们对外部世界的客观体验,对空间的认识成为人们认知世界的开始。本文选择基于语料库研究空间介词on , over使用情况,剖析以空间概念为核心的语言认知体系,得出中国学生英语学习认知特征及规律。语言学是一种以语料库为基础的语言研究方

法,它包括两部分一是标注自然语料库,二是研究利用已经标注的语料。语料库是语料库语言学研究的基础,随着计算机技术展,统计软件能够帮助研究者罗列分类介词错误类型,使研究结果更具有实证性。 二、研究方法 2.1 研究问题 本文通过对语料库CLEC中空间介词on ,over进行检索,并对其的错误进行分析,试图解决如下问题 1.中国EFL学习者对空间介词on ,over的使用错误是否集中在某一特定类别? 2.造成空间介词on ,over的使用错误的原因是什么? 3.中国学生在学习英语的过程中呈现出何种认知特 征? 2.2 语料的选择 本文所涉及的两个空间介词on ,over,从CLEC语料库中进行抽取,语料库为百万词汇容量,使用软件Wordsmith,AntConc提取也可。其中介词on在CLEC及BNC中随机抽样形符(token)分别为308,over在CLEC随机抽样形符(token)分别为151。 2.3 错误标注及分类 CLEC 语料库已将语言错误分类并标注,根据言语失误分类和标注原则(桂诗春&杨慧中,2018),本研究对中国学

自建小型语料库在英语教学中的运用

自建小型语料库在英语教学中的运用 引言:随着语料库语言学近年来的发展,运用电脑语料库进行教学已经成为现代外语教育的新趋势。各种大型语料库(如LOB, BROWN, ELEC)已被广泛用于课堂教学的很多方面,如语料库在语法教学中的应用(何安平,2001;关文玉,2004),语料库在英语精读课中的应用(林丽云,2004)以及语料库在词汇(莫咏仪,2004;邓飞,2004)及写作(胡玉迎,2004)等方面的应用。然而,大型语料库最初的建库目的并非直接用于课堂教学,其语料规模庞大,就语言教学的具体方面而言,难免缺乏针对性,而且,由于价格,市场等原因,个人很难购买到大型语料库及检索软件。因此,在日常教学中,个人教学语料库的建设就显得尤为重要。Ragan(2001)指出小型语料库已成为以课堂为中心的实证教学研究的有力手段。而国内目前对个人教学语料库的研究还相对贫乏,本文将初步探讨自建小型语料库在帮助学生理解课文篇章主题意义方面的作用。 1.自建小型语料库的特征 1.1 针对性强。首先,与大型语料库相比,自建小型语料库规模小,但在内容选择上却比较有针对性,建库者可以根据自己教学及学生自主学习的需要科学的选择合适的语料,从而,使语料能够充分体现学习者的需求,满足不同层次学习者的需要,如目前大多数小学都开设了英语课,但适合这些初学者的语料库却几乎没有。在这种情况下,老师便可以通过因特网搜集儿童英语的材料和儿童感兴趣的话题制成小型语料库,从而是儿童能从开始就学到地道的英语。其次,小型语料库易于突出语言的语域和语体特征,正如Beaugr (2001)所说,依据特定的语域,语篇和话题而建的小型语料库有助于学习者培养语言的体裁,语域,语篇感,深化对语言在具体环境下的涵义的理解。 1.2 实效性强。与大型语料库相比,小型语料库在内容选择上非常灵活,可以避免选择那些语法正确但已经过时的语料,使语料库能跟上语言不断发展变化的步伐,尤其是新闻,杂志等语料更是能把最前沿的语言变体及新词,新句带给学习者。另外,小型语料库标注比较灵活,能满足更多学习者的个性化需求,而且,检索方便快捷,学习者可以在自己的操作过程中去发现目标语的各种语法特征和规律,便于学习者进行自主学习。 2.自建小型语料库促进英语教学的实例 正如Guy(1997)所说,小型语料库有助于学习者通过建构陈述性和程序性知识培养语言使用能力。目前计算机的使用已经相当普遍,所以对中学生灌输有关计算机方面的知识是非常有必要的。下面我们将以the use of computer 一文为例,说明在引导学习者建构该篇课文主题意义及对已有知识进行扩展方面,自建小型语料库能起什么作用。 学习者通过日常接触,对有关计算机方面的基础知识已经有了一定的基本图式,如计算机是一种高科技产品,运用广泛,速度快,因特网,游戏等。然而,若要比较全面的建构出有关计算机的图式,则还需对已有图式进行深入和扩展,如对计算机功能,利弊,历史,前景等方面知识的掌握。为了使学习者能够最大限度熟悉该话题,建构起该话题的心理词库,流利准确的表达该话题的相关知识,我们将利用自建的语料库的词频显现和语境共现功能,为学习者提供大量真实的语料,让学习者在自己观察,分析,概括的基础上归纳出相关图式,建构起该话题的陈述性知识;并通过小组讨论,任务汇报,课堂演示等方法扩展和巩固该话题的图式,从而,实现程序性知识的建构。 2.1 建立相关微型语料库 在大学英语第二册中有一篇the use of computer的课文,主要介绍了计算机的历史及目前计算机在各个行业中的广泛运用。为了向学习者提供更多的相关语料,笔者另外从因特网上搜集了十篇难度和体裁相当的相关文章,通过对无关内容的删减,加工,标注后制成微型

基于语料库的中国英语学习者knowledge搭配研究

基于语料库的中国英语学习者knowledge搭配研究 【摘要】本文运用语料库方法对中国英语学习者语料库(CLEC)中出现的knowledge一词的搭配进行了研究,对比分析了中国英语学习者与本族语者在使用knowledge一词方面的特点,以及中国不同水平学习者之间的特点。研究结果表明,中国英语学习者在knowledge一词的使用方面存在过度使用搭配词等现象,并以此揭示其搭配规律,对英语词汇教学、翻译教学提供一个全新的研究途径。 【关键词】语料库;词语搭配;CLEC;BNC 0 引言 自从Firth于半个世纪前提出至今,语言学者关于词语搭配的研究一直在不断地发展、深入并取得了显著的成就。研究者试图从不同的角度、使用各不相同的研究方法去探讨和界定词语搭配。学者们使用的术语也不统一。过去的词语搭配研究仅限于学者的自觉,难免带有个人的偏好,具有一定的局限性。而语料库语言学的兴起为词语搭配的研究带来了全新的理念和研究方法。搭配不再是语言学家头脑里的直觉存在,它是成百上千万词容的语料库连续文本(running text )中的语言使用实体,是数据处理的结果显示。1961年,Sinclair开始了第一个基于语料库证据的词语搭配研究项目。此后,基于语料库的搭配研究在语言学界展开。目前,语料库语言学已形成一套研究词语搭配的方法和手段。 1 词语搭配的概念 根据Firth(1957年)对collocation的界定:“You shall know a word by the company it keeps” (“由词之结伴可知其词”)[1],词语搭配是指词与词的结伴使用这样一种语言现象。Firth关于collocation 的观点概括起来大致有四条:第一,collocation是指词与词的结伴使用;第二,collocation是一种意义方式;第三,习惯性词语搭配的各伙伴相互期待和相互预见;第四,类联接(colligation)是高于词语搭配的抽象。Susan Hunston“…here it is sufficient to note that collocation is the statistical tendency of words to co-occur.”(这足以说明词语搭配是具有统计意义的词语共现)[2]。 2 国内关于词语搭配研究的文献综述 中国期刊全文数据库的检索(CNKI)结果显示,1999-2006共发表以词语搭配为题目的论文53 篇。 卫乃兴(2002年)的《基于语料库和语料库驱动的词语搭配研究》是近年来该研究领域的代表作,在学界引起了广泛的关注,对搭配研究产生了积极的影响。该文介绍和讨论了语料库证据支持的词语搭配研究的基本方法和主要原则。作者将基本研究方法分为“基于语料库数据”和“语料库数据驱动”两类。基于数据

哪里有可以免费使用的大型英语语料库资源-外语教学与研究出版社

语料库相关资源 David Lee语料库研究书签 Bookmarks for Corpus-based Linguists (David Lee) https://www.360docs.net/doc/1c5842539.html,.au/~dlee/CBLLinks.htm (https://www.360docs.net/doc/1c5842539.html,/corpora) 常用语料库资源链接汇集(语料天涯) https://www.360docs.net/doc/1c5842539.html,/corpus/ 互动平台 https://www.360docs.net/doc/1c5842539.html,/forum/ 入门读物 专著 梁茂成、李文中、许家金,2010,《语料库应用教程》。北京:外语教学与研究出版社。Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进) Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进) 期刊论文 中国期刊网 EBSCO英文期刊数据库 书店可以买到的语料库相关书籍 Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进) Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St. Jerome Publishing. (外研社引进) Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999. Longman Grammar of Spoken and Written English. Longman Publications Group. (外研社引进) Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进) Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)

英语词汇学教案

英语词汇学讲义 第一章英语词汇学简介(A Brief Introduction to English Lexicology) 教学目的: ●了解英语词汇学研究的现状及地位 ●掌握及分类 ●了解英语词汇学的研究范围和研究方法 ●了解学习英语词汇学的目的及意义 教学重点: ●英语词汇学的定义 ●英语词汇学的研究范围 教学难点: ●英语词汇学研究滞后的原因 ●英语词汇学的定义及研究范围 教学方法:理论讲解为主,课堂讨论为辅 教学步骤: 课程导入:(10 分钟) Discussion: What do you think lexicology mainly studies? 教学讲练内容:(80分钟) 1.1英语词汇学研究的现状及地位 1828 Noah Webster “lexicology”第一次出现 20c初没有受到足够的重视 1980s以前前苏联和中国有所研究 1980s中期以后西方语言学家开始重视英语词汇学研究,专著陆续问世,并开始把词汇研究与其它学科的研究联系到一起 词汇学研究没有受到重视的原因: 醉汉找钱的故事(David Crystal 为Jean Tournier 的英语词汇学概论写的序言中提及),说明西方语言学家避重就轻,因为在语言的三个要素中,语音体系和语法体系比较简单,易于归纳,便于研究,容易出成果;而词汇体系比较庞杂,不易归纳和研究,也不容易出成果。实际课堂教学中,很少有教师会系统地讲授词汇学的理论(因为词汇学理论本身就是滞后的),而学生在外语学习中最大的难点之一就在于如何学习和掌握词汇。从实际需要的角度出发,词汇学研究引起西方语言学家重视也是迟早的事情。此外,电脑应用的发展和普及以及语料库的形成为分析词汇的特征和总结词汇的规律性的原则创造了有利条件,在词汇体系的研究方面出现新的突破是指日可待的事情。 现在词汇学被看作是语言分析的一个层面。语言分析的五分法(词汇学lexicology、音位学phonemics、形态学morphology、句法学syntax和语义学semantics)与传统的三分法(音位学、句法学和语义学)相比,最大的不同在于重视了词汇的作用,充分肯定了词汇学的地位。当然,我们在使用语言的时候,总是不由自主地同时涉及所有的层面,所以,语言分析的五个层面虽然可以分别进行,但是不能忽视它们的相互联系和相互作用。 1.2词汇学的定义及分类 Routledge Dictionary of Language and linguistics by Hadumod bussmann 承认了词汇学在语言学中的地位,但是把侧重点放在词汇的语义学上面。 The Oxford Companion to the English Language by Tom McArthur

语料库的应用(最终)

语料库的应用 语料库方法广泛应用于语言学理论研究、军事等领域。当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。 军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。 【一】、语料库成为语言学理论研究的基础资源 语料库是计算语言学的基础。语料库对应的英文是corpus,复数形式为corpora。这个词既可以指语料也可以表示语料库。英国语言学专家戴维?克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也

可作为验证语言假说的手段。计算机语料库是一大批机器可读文本的结集。各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。 起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。 我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。 目前国外已建成且较有影响的主要为以下的语料库:美国:布朗大学的今日美国英语标准语料库(The Brown University Standard Corpusof Present Day American English)、兰卡斯特一奥斯陆/卑尔根语料库(The Lancast-er-Oslo/Bergen (LOB) Corpus)、英语语库(TheBank of English)、英国国家语料库(The BritishNational Corpus(BNC、伦敦一隆德语料库(Lon-don -Lund Corpus(LLC》、美国传统中介语料(American Heritage Intermediate(AHI) Corpus)以及英语国际语料库(The Intemational Corpus ofEnglish(ICE》等。

如何自建英语语料库

论自建小型学习者语料库的方法及作用 ——以自建中学生英语写作语料库为例 曹鹤 北京市第三十一中 摘要: 大型语料库的出现和发展在研究语言的用法、翻译、教学、教材编写以及词典编撰等方面起着重要作用,但对于处于一线从事基础教育的外语教师而言,针对性和使用性不强。本文以自己建立小型基础英语教学中中学生写作语料库为例介绍了小型学习者语料库建设的可行性、方法和应用,借以提倡广大一线从事基础教育的教师利用高科技所带来的成果,武装和丰富自己,让自己的教学科学化、客观化。 关键词:小型学习者语料库;英语写作;基础教育 自20世纪60年代至今,语料库从萌芽阶段已经发展到广泛应用于语言研究的各个方面,如:词典编撰、语言学研究、教材编写、翻译、语言教学等等。同时,计算机技术的高速发展使语料库(Corpus)在过去的50多年来也得到了长足的发展,突出表现就是大型语料库的出现。大型语料库为语言研究提供了可靠的信息,但正因为其包罗万象、内容泛泛,在辅助基础教学研究等方面缺乏针对性,实用性不强。作者认为广大英语教师可以根据自己的实际需要建设小型学习者语料库,开展有针对性地研究,并将其应用到教学中。本文以建立中学生写作语料库为例介绍建设小型学习者语料库的方法、以及如何使用小型语料库等方面做主要论述,向基础英语教师展示如何运用这一新技术来辅助英语写作教学。 一、语料库简介 建设语料库之前,我们应首先明白什么是语料库。语料库并不复杂,它通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体(杨惠中,2004)。语料库可以帮助人们观察和把握语言事实,分析和研究语言系统的规律。从语料库语言学的发展历程可以看出,语料库的用途主要体现在对语言现象以及语言本质的研究,如语言统计、词典编撰、词汇搭配和自然语言处理等方面(顾曰国,1988)。现在语料库也开始逐渐应用到语言教学研究中。根据邢富坤(2006)的统计,国内基于语料库的教学研究的数量越来越大,将语料库应用于外语教学的趋势也越来越明显。

可以免费使用的大型英语语料库资源

英语语料库#参考 2012-03-02 22:29:26 ■BNC=The British National Corpus英国国家语料库 https://www.360docs.net/doc/1c5842539.html,/(备用) https://www.360docs.net/doc/1c5842539.html,/bnc/ ■ANC = The American National Corpus美国国家语料库 https://www.360docs.net/doc/1c5842539.html,/ ■COCA = Corpus of Contemporary American English 美国当代英语语料库 https://www.360docs.net/doc/1c5842539.html,/ ■COHA = Corpus of Historical American English 美国近当代英语语料库 https://www.360docs.net/doc/1c5842539.html,/coha/ ■BOE=Bank of English 柯林斯英语语料库 https://www.360docs.net/doc/1c5842539.html,/wordbanks/ ■NMC=New Model Corpus 新规范语料库 https://www.360docs.net/doc/1c5842539.html,/ ■ARC=ACL Anthology Reference Corpus (ARC) 文选参考语料库 https://www.360docs.net/doc/1c5842539.html,/auth/preloaded_corpus/aclarc/ske/first_form ■BAWE=British Academic Written Eng Corpus (BAWE) 英国学术书面语语料库 https://www.360docs.net/doc/1c5842539.html,/auth/preloaded_corpus/bawe2/ske/first_form https://www.360docs.net/doc/1c5842539.html,/AcaDepts/ll/app_ling/internal/bawe/sketch_engine_bawe.htm download ■BASE= British Academic Spoken English Corpus (BASE) 英国学术口语语料库 https://www.360docs.net/doc/1c5842539.html,/fac/soc/celte/research/base/ ■SCTS=Scottish Corpus Of Texts and Speech苏格兰口语与书面语语料库 https://www.360docs.net/doc/1c5842539.html,/ ■SCTS=Corpus Of Modern Scottish Writing 当代苏格兰语实库 https://www.360docs.net/doc/1c5842539.html,/cmsw/ Slang https://www.360docs.net/doc/1c5842539.html,/ (American, English, and Urban slang) https://www.360docs.net/doc/1c5842539.html,/slang/ (UK) https://www.360docs.net/doc/1c5842539.html,/ https://www.360docs.net/doc/1c5842539.html,/cybereng/slang/ https://www.360docs.net/doc/1c5842539.html,/ https://www.360docs.net/doc/1c5842539.html,/

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词.doc 在美国当代英语语料库(COCA)如何查词 摘要:美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容 量在4.5亿,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库。该语料库的语料来自1990-2012年,每年更新,检索功能强大,是最佳的英语学习助手。本文以sorry为例介绍了如何在美国当代英语语料库中查询单词及对单词sorry的检查与研究结果。 关键词:美国当代英语语料库,平衡语料库,sorry Abstract: The Corpus of Contemporary American English (COCA) is the largest freely-available corpus of English,and the only large and balanced corpus of American English.The corpus was created by Mark avies of Brigham Young University,and it is used by tens of thousands of sers every month (linguists,teachers,translators,and other searchers).COCA is also related to other large corpora that we have created. The corpus contains more than 450 million words of text and is qually divided among spoken,fiction,popular magazines,newspapers,and academic texts.It includes 20 million words each year from 1990-2012. Key words: the Corpus of Contemporary American English,parallel corpus,sorry 中图分类号:H319.3文献标识码:A文章编号:1006-026X(2013)12-0000-02 一、引论

最常用的英语动词(根据美国语料库整理 word 可打印)

be turn walk wear lie have start win support occur do might offer end accept say show remember hit identify go hear love base determine can play consider produce prepare get run appear eat argue would move buy teach recognize make like wait face indicate know live serve cover wonder will believe die describe lay think hold send catch fail take bring expect draw arrive see happen build choose name come must stay cause present could write fall point answer want provide cut listen compare look sit reach realize miss use stand kill place act find lose remain close state give pay suggest involve discuss tell meet raise increase force work include pass seek check may continue sell deal laugh should set require fight guess call learn report throw study try change decide fill prove ask lead pull represent hang need understand return focus design feel watch explain drop forget become follow hope plan claim leave stop develop push remove put create carry reduce sound mean speak drive note enjoy keep read break enter form let allow thank share establish begin add receive rise visit seem spend join shoot care help grow agree save avoid talk open pick protect imagine

可以免费使用的大型英语语料库资源

可以免费使用的大型英语语料库资源 https://www.360docs.net/doc/1c5842539.html,/time/ http://www.lextutor.ca/concordancers/concord_e.html 常用语料库资源链接汇集(语料天涯) http://202.204.128.82/sweccl/Corpus/ https://www.360docs.net/doc/1c5842539.html,/netprints/Corporalink/Corporalink.htm 1. BNC-World Simple Search ☆☆☆ https://www.360docs.net/doc/1c5842539.html,/lookup.html But no more than 50 hits will be displayed, with a fixed amount of context. 2. Brown, LOB, BNC sampler ☆☆☆ Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora. English: https://www.360docs.net/doc/1c5842539.html,/concordance/WWWConcappE.htm English: http://www.lextutor.ca/concordancers/concord_e.html Parallel: https://www.360docs.net/doc/1c5842539.html,/concordance/paralleltexts/ 3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆ https://www.360docs.net/doc/1c5842539.html,/Corpus/CorpusSearch.aspx The Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text. 4. New BNC interface - VIEW: ☆☆☆☆☆ https://www.360docs.net/doc/1c5842539.html,/ 5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆ The Brown Corpus and many others - native, learner... Go to http://www.lextutor.ca/concordancers/concord_e.html 6. MICASE ☆☆☆☆ https://www.360docs.net/doc/1c5842539.html,/m/micase/ There are currently 152 transcripts (totaling 1,848,364 words) available at the site. 7. CLEC online concordancing ☆☆☆☆ https://www.360docs.net/doc/1c5842539.html,/corpus/EngSearchEngine.aspx CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。For an introduction of the corpus, its error tagset and some statistics, see https://www.360docs.net/doc/1c5842539.html,/baseinfo/achievement/Achievement1.htm 8. Business Letter Corpus Online KWIC Concordancer ☆☆☆

英语最常用的30个单词,背熟几乎能表达任何想法

小但强大,你需要形成任何句子的30个最常见的英语单词 在英语学习中最大的障碍之一就是掌握几乎每个句子中都会出现的那些小而常见的英语单词。幸运的是,你一旦你学好了最常见的英语单词,学会指的是记住以及掌握在不同情况下正确使用它们,那么你将变得很强大,几乎可以表达任何想法,写出流利的文章,对我们提升写作、口语表达都有很大的帮助。 30个最常见的英语单词以及用法。 1、the 它被称为“定冠词”。当你想要引用特定的东西时,它被用在名词(人物,地点或事物)之前。 The sandwich I ate for lunch was delicious. 我吃午饭的三明治很美味。 2、a 相比之下, a被称为“不定冠词”。它也在名词之前使用,但在谈论非特定的东西时使用它。 I would love to eat a sandwich. 我很想吃一个三明治。 当在以元音开头的单词前面使用时,a变成了an。 I would love to eat an apple.我很想吃一个苹果。 动词 动词是动作词,英语动词有时会根据句子的主语和时态改变拼写。 3、be Be 用于传达某事物的存在或状态。 Everyone wants to be free.每个人都想要自由。 4、have Have是你用来表示所有权的词。它可以指属于您的对象或事物,也可以指更抽象的概念。 I have a cat.我有一只猫。 I have a meeting today. 我今天有个会。

这个词的另一个常见用途必须是表明你需要做的事情。 have to go grocery shopping because there is no food in the house. 因为家里没有食物,我不得不去杂货店买东西。 5、do Do用于谈论完成一个动作。 I will do my work.我会做好我的工作。 6、say Say的意思是口头交流。当我们和别人说话时,我们对他们说的话。 I say hello to my mother when I see her.当我看到我妈妈时,我向她打招 呼。 连词,用于连接句子中的想法 7、and 两个概念可以用and连成一句话。这有助于使句子更详细。 The girl went to the kitchen and made a cup of coffee.女孩去厨房煮了一杯咖啡。 I am wearing a sweater and a jacket.我穿着毛衣和夹克。 8、or 单词or的工作原理与and相似。然而,它连接了不同的想法,或者显示了第二个想法与第一个想法的不同之处。它用来表示对某事的另一种选择或思考方式。Would you like tea or coffee?你想喝茶还是咖啡? We can have the meeting in the office or by phone.我们可以在办公室开会,也可以打电话。 9、but 这个词把两个概念联系在一起,表示它们是如何对立或不同的。它用来解释两件不相关或相反的事情是如何发生的。 It was sunny but she was cold.天气晴朗,但她很冷。

中国英语学习者语料库CLEC(桂诗春杨惠中)doc资料

中国英语学习者语料库C L E C(桂诗春杨惠 中)

中国英语学习者语料库 CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。 言语失误标注原则 1.简单合理,易于系统操作。参与标注的人比较多,分类表过于繁复,就难于掌握。我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。每一类里再用数目字细分。如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。

2.分类表的类别要适中。过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。现在的分类表有61个失误码,是属于中等规模的分类表。 提供足够的失误信息(失误本身、失误类型和失误发生范围)。例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示,放在失误之后。 [vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。要联系这4个词,才能判断are这个词用错了。 开放性。容许研究者根据需要对失误类型进行补充或进一步再分出细类。例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。这需要把sn8的失误全部检索出来,然后定出第三级的分类范畴,如sn81, sn82,等等。 5.对语体或失误的来由暂不作标注,因为这需要标注者较多的主观判断,更难以统一。 言语失误分类表(总数:61)

语料库语言学与中国外语教学_桂诗春

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

相关文档
最新文档