语料库语言学视角下语块研究述评

语料库语言学视角下语块研究述评
语料库语言学视角下语块研究述评

语料库语言学视角下语块研究述评摘要:近年来,基于中介语语料库的研究逐渐成为二语习得研究的焦点,这对发现语块学习的规律和特点具有重要的意义。本文从语料库语言学视角对国内语块的研究进行综述。文章指出,当前国内基于语料库的二语语块的研究主要集中在两个方面:1)基于口语语料库,揭示口语语块的特点以及语块与口语水平的相关性;2)基于笔语语料库,揭示写作中语块的特点以及语块与写作水平的相关性。在此基础上,分析了国内语块研究的不足和今后研究的方向。

关键词:语料库语言学语块口语写作

0 引言

随着人们对词汇学习的重视,短语学(phraseology) 也逐渐成为语言学研究的焦点。语料库和相应技术的出现,使语块成为短语学研究的单位。语块是融合“形式”和“功能”的综合体,能够体现出语义、句法及语用之间的关系。对语块的学习有助于提高学习者语言的地道性、流利性和得体性。目前,对语块进行的研究主要通过三种方法: 1)语法学的方法;2)心理语言学的方法;3)语料库语言学的方法。[1]由于语料库可以为语言研究提供大量的真实的语言材料,语料库语言学得到了快速的发展。研究者也逐步从应用语言学和认知语言学转向语料库语言学等角度对语块进行研究。

1、语料库语言学

语料库语言学(corpus lingustics)是一个独立的学科,它有

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

语料库语言学综述

语料库语言学综述 作者:刘美良 作者单位:柳州铁道职业技术学院,广西,柳州,545001 刊名: 科技信息 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期):2010,""(21) 被引用次数:0次 参考文献(19条) 1.Chomsky,N Syntactic Structure 1957 2.Sinclair.John Corpus.Concordance Collocation 3.Susan Hunstom Corpora in Applied Linguistics 2006 4.Aijmer,K.Altenberg,B English Corpus Linguistics:Studies in Honour of Jan Svartvik 1991 5.杨惠中语料库语言学导论 2002 6.何安平语料库在外语教育中的应用--理论与实践 2004 7.何安平谈语料岸研究 1997(5) 8.丁信善语料库语言学的发展及研究现状 1998(1) 9.李文中2003上海语科库语言学国际会议述评 2004(1) 10.粱旭红语料库语言学研究综述 2001(1) 11.粱燕近十年我国语料库实证研究综述 2004(6) 12.刘满堂近40年英语语料库及语料库语言学研究的回顾与出展望 2004(1) 13.潘永本梁语料库语言学的目的和方法 2001(3) 14.王建新语料库语言学发展史上的几个重要阶段 1998(4) 15.许家金语料库语言学的理论解析 2003(6) 16.卫乃兴专业性搭配初探--语料库语言学方法 2001(4) 17.卫乃兴语料库语言学的弗斯学说基础 2008(3) 18.甄风超.张霞语料库语言学发展趋势瞻望--2003语料库语言学国际会议综述 2004(4) 19.吴菲国内外英语语料库的建设和发展述评 2007(6) 相似文献(4条) 1.期刊论文王虹.岳俊发.Wang Hong.Yue Jun Fa书面言语鉴定技术的发展历程-中国公共安全(学术版)2005,""(3) 书面言语鉴定技术产生于20世纪80年代中期.随着电子打印技术的普及,涉案的不留笔迹的打印文件显著增加,书面言语鉴定技术倍受关注.近年来,运用统计语言学、语料库语言学和计算机词频检索与统计等新技术获得了新的研究成果并应用于鉴定实践.书面言语鉴定技术已经发展成为文件检验学的一个新的分支,必将在司法鉴定领域发挥更大的功效. 2.期刊论文孙丰果话语分析整合研究-聊城大学学报(社会科学版)2010,""(2) 近60年来.话语分析经历了从无到有,从小到大的发展历程.话语分析要取得长足发展,需要有一个明确的概念,需要人们对其以前的发展情况进行总结和评述.对话语分析研究的评述不妨从系统功能语言学、认知语言学、语料库语言学等多角度进行.今后,话语分析研究可以从话语分析的哲学转向、心理学转向及整合批评话语分析和积极话语分析等方面展开. 3.期刊论文杨连瑞.Yang Lianrui第二语言习得研究的学科定位和进展-外语与外语教学2005,""(5) 第二语言习得是一种复杂的人文现象.作为一门新兴的交叉学科,第二语言习得研究在发展中应重视其学科性质的科学定位和学科体系的科学建构.本文在对第二语言习得研究的学科定位、学科性质和研究对象进行讨论后,回顾和评述了国外第二语言习得研究从对比分析、错误分析、中介语理论、普遍语法研究、语言类型学研究到语料库语言学研究的发展历程和研究问题,分析了目前我国开展这一学科研究的现状,并结合我国外语教学实际对目前开展这一学科的研究提出建设性意见. 4.学位论文魏琳中国英译旅游宣传材料的语料库分析2006 旅游业在全球范围内的迅猛发展使不同文化背景的人们进行文化交流变成了一种需要。在我国,旅游英语特别是网上的旅游英译材料是外国游客接触和了解我国的媒介。因此,旅游材料的翻译质量举足轻重。而目前旅游文本的翻译研究在中国还是一个比较新的话题,近年来主要是结合最新语言学

语料库话语分析综述

近十年国内基于语料库的话语研究综述 A Review of Ten - year Research on Corpus-Based Discourse Analysis in China 摘要:文章从基于语料库的话语研究领域出发,通过对2002年至2011年发表在国内八种核心期刊上的论文进行统计与分析,发现这些研究在研究领域取得了很大的进步,涉及到话语各个方向,对于实践有重大指导作用,但同时也出现一些问题值得我们关注。 Abstract: From corpus-based discourse analysis, this thesis finds this field has made great progress, relates to many directions of discourse and has a significant guiding role for the practice, but also brings many problems worthy our attention. All of these are derived from the research and analysis of thesises published in 8 kinds of core journals from 2002 to 2011 in China. 关键词: 语料库话语基于语料库的话语研究 0. 引言 现代语料库语言学是20世纪中后期兴起的一门语言研究科学。语料库是指按一定的语言学原则,运用随即抽样的方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。在20 世纪后半叶的西方语言学界, Chomsky的观点大行其道,秉承该学说的语言研究者唯直觉语料独尊。他们躲在书斋,满足于依靠自己的直觉语料从事语言研究。随着社会语言学、话语分析、语用学、语料库语言学的兴起,越来越多的语言学家认识到光靠直觉语料来研究语言是远远不够的,人们还必须借助语料库语料以及其他各种语料,只有这样我们才能更好地揭示语言的本质,克服直觉语料的局限与不足。这样基于语料库的话语研究越发引起大家的重视,并取得了丰硕的成果。国内基于语料库的话语研究虽然起步较晚,但是成果仍然颇丰。 1. 研究样本 由于近几年运用语料库来做话语研究已经成为语言研究的热点,笔者通过检索主题与关键词,将文献定在2002年至2011年这十年期间,研究样本来源为发表在八种外语类核心期刊的22篇文章。这是因为这8种外语类期刊有一定的权

关注社会语言学视角下的第二语言习得研究

关注社会语言学视角下的第二语言习得研究 摘要:本文认为,以社会语言学的视角,用社会语言学的知识和理论来解释语言能力、言语交际、接受心理过程等第二语言习得中的一些重要问题,特别是汉语作为第二语言习得过程中的一些现象,应该看作是为语言应用研究引进了一种新视角,是语言习得研究的一条有效途径。同时,也扩展了社会语言学的研究领域,为社会语言学服务语言应用提供了实际内容。 关键词:社会语言学汉语作为第二语言习得研究 1.目前,在国内外,社会语言学研究和狭义的应用语言学中的语言习得研究基本上是分别在两个学科领域内进行的,而实际上,社会语言学与应用语言学水乳交融。语言学发展到今天,结合语言环境、言语互动和语言的社会交际来研究语言习得,特别是汉语作为第二语言的习得,越来越受到学者的重视。用社会语言学的知识和理论来解释第二语言习得中的语言能力、言语交际、接受心理过程等“二语”习得中的重大问题,应该看作是为语言应用研究引进了一种新视角,是开拓语言研究领域的一条有效途径,同时,也丰富了社会语言学的研究范畴,为社会语言学服务语言应用提供了重要的研究内容。 “汉语热”在全球范围内的持续升温,而汉语教学理论的研究却相对滞后。汉语作为第二语言习得理论研究的薄弱,已经带来一系列实质性问题:教师、教材、教学法、语言测试、教学评估等。解决这些问题不仅需要对具体问题的微观研究,更需要理论上的勇气——转换角度,调整思路,跳出一门学科的条框界限,借鉴相关学科的思路方法与研究成果,尝试用另一种眼光观察、探究、分析疑难问题,或许可以找到新的解释方法和分析途径,从而推动理论提升,为汉语教学实践开拓新鲜的思路,提供有益的借鉴。 社会语言学和语言教学与习得理论同属交叉性极强的学科,都受到诸多学术思想的影响。前者与人类学、社会学、心理学等学科关系密切,后者则与教育学、心理学、文化学密不可分。二者共同

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

社会语言学视角下的成都地名研究

社会语言学视角下的成都地名研究 成都是有近3000年建城史的历史文化名城,是我國中西部拥有世界遗产项目数最多的城市。成都地名既是一种语言符号,又是一种社会象征,更是文化的重要载体。本文综合运用语言学、文化学等知识,在多角度分析成都地名的语言构成与分类、历史内涵及发展变化的基础上,结合成都地名现状,提出成都地名保护的建议和措施。 标签:社会语言学成都地名语言特征文化内涵保护措施 地名是人类在认识自然和参与社会活动的过程中产生的一种语言符号,它随着历史的发展和社会的变化而不断发展。城市地名也是一个城市政治、经济、文化等方面的缩影,记录着一个城市发展变化的轨迹,是展现城市百态的一面“镜子”。通过地名研究,我们可以探索到地域深厚的历史底蕴,发掘出具有价值的语言文化信息。 成都市地处平坦的四川盆地,气候温和,降水充沛,自古就有“天府之国”的美称,是我国历史悠久的文化名城。从开明氏统治成都算起,成都有近3000年的历史,成都地名文化资源十分丰富。成都许多街道名称都与其文化渊源和历史背景密切相关。据吴世先《成都城区街名通览》统计,成都主城区的地名(街、路、巷、居民点)共有1244条[1]。目前,对成都地名进行研究的成果并不多见,主要是郭建强的《成都地名探究》[2]、杨秋《成都地名的文化语言学研究》[3]、唐林《成都地名文化遗产传承与保护对策》[4]、郭声波《宋成都平原地名考释》[5]等,以上研究成果在不同程度上促进了人们对成都地名由来和变迁的深入了解,增强了社会对地名文化的保护意识。但以上研究成果也存在一些有待深入和拓展之处,成都地名社会语言学的相关研究至今阙如。有鉴于此,我们运用《华阳国志》[6]《成都街名指南》[7]《成都地名掌故》[8]《成都出土历代墓铭券文图录综释》[9]等文献资料,从社会语言学的视角,开展成都地名的语言学、文化学、社会学等方面的相关研究。希望我们的研究成果能有助于发掘并弘扬成都乃至四川地区独特的地域文化,准确把握成都地名的语言文化内涵,整体提升对成都地名的认知水平,加强成都地名的文化传承与保护。 一、成都地名的语言构成与分类 地名作为一种语言符号,有着区别方位、反映社会文化的作用。成都地名蕴含着浓厚的地方文化,每个地名都有其独特的语言结构特征。在此,我们以成都主城区1244条地名为研究语料[10],来具体分析成都地名的音节构成和词汇结构。 (一)成都地名音节构成分析 地名音节构成与人们的社会生活有着千丝万缕的联系。从地名的音节构成,我们可以发现一个地区民众的语言使用习惯和倾向。通过地名音节的研究,我们

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

社会语言学视角下的中西方称呼语差异.doc

社会语言学视角下的中西方称呼语差异- 中西方不同的称呼语中蕴含了各自独有的、深厚的社会文化背景和习惯。由此可以说称呼语并不是一种孤独的表象,而是蕴含了社会文化的一种历史积淀。称呼语是言语交际中使用最广泛、频繁的词语,它是人类进行言语交际行为的极为关键的第一步,由此可见,虽然是一个小小的称呼语,但在社会语言学中的地位却不容小觑。中西方文化之间存在有巨大差异,所以对于外语学习者来说了解这些文化异同对语言学习是非常有必要的。恰当、巧妙地使用称呼语可以拉近言语交际者之间的距离,增强话语有效度,使社会语言交际活动变得更加和谐、有效。 一、社会语言学和称呼语的相关简介 社会语言学(sociolinguistics)是一门应用型边缘学科,它与哲学、社会学、心理学等诸学科的研究紧密相关,从这点可以看出社会语言学的多样性、宽泛性和跨学科性,所以,社会语言学是一门跨学科研究。杨永林在他的《社会语言学四十年》一文中这样说道:社会语言学还表现为一种跨学科的观察方法,为其他学科研究同语言相关的问题提供一种可资在社会文化语境中分析研讨、参比反照的方法论,体现出一种学术话语模式高度兼容的特质。[1]《中国大百科全书语言文字卷》一书中把社会语言学定义为:社会语言学是研究语言与社会多方面关系的学科,它从不同的社会科学(诸如社会学、心理学、地理学、历史学等)的角度去考察语言。[2]社会语言学的代表人物有:索绪尔、布莱特、海姆斯、祝畹瑾、杨永林、陈原等。社会语言学一次是从1960年开始成为一颗耀眼的明星的。自那时起至今,学者们对它进行大量研究,至今年已经经历了五十年的风风雨雨。中国学

者杨永林认为,20世纪20年代欧美出现的伦敦功能学派和北美人类语言学派对社会语言学的建立发挥了不可磨灭的作用。许多的先驱学者们为社会语言学做了具有历史性重要作用的奠基人。这门学科如今已经由最初的巩固自我地位的初始阶段走向了与其他学科结合形成新的交叉学科的高级阶段了。 众所周知,称呼语(address forms)是我们日常生活的言语交际中很重要的交际用语,是人类社会活动中必不可少的一个言语行为。人们刚开始对它的认识是明确说话者所指称的对象,现在,人们对称呼语的认识已经发展到了更深的程度称呼语是指明互动双方的身份逐渐深入到表示礼貌和言外之意的程度。在现实生活中,由于称呼语的运用不当而引起的不必要的误会和摩擦从而导致人际关系紧张的例子也不胜枚举。称呼语看似只是很简单的一个称呼而已,但它其实是社会交际过程中十分复杂且重要的一个问题,对于交际的成败起着非常关键的作用,如果正确、合理地使用了称呼语,就会增强交际语言的表达效果,使与他人的交际变得更加的和谐、有效。称呼语的研究已逐渐成为人们关注的热点问题。国内外学者对称呼语及相关问题等已有相当的研究。美国的语言学家布朗和福特早在六十年代就成为了美国英语中的称呼语系统研究的伟大的开创者。关于称呼语,我国的很多学者也从文化、历史、民族等角度来对其进行意义和演变上的探索。 二、基于社会语言学视角下的中西方称呼语对比 中国一直都是以礼仪之邦而著称,它在悠悠长河般的文明史中已经形成了独有的一套道德规范及礼貌准则。中国称呼语的使用文化深厚,使用也是很有讲究的。西方文化中对称呼语的运用也是变化多端有讲究的。用适当的称呼问候对方或跟对方打招

语料库语言学的发展

语料库语言学的发展 语料库顾名思义就是放语言材料的仓库。现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。现在世界上已经有了不少规模较大的语料库,有些是国家级的,有些由大学和词典出版商联合建设。另外,由于个人微机的迅猛发展和存贮数据的硬盘造价持续下降,研究者个人也开始建立适合于自己研究的小型语料库。 语料库语言学(英文corpus linguistics)这个术语有两层主要含义。一是利用语料库对语言的某个方面进行研究,即“语料库语言学”不是一个新学科的名称,而仅仅反映了一个新的研究手段。二是依据语料库所反映出来的语言事实对现行语言学理论进行批判,提出新的观点或理论。只有在这个意义上“语料库语言学”才是一个新学科的名称。从现有文献来看,属于后一类的研究还是极个别的。所以,严格地说,现在不能把语料库语言学跟语言学的分支, 如社会语言学、心理语言学、语用学等相提并论。 近年来,随着我国经济的发展,科研经费的增加,汉语语料库的建设得到了开展。1999 年我院把建立汉语语料库列为院重大课题。目前语言所正在构建三个大规模的语料库: 现场即席话语语料库,主要方言口语库和现代汉语文本语料库。在世界范围内,我国的语料库建设在规模上还赶不上欧洲的一些发达国家,特别是英国。然而,在语料库语言学的研究上,以及语料库的实际运用上,我国已经进入世界前沿的行列。 20 世纪语言研究的总特点可以用四个字概括──高度抽象。最近几十年来,语言研究的高度抽象倾向已经失去主导地位。这主要缘于两个方面的因素: 一是计算机技术,特别是基于计算机处理的多媒体技术的飞速发展;二是社会语言学、语用学、会话分析、人类语言学、计算语言学、人机对话研究、语音识别与合成等研究取得令人瞩目的成就。先前难以抓住并进行有效处理的五花八门的实际语料,现在可以对其进行大规模地的、自动的或人机配合的处理。比如个人发音特征,先前认为这跟语言学毫无关系,现在成了侦破语音学的重要内容。侦破语音学家首先建立个人发音特征语料库,这个语料库可以用来鉴别嫌疑犯。概言之,当今的语言研究由先前的高度抽象逐步走向最具体的语言的实际活动,其中

桂诗春等-2010-语料库语言学与中国外语教学

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

论社会语言学视角下的二语习得理论

论社会语言学视角下的二语习得理论 汪顺强 [摘要]中介语变异现象、跨文化交际、会话现象以及社会认同等的复杂性导致社会语言学视角下的二语习得理论没有形成完备的理论系统;然而西方很多学者已勾勒出了这一领域的部分理论。本文重点讨论共建、互动能力、斯特恩的二语习得模式以及二语习得的条件等理论以期对二语教学提供理论借鉴。 [关键词]共建互动能力斯特恩的二语习得模式二语习得的条件 On theories of Second Languaage Acquisition from the Perspective of Sociolinguistics Wang S h un-qiang Abstract:Second language acquisition from the perspective of sociolinguistics have not been theorized completely owing to the immense complexity of the phenomena of interlanguage variation,cross-cultural communication,conversational phenomena,and social identity,etc. Nonetheless,several western scholars have sketched proposals for what theories of part of the field might look like.This paper aims at providing theorical merits for second language acquision through discussing the following theories that have received attention recently:co-construction,international competence,Stern’s language acquisition model,and conditions of second language acquisition. Key words:Stern’s language acquisition model co-construction interactive competence conditions of second language acquisition 1引言 在应用语言学中,二语习得指的是人们逐步提高其第二语言或外语水平的过程(Richards&Platt,2000:408)。人们对这种过程进行研究,期望从中得出对语言教学有用的知识。这一术语特别被美国研究人员应用于他们感兴趣的领域,如:关于第二语言或外语学习者在句法和音韵方面的纵向研究及个案研究;关于第二语言和外语学习者口头和书面话语的分析;关于语言发展的其他方面的研究。本文从社会语言学的角度探讨二语习得的部分理论,以期为二语习得营造和谐的内外环境提供理论支撑。社会语言学或许是与理论建构关联最小的语言学分支。该领域的领先人物Charles Ferguson(1997)指出社会语言学从一开始就是问题趋向的而不是理论趋向的。通过判定一些描述现象如何在不同的社会阶级和文化背景下或不同的工作条件下表现出不同的特点实现其“理论深度”(p228),Emanuel Schegloff(1987)也拒绝了社会科学中的一位论派的理论。二语习得的社会语言学途径缺乏句法学和认知心理学家所擅长的宏观理论。然而,由于中介语变异现象,跨文化交际,会话现象以及社会认同等的巨大复杂性,所以到目前为止还没有提出明显而系统的二语习得的社会语言学理论。然而有些学者已勾勒出了适合于该领域的部分理论。 2共建理论 双语行为最具特殊预示性的理论是话语范围理论(Douglas和Selinker1985;1994a, Mora1995,Whyte1994a;1994b;1995,Zuengler1989)。这一理论预示了二语产出的精确性和话语话题的联系。话语范围理论的弱点在于其集中于互动中的个体参与者,在于其对话题和主题的个人的心理反映。另两个理论(共建和互动能力)则采取了宽广的视角,把社会现象和社会语言学现象视为互动中所有参与者共建的。Jacoby和Ochs(1995)提出“共建”并定义为“形式、阐释、立场、行为、活动、认同、惯例、技能、观念、感情或其它文化方面有意义的事实的联合创造物”(1995;171)。尽管“共建”这一术语可能暗示联

语料库和知识库的研究现状

语料库和知识库研究现状 2015-12-9

摘要:语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源,它与自然语言处理有着相辅相成的关系,是用统计语言模型的方法处理自然语言的基础资源。知识库广泛应用于信息检索、机器问答系统、自动文摘、文本分类等领域,为进行大规模的真实性文本的语义分析提供了有利的支持,它也成为自然语言处理不可或缺的基础资源。由于语料库和知识库的广泛应用,如今国内外对语料库和知识库的研究给与高度的重视,经过过去几十年的发展,各国在语料库和知识库的建设和应用方面都取得了不少成果。本文通过对语料库与知识库相关文献资料的搜索整理,重点介绍目前国内外在语料库和知识库方面的研究现状。 关键词:语料库;知识库;研究现状 1前言 语料库是指按照一定的语言学原则,运用随机抽样的方法,收集自然出现的连续的语言文本或者说话片段而建成的具有一定容量的大规模电子文本库[1]。而知识库是知识工程中结构化、易操作使用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。语料库和知识库在传统语言研究、词典编纂、语言教学、自然语言处理等领域有重要作用,所以自从20世纪60年代第一个现代意义上的语料库——美国布朗语料库(Brown Corpus)诞生开始,大批国内外的专家学者致力于语料库和知识库的研究,近年来国内外对于语料库知识库的研究取得了重大的突破,形成了规模不一的各种语料库和知识库,并且涌现了众多有关语料库和知识库的专着、论文等。对于语料库和知识库发展现状的总结研究,不仅可以帮助人们清楚的了解语料库和知识库当前发展的形势,对今后语料库知识库的发展具有一定的指导作用,而且对于应用语料库知识库发展自然语言处理等领域具有重要意义。

(完整版)语言学专业词汇中英文对照版

语言学术语(英-汉对照)表 A abbreviation 缩写词,略语ablative 夺格,离格 accent 重音(符) accusative 宾格 achievement test 成绩测试acoustic phonetics 声学语音学acquisition 习得 acronym 缩略语 action process 动作过程 actor 动作者 address form 称呼形式addressee 受话人 addresser 发话人 adjective 形容词 adjunct 修饰成分附加语 adverb 副词 affix 词缀 affixation词缀附加法 affricate 塞擦音 agreement 一致关系 airstream 气流 alliteration 头韵 allomorph 词/语素变体 allophone 音位变体 allophonic variation 音位变体allophony音位变体现象 alveolar ridge 齿龈 alveolar 齿龈音 ambiguity 歧义 analogical creation 类推造字anapest 抑抑扬格 anaphor 前指替代 anaphoric reference 前指照应animate 有生命的 annotation 注解 antecedent 先行词前在词anthropological linguistics 人类语言学 anticipatory coarticulation 逆化协同发音 antonomasia 换称代类名antonym 反义词 antonymy 反义(关系) appellative 称谓性 applied linguistics 应用语言学applied sociolinguistics 应用社会语言学 appropriacy 适宜性appropriateness 适宜性得体性 approximant 无摩擦延续音 aptitude test 素质测试 Arabic 阿拉伯语 arbitrariness 任意性 argument 中项中词主目 article 冠词 articulation 发音 articulator 发音器官 articulatory phonetics 发音语音学 artificial speech 人工言语 aspect 体 aspirated 吐气送气 assimilation 同化 associative 联想 associative meaning 联想意义 assonance 准压韵半谐音 attributive 属性修饰语定语 auditory phonetics 听觉语音学 authentic input 真实投入 authorial style 权威风格 authoring program 编程 autonomy 自主性 auxiliary 助词 auxiliary verb 助动词 B babbling stage 婴儿语阶段 back-formation 逆构词法 base component 基础部分 behavioural process 行为过程 behaviourism 行为主义 bilabial 双唇音 bilabial nasal 双唇鼻音 bilateral opposition 双边对立 bilingualism 双语现象 binary division 二分法 binary feature 二分特征 binary taxonomy 二分分类学 binding 制约 binding theory 制约论 blade 舌叶舌面前部 blank verse 无韵诗 blending 混成法 borrowing 借用借词 bound morpheme 粘着语素 bounding theory 管辖论 bracketing 括号法 brevity maxim 简洁准则 bridging 架接 broad transcription 宽式音标 broadening 词义扩大 Brown corpus 布朗语料库 C calculability 可计算性 calque 仿造仿造词语 cancellability 可删除 cardinal numeral 基数 cardinal vowel 基本元音 case 格 case grammar格语法 case theory格理论 category 范畴 categorical component 范畴成分 causative 使役的使投动词 center 中心词 central determiner 中心限定词 chain relation 链状关系 chain system 链状系统 choice 选择 choice system 选择系统 circumstance 环境因子 class 词类 class shift 词性变换 clause 小句从句 click 吸气音咂音 clipping 截断法 closed class 封闭类 closed syllable 闭音节 cluster 音丛 coarticulation 协同发音 coda 结尾音节符尾 code 语码信码 cognitive psychology 认知心理学 cognitive system 认知系统 coherence 相关关联 cohension 衔接 co-hyponym 同下义词 colligation 类连结 collocative meaning 搭配意义 color word 色彩词 color word system 色彩词系统 command 指令 common core 共核 common noun 普通名词 communication 交际 communicative competence 交际能 力 communicative dynamism, CD 交际 性动力 communicative language teaching, CLT

机器翻译研究现状与展望

机器翻译是建立在语言学、数学、信息学、计算机科学等学科基础上的多边缘学科。现代理论语言学的发展、计算机科学的进步以及概率统计学的引入, 对机器翻译的理论和方法都产生了深刻的影响。 Weaver机器翻译思想的提出, 开始了机器翻译的研究热潮。Chomsky在50年代后期提出的短语结构语法, 给出了“从规则生成句子”的原则。由于短语结构语法采用单一标记的短语结构来描述句子的构成, 描述粒度过粗, 因此存在约束能力弱、生成能力过强问题, 人们逐渐意识到仅依靠单一的短语结构信息, 不能充分判别短语类型和确认短语边界, 于是, 复杂特征集和词汇主义被引入自然语言语法系统, 广义短语结构语法、词汇功能语法、中心语驱动的短语结构语法等语言学理论也相应地产生。在这个发展过程中, 基于规则方法一直是机器翻译研究的主流。 在基于规则的方法中, 语言规则的产生需要大量的人力,而且大量的语言规则之间往往存在着不可避免的冲突。另外,规则方法在保证规则的完备性和适应性方面也存在着不足。而此时, 统计学方法在自然语言处理的语音识别领域取得了比较好的效果, 于是, 基于统计的机器翻译应运而生。随着双语语料的大量增加、计算机性能的提高, 基于实例的机器翻译方法被提出,并由此泛化产生了基于模板的机器翻译方法。 下面我们分别介绍几种典型的机器翻译方法: (1)基于规则的机器翻译方法

从Chomsky提出转换生成文法后,基于规则的方法一直是机器翻译研究的主流,Chomsky认为一种语言无限的句子可以由有限的规则推导出来。 早期的机器翻译系统, 从体系结构上可以分为直译式、转换式和中间语言式, 它们的不同之处在于对源语言分析的深度, 它们的相同点是都需要大规模的双语词典、大量的源语言推导规则、语言转换规则和目标语言生成规则。其中, 转换式的基于规则方法对源语言分析得比较深, 它涉及到词汇结构分析、语法分析、语义分析, 并完成词汇、语法、语义三层结构从源语言到目标语言的转换, 而且转换式的方法又充分考虑了源语言和目标语言之间的特征联系, 它比中间语言方法更容易获得高质量的翻译结果。因此, 转换式的方法更多地被应用在早期的机器翻译系统中, 整个翻译过程被分为, 源语言分析部分, 转换部分和目标语生成部分。而早期的系统, 如德国西门子的METAL系统、美国的SYSTRAN系统、日本日立公司的ATHENE系统以及中国中软公司的HY-1汉英系统, 都是基于转换的机器翻译系统。 基于规则的机器翻译的优点在于, 规则可以很准确地描述出一种语言的语法构成, 并且可以很直观地表示出来。机器可以按照一组规则来理解它面对的自然语言, 这组规则包含了不同语言层次的规则, 包括用以对源语言进行描述的源语言分析规则、用以对源语言/目标语言之间的转换规则以及用于生成目标语的生成规则。

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

相关文档
最新文档