外来词使用状况的语料库考察

外来词使用状况的语料库考察
外来词使用状况的语料库考察

外来词使用状况的语料库考察

研究一种语言面对外来词时如何反应――拒绝它们,翻译它们,或是任意接受它们-- 对看清这种语言内在的形式趋势很有

价值。研究现代汉语对外来词的接受和使用状况有助于了解现代汉语的发展趋势;也只有摸清外来词在汉语中的生存和发展状况,才有可能给“外来词”一个符合实际的定义,并对其进行科学分类,为进一步的深入研究奠定基础。

一、研究目的与方法

本研究通过语料库考察和统计分析,定量研究人们对外来词的接受度及使用现状,探索和总结当前汉语外来词的使用特点和表现趋势。

为此,笔者通过分层随机抽样的方法选取了99 条外来词作为研究样本,按照引人方式对样本进行分类,然后进行语料库检索,并运用相关的统计方法对数据进行分析,最后对提出的原假设进行检验和分析。

本研究使用了国家语委语料库和中国传媒大学的生语料库。前者是大型的、通用的现代汉语平衡语料库,反映汉语笔语的总体使用情况;中国传媒大学的生语料库则包含2000 篇电视节目文字稿,基本反映较为正式的汉语口语使用情况。两者参照,能够较好地体现当前汉语对外来词吸收和使用的一般状况。

研究中引入了外来词的“出现率”、“出现频次”和“平均频

次”三个测度指标,并将其分别设定为变量r、f 。设外来词

分别属于八个类型组G1, G2……G8任意一组中有外来词W 个;其中在语料库中出现n 个。

r 可以显示某类型外来词中有多少个在语料库中出现f 为某个外来词在语料库中出现的次数f 则说明某类型外来词在语料库中出现的平均密度。

二、研究假设

假设1 :外来词的使用相当普遍

目前学术界和相关人士普遍认为:汉语对通过不同翻译方法引入的外来词接受度不同,最易接受符合汉语构词习惯的纯意译词,其次是含音译成份的词,最后是近年来似乎有些泛滥的字母词。该假设是对当前流行的学术界普遍看法进行定量检验。

假设2:外来词在现代汉语中处于上升状态该假设认为不同类型的外来词在汉语中的发展状况并不平衡,但整体而言,外来词在现代汉语中是处于上升状态的,无论从规模还是速度上看都是如此。

假设3:外来词的使用频率高

该假设认为外来词的使用频率较高,甚至有可能高于某些较为常用的汉语词汇。对该假设的进一步研究将会对外来词的科学划分提供理论依据。

三、研究结果

(一)外来词的出现率和平均频次

两个通用语料库的检索结果均表明,以往的定性研究虽然没有

根本性错误,但大大低估了形译词、音译词以及混合译词在现代汉语中的接受和使用情况(见表1)。

研究者普遍认为最不易被汉语接受的形译词,竟分别达到

83.3 %和77.8 %,高于较为看好的音译兼意译词,接近于混合译词。不过从7 值看,形译词还是最低的。

纯音译词的r 值均明显高于纯意译词;不过,值却都明显低

于纯意译词。

这些数据验证了假设1:人们在语言交流中承认并大量使用各类外来词,包括形译词、音译词以及混合译词,但对形译词、音译词以及混合译词的使用,态度还是相当谨慎的,并且不同类型的外来词在使用密度上存在明显差异。

(二)外来词在现代汉语中的地位

教育部语用所计算室于2007年1月7 日对国家语委语料库

进行了更新,并发表了《更新说明》,于是对所有外来词样本又进行了第二次检索,并进行了配对样本t 检验。

表2 中“语委-1”栏的数据为2006 年12 月13 日至15 日在国家语委语料库中搜索的结果;“语委-2”为该语料库更新

后再次搜索的结果。从中可以看出,不少数值都出现了明显上升。

笔者对8 类外来词的出现率和每个词的出现频次分别进行了配对样本t 检验(见表3)。结果表明:各类外来词的出现率r 没有显著性差异;而出现频次f 则存在非常显著的差异。事实上,

各类外来词的f 值均有上升,特别是形译词,竟然猛增5.79 倍

(见表2)。这一客观事实不仅验证了假设2 ,并且与人们的主观感受完全一致,这种变化反映了人们对外来词接受度的快速提高和使用密度的急速加大,应该引起密切关注。

事实上,备受争议的字母词(包括本文所说的形译词和部分混合译词)在强烈的支持和声讨中生存并快速发展。1996 年修订的《现代汉语词典》就收录了39 条“西文字母开头的词语”,2006年的修订版更是将此部分扩充到1 82 个词条。虽然未入正文,但也足以说明形译词已成为现代汉语词汇中的重要部分。2001 年到2002 年间,上海辞书出版社和汉语大词典出版社甚至还相继出版了两本专门的字母词词典。

(三)外来词的使用频率

根据《现代汉语频率词典》,笔者“选取了8 000 个频率最高的词”和“ 8 000 个使用度最高的词”中最后的10 个词,在国家语委语料库中进行检索,得到现代汉语中较常用词汇的低频词出现频次(见表4)。

可以看出,现代汉语中较常用词汇的低频词在国家语委语料库中的平均频次值分别只有49.9 和104.8(见表4),而此前在同一语料库中进行的两次外来词检索统计结果中,各类外来词的平均7 值却分别高达302.7 和342.4(见表2)。再从单项考察结果来看,对于纯音译词、纯意译词、日语形译词和音译兼意译词,

均有。其中,纯意译词、日语形译词和音译兼意译词甚至有(见

表2)

这些数据验证了假设3:当前外来词的使用频率很高;其中,部分外来词的使用频率甚至已达到或超过了汉语中较常用词汇的使用频率。

四、结论及进一步研究

本次考察结果显示,现代汉语对外来词的接受度很高,各类外来词在现代汉语中的实际使用频率也都相当高,而且还有继续大量增加的趋势;特别是形译词和混合译词,它们的出现率和使用频率激增已成为不可逃避的事实。《实用字母词词典》在“代前言”中甚至明确提出“现代语文词典需要接纳字母词”。

由此可见,研究者必须积极面对外来词快速发展的现实,承认其存在的合理性与积极意义,用动态的观点看待和研究外来词,并在加强规范的基础上努力探索其发展演变的规律。

当然,理想的状况是建立信息完备的外来词语料库,对词语的引入时间、借入方式、使用范围、源语、其他译法以及词性和意义的消长与转换等情况进行详细标注。建立外来词语料库所面临的诸多困难也是值得进一步研究的问题,如:相关概念的整理;外来词的识别、标注规范。外来词升级为汉语基本词汇的可能性及条件等。

BCC语料库使用指南

1 、字处理(包括标点符号) [C]:错字标记,用于标示考生写的不成字的字。用[C]代表错字,在[C]前填写正确的字。 例如:地球[C](“球”是错字)、这[C]。 [B]:别字标记,用于标示把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至[B]中B的后面,并在[B]前填写正确的字。 例如:提[B题]高、考虑[B虎]。 [L]:漏字标记,用于标示作文中应有而没有的字。用[L]表示漏掉的字,并在[L]前填写所漏掉的字。 例如: 后悔[L],表示“悔”在原文中是漏掉的字。 农[L]药,表示“农”在原文中是漏掉的字。 [D]:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至[D]中D的后面。 例如:我的[D的],表示括号中的“的”是多余的字(原文中写了两个“的”)。[F]:繁体字标记,用于标示繁体字。把繁体字移至[F]中F的后面,并在[F]前填写简体字。 例如:记忆[F憶]、单{F單}纯、养{F養}分{F份}。 注意: 1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记。

例如:俭朴[F樸[B僕]]。 2)繁体字写错了,标为:后[F後[C]]。 [Y]:异体字标记,用于标示异体字。把异体字移至[Y]中Y的后面,并在[Y]前填写简体字。 例如:偏[Y徧]、沉[Y沈]。 [P]:拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至[P]中P的后面,并在[P]前填写简体字。 例如:缘[Pyúan]分、保护[Phù]。 [#]:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个[#]表示。例如:更[#][#]保存自己的生命,…… [BC]:错误标点标记,用于标示使用错误的标点符号。把错误标点移至[BC]中BC的后面,并在[BC]前填写正确的标点符号。 例如:勤奋、[BC,]刻苦的精神。 [BQ]:空缺标点标记,用于标示应用标点符号而未用的情况。把[BQ]插入空缺标点之处,并在[BQ]中BQ的后面填写所缺的标点符号。 例如:周围的环境很安静[BQ,]生活也非常平凡。 [BD]:多余标点标记,用于标示不应用标点符号而用了的情况。把多余的标点移至[BD]中BD的后面。 例如:我家周围的[BD,]美丽风景。 2、词处理:(包括成语) {CC}:错词标记,用于标示错误的词和成语。包括4种情况: 1)把词的构成成分写错顺序的。

声学术语

声学--机器和设备发射的噪声--工作位置和其他指定位置发射声压级的测量的基本标准的使用导则 噪音常用术语 一、声学常用术语 1. absorption coefficient吸音系数:材料吸收的省能与入射声能之比值。 2. acoustical calibrator声学校准器:用来校准麦克风、噪音計的仪器。 3. ambient noise环境噪音:在环境中所有声源产生噪音的总和。 4. anechoic room无响室或称无回音室:边界能几乎吸收所有的入射波而形成室內是自由声场的封闭空间。 5. antinode波腹:驻波內振幅最大的点、线或面。 6. A-Weighting A加权:模擬人耳对各种不同频率的声音感觉不一样的加权方法。 7. background noise背景噪音:在测量系统中,和量测信号无关的一切噪音。 8.band pressure level频带声压位准:在某一特定频带(如八音度频带)从下限频率至上限频率的声压位准。 9. CPB固定百分比频宽:CPB是Constant Percentage Bandwidth的简写,它表示每一个相邻频带的宽度比是固定的百分比。 10. decibel分贝:声音的物理量与参考物理量的比值取对数后乘以10或20。 11. diffuse sound field扩散声场:在各传播方向呈无规则分布且能量密度均匀的声场。 12. diffraction绕射:因为空间形状的改变使得声波传播方向改变的现象。 13. dispersion频散:声音的速度随频率而变化的现象。 14. Leq(equivalent continuous noise level)等效连续声压级:A加权声压位准在某一特定时间內平均值。 15. equal loudness contours等响曲线:在声压位准频率图上各种不同频率但听起来同样响之点所连成的曲线。 16. far field远场:自由场中离声源距离加倍,则声压级減少6分贝的声场。 17. free field自由场:边界对声波的影响可以忽略不計的声场。 18. fast response快档:噪音計的动回应常数为0.125秒。 19. Hertz(Hz)赫茲:频率的单位,代表声波每秒钟振动的次数。 20. impulse response冲击档:噪音計的动回应时间常数为0.035秒。 21. longitudinal wave纵波:传播方向与介质质点振动方向相同的波。 22. loudness响度:人类听声音感觉其响亮的程度。 23. loudness level响度级:某频率的纯音和1000 Hz的纯音相比,听起来一样响时,則1000 Hz纯音的声压为准称为该频率的响度位准。 24. microphone麦克风:将声音转换成电信号的换能器。 25. near field近场:在自由场中,声源附近瞬时声压和质点速度不同相位的声场。 26. node波节:驻波內位移为零的点、线或面。 27. Octave八音度:两个相邻频带带宽、中心频率及上、下限频率比皆为二的一次方。 28. 1/3-Octave 1/3八音度:两个相邻频带带宽、中心频率及上、下限频率比皆为二的三分之ㄧ次方。 29. phon方:响度位准的单位。 30. pink noise粉紅噪音:用正比于频率大小的频宽测量时,频谱连续且均匀的噪音。 31. pitch音調:表示声音的高低。 32. pistonphone活塞式声音校准器:一个已知频率的纯音声源装在一个圆柱腔內,可产生已知的声压来校准麦克风。 33. preamplifier前置放大器:通常和麦克风连在一起,可将麦克风的输出信号放大。 34. pure tone纯音:单一频率的声音。 35. receiver接收者:接受噪音的人或仪器。

语料库研究的优势及问题的理论解析

语料库语言学的理论解析 摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景 Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development. Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions 1.0 导言 目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。 本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。 然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 2.0 语料库语言学是不是独立的新兴学科? 2.1 语料库语言学是一种理论架构 完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

声学名词解释

B 波长 声波振动一次所传播的距离,用声波的速度除以声波的频率就可以计算出该频率声波的波长,声波的波长范围为17米至1.7厘米,在室内声学中,波长的计算对于声场的分析有着十分重要的意义,要充分重视波长的作用。例如只有障碍物在尺寸大于一个声波波长的情况下,声波才会正常反射,否则绕射、散射等现象加重,声影区域变小,声学特性截然不同;再比如大于2倍波长的声场称为远场,小于2倍波长的声场称为近场,远场和近场的声场分布和声音传播规律存在很大的差异;此外在较小尺寸的房间内(与波长相比),低音无法良好再现,这是因为低音的波长较长的缘故,故在一般家庭中,如果听音室容积不足够大,低音效果很难达到理想状态。 很多现场调音师都没有理会到音频与波长的关系,其实这是很重要的:音频及波长与声音的速度是有直接的关系。在海拔空气压力下,21摄氏温度时,声音速度为344m/s,而我接触国内的调音师,他们常用的声音速度是34Om/s,这个是在15摄氏度的温度时声音的速度,但大家最主要记得就是声音的速度会随着空气温度及空气压力而改变的,温度越低,空气里的分子密度就会增高,所以声音的速度就会下降,而如果在高海拔的地方做现场音响,因为空气压力减少,空气内的分子变得稀少,声音速度就会增加。音频及波长与声音的关系是:波长=声音速度/频率;λ=v/f,如果假定音速是344m/s时,100Hz的音频的波长就是3.44m,1000hz(即lkHz)的波长就是34.4cm,而一个20kHz的音频波长为1.7cm。 D 对混响时间 声源停止发声后,声压级衰减到人耳听不到的程度所需要的时间。 D 动态范围 音响设备的最大声压级与可辨最小声压级之差。设备的最大声压级受信号失真、过热或损坏等因素限制,故为系统所能发出的最大不失真声音。声压级的下限取决于环境噪声、热噪声、电噪声等背景条件,故为可以听到的最小声音。动态范围越大,强声音信号就越不会发生过荷失真,就可以保证强声音有足够的震撼力,表现雷电交加等大幅度强烈变化的声音效果时能益发逼真,与此同时,弱信号声音也不会被各种噪声淹没,使纤弱的细节表现得淋漓尽致。一般来说,高保真音响系统的动态范围应该大于90分贝,太小时还原的音乐力度效果不良,感染力不足。在专业音响系统的调整过程中,音响师在调音时要主意以下两方面问题:一是调音台的的输入增益量不要调的过小,否则微弱的声音会被调音台的设备噪声所淹没。二是压限器的阈值和压缩比的调整要格外慎重,阈值过小和压缩比过大,都会使声音动态压缩严重,故应该在保证效果的前提下,尽量减少对声音的动态损失。另外,在放大电路和音源中也存在动态范围,此时即可分辨的最小信号和可达到的最大不失真信号之差。 导波模式

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

多语种在线语料库检索平台使用简明手册.pdf

多语种在线语料库检索平台使用简明手册 许家金 中国外语与教育研究中心 、访问及登录 访问(用户名:和密码:),可点击使用相应的语料库。目前平台上已安装英语、汉语、德语、日语、俄语、阿拉伯语、冰岛语等数十个语料库。 图:主界面 、功能概要 按()对语料库分析工具的时代划分,属于第四代语料库工具,即在线语料库分析工具。四代工具的突出代表是美国杨百翰()大学教授创建的系列语料库检索界面()。类似的在线语料库检索系统还有、、、等。而当前主流的语料库工具属于第三代,其中以、和等为代表。 第四代语料库工具,将语料库与分析工具合二为一,越来越受到普通用户的青睐。在线语料库工具通常将语料库文本按特定格式建成索引(),存储在服务器上。用户检索响应速度要远高于三代软件在本地电脑上的检索速度。其操作也较三代语料库软件简便得多。 四代语料库工具可完成三代语料库几乎所有的功能,其中又以所能实现的功能最多最全。更重的是,是开源软件。概括说来,可以实现以下功能。 ()在线生成语料库的词频表(); ()查询()字词、语言结构等,以获取大量语言实例或相应结构的出现频次(),并可以按语体、年代、章节、学生语言水平级别、写作题材等分别呈现查询结果; ()计算特定词语在语料库中的典型搭配(); ()计算语料库中的核心关键词(),等。

、使用实例 标准查询模式 在简单查询模式()下,可输入单词、短语等进行检索。 图:语料库查询界面 图:查询结果界面

点击查询结果页面右上角下拉菜单,显示(新查询)时,按键,即可重新回到语料库检索界面。相当于返回按钮。 新查询,返回语料库检索首页 查询结果随机抽样 频数分解、分解频数 查询结果的分布展示 查询结果排序设定 搭配计算 下载保存查询结果 (随机取样),比如,可从万行结果中,随机抽取行。 (频数分解)表示在进行复杂查询时,对命中的不同词项分别计算频数。比如,查询时,会按这个词项分别报告命中频数和频率。 图:动词查询(频数分解)结果示例 :按语体、年代、章节、学生语言水平、写作题材等分别呈现查询结果 图:语料库中"lov.*"的分布情况()

影音名词解释大全2

影音名词解释大全2 AC-3 杜比数字(DD)5.1声道数字环绕声格式原先的叫法。 有源分频网络(active crossover) 指可将声频信号中的低频、中频和高频在放大之前便加以分割而分别加到各自的发音单元往的一种有源电子电路。固然有源分频网络多用于超低音音箱中,但在多声道系统中,也可单独使用有源分频网络。 有源超低音音箱(active subwoofer) 指专门用于重放低频、并由内置功率放大器来驱动的那类音箱。 ADD 指CD唱片按模拟方式录音(A),而编辑和制片则均采用数字(D)方式。 模拟/数字变换器(ADC) 将模拟信号变换为数字信号的电路。 邻台选择性(adjacent-channel selectivity) 指接收调谐器能够选择所欲收听的电台并抑止邻近电台干扰的能力。 隔台选择(alternate-channel selectivity) 指接收调谐器能够抑止与所欲接收的电台相隔为二个台的其它电台的干扰的能力。 AES/EBU数字接口(AES/EBU inte*ce)

一种传送数字音频信号的专业接口,AES/EBU信号线为使用XLR插头的平 衡传输线。此外,也在某些消费电子产品中使用。是根据美国AES(声频工程协会)和EBU(欧洲广播同盟)来命名的。 逼人感(aggressive) 用于表示象要把音乐给抛投到聆听者眼前的那种前推型演出的声学术语。 空气感(air) 用于表示高音的开阔,或是声场中在乐器之间有空间间隔的声学术语。此时,高频响应可延伸到15kHz-20kHz。反义词有"昏暗(dull)"和"厚重(thick)"。 气悬式唱臂(air-bearing tonearm) 指LP电唱盘的唱臂系用空气垫来支撑的一种唱臂。 气悬式电唱盘(air-bearing turntable) 指唱盘系由空气垫来托起的那种唱盘。 环绕感(ambience) 也称包围感。指电影伴音所产生的那种有一定规模和空间的包围感。通常 是由环绕音箱来营造的。 安培(ampere) 电流的计量单位,用A表示。 解析(analytical) 指音响器材能巨细无遗的再现录音制品中的每一细节,但却用的是错误的 方式,此种解析方式极缺乏音乐味。 模拟(analog)

CCL语料库与检索系统方案

一关于CCL语料库及其检索系统 (如果时间紧张,可直接跳到最后的举例部分!) 1.1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。 1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。 1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式 1.4 语料库中的中文文本未经分词处理。 1.5 检索系统以汉字为基本单位。 1.6 主要功能特色: ?支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); ?支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句); ?支持在“结果集”中继续检索; ?用户可定制查询结果的显示方式(如左右长度,排序等); ?用户可从网页上下载查询结果(text文件); 二关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明。 2.1 特殊符号 查询表达式中可以使用的特殊符号包括8个: | $ # + - ~ ! : 这些符号分为四组: Operator1: | Operator2: $ # + - ~ Operaotr3: !

Delimiter: : 符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2.2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2.3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number (4) + 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数刚好等于Number (5) - 表示它左边的“简单项”出现于句子中,并且,在右边相隔Number个字的范围内,-号右边的“简单项”不出现。 (6) ~ 表示它左边的“简单项”出现于句子中,并且,在左边相隔Number个字的范围内,~号右边的“简单项”不出现。 (三)Operator3:Operator3是一元操作符。 (7) ! 表示它后面的“简单项”是本次查询的主关键字符串,显示查询结果时以该“简单项”作为中心来进行定位。 注意: Operator2后面的Number是必须的,不能省略。Number=0表示相 邻,Number=1表示间隔1个单位,其余依此类推。 (四)Delimiter:西文冒号 : 是分隔符 (8) : 跟在 path,author,name,type,pattern 等关键字后面,用于分隔关键字和它们的取值。这样形成的查询式我们称之为“过滤项”(见下面2.5) 注意:上述特殊字符不能作为基本项在语料库中进行检索。path,author等关键字可以作为基本项进行检索。 2.2 基本项 指不包含特殊符号和空格的连续字符串

音响术语解释

音响术语解释(一) 声场设计 a/b试听比较(a/b comparison)指对两种不同的音乐重放方式进行的反复试听比较。 a/v 为audio(音响)与video(视频)的缩写,指兼有视听特性的那些影音产品。 a/v功放接收机(a/v receiver)为家庭影院系统的心脏部分。负责接收由节目源送来的信号,选择需要观看和聆听的信号,控制重放的音量,完成环绕声解码,收听电台节目,并将选定的信号予以放大,以便能推动家庭影院的成套音箱。也称为“环绕声接收机”。 a/v回路(a/v loop)指所用a/v功放接收机和a/v前置放大器上安装的那些a/v 输入与a/v输出对,系用于跟既能录音又能播放音频和视频信号的a/v器材连接的。比如,一台录像机便能跟a/v功放接收机或a/v前置放大器的a/v回路连接。 a/v前置放大器/调谐器(a/v preamplifier/turner)指在同一机箱内装有am(调幅)或fm(调频)接收调谐器的a/v前置放大器。 a/v前置放大器(a/v preamplifier)也称“a/v控制器”,是用来控制音量,选择节目源和完成环绕声解码功放的一种音响器材。 a/v输入(a/v input)指既设置得有音频又设置有视频插座的a/v功放接收机或a/v前置放大器的输入端。 aad 指录音及后期制作皆为模拟(a)方式,而只有制片使用数字(d)方式的cd 唱片制作。 ac-3 杜比数字(dd)5.1声道数字环绕声格式原先的叫法。 ac(alternating current)交流电,指电流方向会作周期性改变的市电供电电源,英美多用60hz,我国则采用50hz的。

声学专业词汇

波长 声波振动一次所传播的距离,用声波的速度除以声波的频率就可以计算出该频率声波的波长,声波的波长范围为17米至1.7厘米,在室内声学中,波长的计算对于声场的分析有着十分重要的意义,要充分重视波长的作用。例如只有障碍物在尺寸大于一个声波波长的情况下,声波才会正常反射,否则绕射、散射等现象加重,声影区域变小,声学特性截然不同;再比如大于2倍波长的声场称为远场,小于2倍波长的声场称为近场,远场和近场的声场分布和声音传播规律存在很大的差异;此外在较小尺寸的房间内(与波长相比),低音无法良好再现,这是因为低音的波长较长的缘故,故在一般家庭中,如果听音室容积不足够大,低音效果很难达到理想状态。 很多现场调音师都没有理会到音频与波长的关系,其实这是很重要的:音频及波长与声音的速度是有直接的关系。在海拔空气压力下,21摄氏温度时,声音速度为344m/s,而我接触国内的调音师,他们常用的声音速度是34Om/s,这个是在15摄氏度的温度时声音的速度,但大家最主要记得就是声音的速度会随着空气温度及空气压力而改变的,温度越低,空气里的分子密度就会增高,所以声音的速度就会下降,而如果在高海拔的地方做现场音响,因为空气压力减少,空气内的分子变得稀少,声音速度就会增加。音频及波长与声音的关系是:波长=声音速度/频率;λ=v/f,如果假定音速是344 m/s时,100Hz的音频的波长就是3.44 m,1000hz(即lkHz)的波长就是34.4 cm,而一个20kHz的音频波长为1.7cm。 动态范围 音响设备的最大声压级与可辨最小声压级之差。设备的最大声压级受信号失真、过热或损坏等因素限制,故为系统所能发出的最大不失真声音。声压级的下限取决于环境噪声、热噪声、电噪声等背景条件,故为可以听到的最小声音。动态范围越大,强声音信号就越不会发生过荷失真,就可以保证强声音有足够的震撼力,表现雷电交加等大幅度强烈变化的声音效果时能益发逼真,与此同时,弱信号声音也不会被各种噪声淹没,使纤弱的细节表现得淋漓尽致。一般来说,高保真音响系统的动态范围应该大于90分贝,太小时还原的音乐力度效果不良,感染力不足。在专业音响系统的调整过程中,音响师在调音时要主意以下两方面问题:一是调音台的的输入增益量不要调的过小,否则微弱的声音会被调音台的设备噪声所淹没。二是压限器的阈值和压缩比的调整要格外慎重,阈值过小和压缩比过大,都会使声音动态压缩严重,故应该在保证效果的前提下,尽量减少对声音的动态损失。另外,

语料库

关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源; 在语言学中,语料库(Corpus)指大量文本的集合,库中的文本(称为语料)通常经过整理,具有既定的格式与标记,特指计算机存储的数字化语料库。 语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。 分类 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。 除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。目前已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS ) corpus(短消息服务(SMS)语料)等。 特征 语料库有三点特征 1.语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库; 2.语料库是承载语言知识的基础资源,但并不等于语言知识;

北京语料库检索使用说明

北京语料库检索使用说明 首页 一关于CCL语料库及其检索系统 二关于查询表达式 2.1 特殊符号 2.2 基本项 2.3 简单项 2.4 复杂项 2.5 过滤项 2.6 子句 2.7 查询表达式 三关于查询结果 四在结果中查找 五举例 一关于CCL语料库及其检索系统 1.1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。 1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。 1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式

1.4 语料库中的中文文本未经分词处理。 1.5 检索系统以汉字为基本单位。 1.6 主要功能特色: ?支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); ?支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句); ?支持在“结果集”中继续检索; ?用户可定制查询结果的显示方式(如左右长度,排序等); ?用户可从网页上下载查询结果(text文件); 二关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明。 2.1 特殊符号 查询表达式中可以使用的特殊符号包括7个: | $ # + - ~ ! 这些符号分为三组: Operator1: | Operator2: $ # + - ~ Operaotr3: ! 符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2.2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2.3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number

建筑声学名词解释2013.10.31

混响时间Reverberation time(简称“T60”):室内声音达到稳定状态,平均声能密度自原始值衰变到其百万分之一所需要的时间(或声能密度衰减60dB所需要的时间)。 回声echo:大小和时差都大到足以能和直达声区别开来的反射声或由于其他原因反回的声。 颤动回声fiutter echo:同一声源原始脉冲声引起的一连串紧跟着的反射脉冲声。 吸声系数sound absorption coefficient:在给定频率和条件下,被分界面(表面)或媒质吸收的声功率,加上经过分界面(墙或间壁等)透射的声功率所得的总和,与入射声功率之比。一般其测量条件和频率应加以说明。 噪声控制noise control:将噪声控制在容许范围内,以获得适宜的声学环境的技术。 噪声控制标准criteria for noise control:在不同情况下容许的最高噪声级的标准。 低频噪声low-frequency noise:主要噪声成分的频率低于500Hz的噪声。 中频噪声mid-frequency noise:主要噪声成分的频率为500~1000Hz的噪声。 高频噪声high-frequency noise:主要噪声成分的频率高于1000Hz的噪声。 空气动力噪声aerodynamic noise:高速气流、不稳定气流以

及由于气流与物体相互作用产生的噪声。 再生噪声regenerative noise:气流通过消声器及其以后的风管、构件时,由于冲击振动和涡流而产生的噪声。 吸声sound absorption:特指在房间内表面装贴吸声材料或在空间悬挂吸声体,以降低房间噪声的措施。 噪声自然衰减量natural attenuation quantity of noise:通风和空气调节系统的噪声在传播过程中,由于气流同管壁的摩擦,部分声能转化为热能,以及管道截面变化和构造不同,部分声能反射回声源处,从而使噪声有所衰减的量。 房间吸声量room absorption:房间内表面和物体的总吸声量加上室内空气对噪声的衰减量。 消声sound attenuation;moise reduction sound deadening:通过一定手段,对噪声加以控制,使其降低到容许范围内的技术。 消声量sound deadening capacity:消声器两端声压级的差值。 消声器muffler;sound absorber;deafener:利用声的吸收、反射、干涉等原理,降低通风与空气调节系统中气流噪声的装置。 阻性消声器resistive muffler:利用吸声材料的吸声作用,使沿管道传播的噪声,在其中不断被吸收和逐渐衰减的消声装置。 抗性消声器reactive muffler:内部不装任何吸声材料,仅依靠管道截面积的改变或旁接共振腔等,在声传播过程中引起声阻抗的改

基于语料库、体裁分析和建构

基于语料库、体裁分析和建构 【摘要】本文回顾了英语概要写作国内外的研究现状,通过大学英语概要写作语料库研究了英语概要写作的语场特征,提出了基于语料库、体裁分析和建构主义教学模式相结合的支架式英语概要写作教学模式,本研究对于提高英语读、写结合教学具有重要意义。 【关键词】概要写作语料库体裁建构主义 概要(summary)是一种对原始文献(或文章)的基本内容进行浓缩的语义连贯的短文。它以迅速掌握原文内容梗概为目的,不加主观评论和解释,但必须简明、确切地表述原文的重要内容。概要写作(summary writing)是一种控制性的作文形式,它能使学生通过阅读原文,吸收原文的文章结构与语言方面的长处,写出内容一致、结构近似、语言简洁的短文。这种写作既要准确理解原文,又要能综合概括;既能培养欣赏能力,又能训练书面表达能力。 1 英语概要写作研究综述 曾炳辉(1989)在《英语概要写作与智力训练》中论述了概要写作是训练抽象概括能力即思维能力的最好的形式之一;郑文(2007)就大学英语读写过程中存在的输入和输出的矛盾,提出利用阅读教材作为写作输入,培养篇章图式;利用概要写作训练作为写作输出,揭示学生篇章图式的不足,提高学生的读写水平;张新玲和曾用强(2009)在《读写结合写作测试任务在大型考试中的构念效度验证》中从构念效度的实质方面入手对这类任务在我国大规模考试中所得分数进行效度验证,发现所取样本考生的读写结合写作测试应答数据和构念理论相拟合。 而国外学者,已经开始运用语料库,体裁分析理论,语篇分析理论和形式结构分析理论研究概要写作,如Rosalie Friend的“Effects of Strategy Instruction on Summary Writing of College Students”;Daniel Marcu的“From text discourse structures to text summaries”;Esther Uso Juan和Juan Carlos Palmer Silveira的“A Product-Focused Approach to Text Summarisation”;Sa-Kwang Song,Dong Hyun Jang,Sung Hyon Myaeng的“Text Summarization Based on Sentence Clustering wi th Rhetorical Structure Information”以及Jade Goldstein Stewart的“Genre Oriented Summarization”等。 2基于语料库的英语概要写作研究 语料库语言学研究的诞生可以追溯到19世纪末,二十世纪中叶以后随着计算机的广泛普及与使用,现今语料库的规模越来越大、种类越来越多,利用语料库进行语言研究和语言学习的人也就越来越方便。本研究建立了大学英语概要写作语料库,其目的是通过语料库来研究大学英语概要写作的篇章及体裁的一部份特点,为大学英语概要写作的教学及测试评价提供一定的依据。大学英语概要写作语料库中包括两个子语料库:概要写作原文库,概要写作库。每个子语料库按

语料库的应用(最终)

语料库的应用 语料库方法广泛应用于语言学理论研究、军事等领域。当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。 军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。 【一】、语料库成为语言学理论研究的基础资源 语料库是计算语言学的基础。语料库对应的英文是corpus,复数形式为corpora。这个词既可以指语料也可以表示语料库。英国语言学专家戴维?克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也

可作为验证语言假说的手段。计算机语料库是一大批机器可读文本的结集。各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。 起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。 我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。 目前国外已建成且较有影响的主要为以下的语料库:美国:布朗大学的今日美国英语标准语料库(The Brown University Standard Corpusof Present Day American English)、兰卡斯特一奥斯陆/卑尔根语料库(The Lancast-er-Oslo/Bergen (LOB) Corpus)、英语语库(TheBank of English)、英国国家语料库(The BritishNational Corpus(BNC、伦敦一隆德语料库(Lon-don -Lund Corpus(LLC》、美国传统中介语料(American Heritage Intermediate(AHI) Corpus)以及英语国际语料库(The Intemational Corpus ofEnglish(ICE》等。

语料库话语分析综述

近十年国内基于语料库的话语研究综述 A Review of Ten - year Research on Corpus-Based Discourse Analysis in China 摘要:文章从基于语料库的话语研究领域出发,通过对2002年至2011年发表在国内八种核心期刊上的论文进行统计与分析,发现这些研究在研究领域取得了很大的进步,涉及到话语各个方向,对于实践有重大指导作用,但同时也出现一些问题值得我们关注。 Abstract: From corpus-based discourse analysis, this thesis finds this field has made great progress, relates to many directions of discourse and has a significant guiding role for the practice, but also brings many problems worthy our attention. All of these are derived from the research and analysis of thesises published in 8 kinds of core journals from 2002 to 2011 in China. 关键词: 语料库话语基于语料库的话语研究 0. 引言 现代语料库语言学是20世纪中后期兴起的一门语言研究科学。语料库是指按一定的语言学原则,运用随即抽样的方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。在20 世纪后半叶的西方语言学界, Chomsky的观点大行其道,秉承该学说的语言研究者唯直觉语料独尊。他们躲在书斋,满足于依靠自己的直觉语料从事语言研究。随着社会语言学、话语分析、语用学、语料库语言学的兴起,越来越多的语言学家认识到光靠直觉语料来研究语言是远远不够的,人们还必须借助语料库语料以及其他各种语料,只有这样我们才能更好地揭示语言的本质,克服直觉语料的局限与不足。这样基于语料库的话语研究越发引起大家的重视,并取得了丰硕的成果。国内基于语料库的话语研究虽然起步较晚,但是成果仍然颇丰。 1. 研究样本 由于近几年运用语料库来做话语研究已经成为语言研究的热点,笔者通过检索主题与关键词,将文献定在2002年至2011年这十年期间,研究样本来源为发表在八种外语类核心期刊的22篇文章。这是因为这8种外语类期刊有一定的权

相关文档
最新文档