CTB 词性标注中文版翻译

CTB 词性标注中文版翻译
CTB 词性标注中文版翻译

CTB词性标注指南

第一章

引言

中文几乎没有屈折语素。譬如,词语不随时态、格、人称和数量而曲折变化。因此,对特定文本中的词进行词性标注往往都很困难。

这个文件是专为宾州中文树库项目[XPS+00]所设计的。这个项目的目标是构建一个十万词的有语法托架的中文官话文本语料库。标注包括两个步骤:第一阶段是中文分词和词性标注,第二阶段是句法托架。每个步骤包括至少两个经过,即数据库由一个标注者标注,结果文件由另一个标注者检查。

词性标注指南,就如分词指南和托架指南,在项目进行过程中已经修订了多次。到目前为止,我们已经在我们的网站上发行了三个版本:第一部草作完成于1998年12月,在第一个中文分词和词性标注文件发行后;第二部草作完成于1999年3月,在第二个中文分词和词性标注文件发行后;这个文件,是第三部草作,修订于第二个托架文件发行后。在这个第三部草作中,与前两部草作相比,主要改变在于:(1)我们增加了一章引言来解释指南中存在的一些基本原理;(2)我们增加了对中文词语的注释;(3)我们把这个指南写成了一个技术性报告,报告被发表于宾夕法尼亚大学认知科学研究机构(IRCS)。

1.1 标注标准

词性标注(POS)的核心问题是词性标注是否应该基于意义或者句法分布来标注。这个问题自1950年以来就被热烈争论到现在,并且始终存在两种不同的观点。譬如,中文词“毁灭”可以被翻译为英文中的destroy或destroys或destroyed或destroying或destruction,并且如它英文所对应的词一样使用。根据第一种观点,词性标注应该只基于意义。因为词的意义在它所有的用法中基本都是一样的,它就应该总是被标注为一个动词。第二种观点是词性标注应该由词的句法分布来决定。当“毁灭”是一个名词短语的首词,它在那个文本中就应该被标注为一个名词;当“毁灭”是一个动词短语的首词,它就应该被标注为一个动词。

我们选择了句法分布作为我们词性标注的主要标准,因为这与当代语言学理论所采纳的原则一致,譬如X-bar理论和GB理论中的首字投射概念。

由于很多中文动词也出现在名词位置,因此需要两个词性标注标记,这就导致使用句法分布方法将会扩大词典的规模,因此这个原因常被用来反对句法分布方法。我们认为这个观点不足以让人信服,主要有如下两个理由。首先,两个词性标注标记可以让我们区别可以出现在名词位置的动词和不可以出现名词位置的动词(譬如单音词动词和重叠词形式的动词如AABB,A不A)。如果存在动词可以出现在名词位置或者不能出现在名词位置的实词虚化现象,这些实词虚化可以被看做构形规则,这会使得词典自动被扩大。另一方面,如果不存在这样的实词虚化现象并且名词化过程大部分都很特殊,这就验证了一个观点:这是一个词汇现象并且那些可以被名词化的动词在词典中应该有两个词性标注标记。其次,很多动词可以出现在名词位置的现象并不只存在于中文,在其他语言中设立的标准也是给予这些词两个标记。

1.2 词性标注标记集

我们的词性标注标记集有33种标记:

动词,形容词(4):V A,VC,VE,VV。

名词(3):NR,NT,NN。

定位(1):LC。

代词(1):PN。

限定词和数词(3):DT,CD,OD。

度量词(1):M。

副词(1):AD

介词(1):P。

连词(2):CC,CS。

助词(8):DEC,DEG,DER,DEV,SP,AS,ETC,SP,MSP。

其他(8):IJ,ON,PU,JJ,FW,LB,SB,BA。

1.3 词性标注标记集

假设我们从一个大部分人认同的小型词性标注标记集开始,其中包括名词、动词、副词、介词等的标记。问题在于我们是否应该用一组更为具体的标记{T1,T2,…,T i,…,T n}来取代每个标记T。有如下几个因素需要考虑:

·通常,由于有相同词性标注标记的词都具有极为相似的句法分布,标注需要一个很大的标记集。另一方面,标记集越大,标注起来越困难。因为标注者需要记住更多标记、更多测试并且应用一致。因此,当我们决定一个标记集时,我们需要作出妥协。

·设置一组(T)作为标有词性标注标记T的词的标记集。如果没有好的测试把标记集(T)中的每个词分配给任一标记T i,并且{T i}相比T没有提供更多有意义的信息,那么我们就不会把T分割成标记集{T i}。

·如果集合(T)是一个闭合标记集并且对于每组(i,j),标记集(T i)和(T j)的交集为空,那么通过一个简单的转换程序可以把词/T自动取代为词/T i。因此,如果我们想用{T i}中的具体标记来标注词语,这个转换过程可以由程序来自动完成,而不是通过标注者手动转换。

1.4 处理困难案例

有时候,我们不是很确定一个文本中的某个词是否应该被标注为X或Y。如果我们确定这个词不在标记集(X)和(Y)的交集中,那么我们可以简单选择一个标记如X来标注这个词,如果有需要也可以再用Y来取代X。譬如,词语“许多”在“许多学生”这个短语中,既是一个JJ(名词作定语)又是一个DT(限定词)或是一个CD(限定数量词),并且它应该确切地标记为这三个标记之一。我们简单选择一个看似更为恰当的标记,然后根据需要可以再用别的标记来自动取代。

另一方面,如果我们知道在另一个文本中,这个词被标记为两个标记之一,假设为X,那么我们应该判断这个词在两个文本中是否扮演相同的角色。如果我们确定这个词在两个文本中词性是一样的,我们应该标记它为X;否则,标记它为Y。譬如,“又”在“(1)又…又…,譬如又搞笑又难过”中既是一个AD(副词)又是一个CC(联合短语的标记“和”),而“又”在“(2)他又来了”中明显是一个AD(副词)。由于我们不确定“又”在这两个文本中扮演的角色是否相同,我们把(1)中的词“又”标记为CC。隐藏在这个决定后面的基本原理是,如果之后我们想标记(1)中的词“又”为AD,我们可以简单地用又/AD 替换又/CC。但是如果我们现在就把(1)中的词“又”标记为AD,并且之后想要把它改为CC,那么我们需要区别这两个文本并且确定只有(1)中的“又”需要改为又/CC,而不是把(2)中的“又”改为又/CC。

1.5 标注法

用于这个文件的一些标注法:

·脱离文本,一个词可以有多种标记,“一个词w在标记集(T)中”意味着T是词w 的标记之一。

·标记N代表所有名词标记(NT/NN/NR)。标记V代表所有动词标记(V A/VV/VC/VE)。“Det+M”是DT+(OD|CD)+M的速记符,其中DT,OD,CD可能出现也可能不出现。

·“一个词可以被否定”是“一个肯定意义的词可以被否定”的缩略说法。相似地,“一个词可以出现在A不是A”意味着“一个词可以出现在问题模式A不A”。

·对于注释,我们不翻译度量词、助词和标记为LB、SB、BA、VC的词。相反地,我们用它们的词性标注标记来标记这些词。

第二章

宾州树库词性标注标记集

2.1 动词:V A,VC,VE,VV

一般地,动词满足以下特征:

·动词(除了助动词等)作为一个从句的谓语(主句或嵌入分句)。

·动词可以用“不”或者“没”来否定。

·体标记可以附属于大多数但不是全部的动词。

·大多数动词可以出现在“A不A”中。

如果一个词w在集合(V)中是一个名词短语作为词首,那么它被标记为N而非V。如果词w在集合(V)中是一个名词修饰语(排除V是一个关系从句的首部的情况),那么它被标记为N或者JJ(根据对N和JJ的测试),而非V。

2.1.1 谓词性形容词:V A

谓词性形容词大致上相当于英语中的形容词和中文语法中、文学作品里的静态动词。我们的谓词性形容词包括两类:

第一类:没有宾语且能被“很”修饰的谓语。

第二类:源自第一类的、通过重叠(如红彤彤)或者通过名词加形容词模式意味着“像N一样A”(如雪白)的谓语。这个类型的谓词性形容词没有宾语,但是有一些不能被“很”修饰,因为这些词的强调意思已经内嵌在词内了。

注意:当集合(VA)中的一个词修饰名词但没有用“的”,那么它被标注为JJ(名作定)或是一个名词,而不是V A。当集合(V A)中的一个词有一个宾语,那么它被标注为VV,而不是VA。譬如,这项/M 活动丰富/VV 了/AS 他的/DEG 生活。

2.1.2 系动词:VC

“是”和“为”被标记为VC。如果“非”的意思是“不是”并且句子里没有其他动词时,“非”也被标注为VC。

“是”有几种用法:

·连接两个名词短语或者主语:他是/VC 学生。

·在分裂句中:他是/VC 昨天来的/SP。

·为了强调:他是/VC 喜欢看书。

现在,在所有这些情况中,“是”被标注为VC。

2.1.3 “有”作为主要动词:VE

只有当“有,没{有}”和“无”作为主要动词时(包括占有的“有”和表存在的“有”等等),被标注为VE。

2.1.4 其他动词:VV

VV包括其他动词,诸如情态动词,提升谓词(如“可能”),控制动词(如“要”、“想”),行为动词(如“走”),心理动词(如“喜欢”、“了解”、“怨恨”),等等。

2.2 名词:NR,NT,NN

一个名词可以是一个谓语或者一个介词的论元。通常,

·名词不能被程度副词和否定副词诸如“很”、“不”来修饰。

·很多名词可以被Det+M结构修饰。

·名词可以直接修饰名词(也就是说,没有“的”)。

如果一个词是一个名词短语的首部,那么它就被标注为一个名词。有时候很难识别一个短语是否为名词短语。一些可以作为判别名词短语的测试如下:

·如果短语XP被一个Det+M短语所修饰,并且在其他文本中Det+M短语只修饰名词短语,那么XP很可能是名词短语。

·如果短语XP是一个动词或者一个介词的论元,并且这些动词和介词在其他文本中只充当名词短语的论元,那么XP很可能是名词短语。

·如果短语XP被“ZP的/DEG或DEC”所修饰,那么XP很可能是名词短语。

2.2.1 专有名词:NR

专有名词是名词的子集。一个专有名词可以是一个特定的人名,政治或地理上定义的地方(城市、国家、河流、山脉等),或者是一种组织(企业、政府或其他组织实体)。一个专有名词通常是独一无二,并且不能被Det+M所修饰的。

·以下名字是专有名词:

地区/国家/村庄/城市,山脉/河流,报纸/杂志,组织/公司,学校/联盟/基金会,个人/家庭。

·以下名字不是专有名词:

国籍(如中国人),种族(如白人),职称(如教授),疾病,职业,器官(如肺),乐器(如钢琴),游戏(如足球),花(如玫瑰),等等。

2.2.2 时间名词:NT

时间名词可以是介词的宾语,譬如在、从、到、等到。它们可以被问及,如“这个时候”,也可以被用以提问“什么时候”。它们也可以直接修饰VP(动词短语)或者S(主语)。像其他名词一样,时间名词可以是某些动词的论元。

时间名词可以是时间的名称(如1990年、一月、汉朝)或是由“PN+LC,N+LC,DT+N”等结构组成。

例子:一月、汉朝、当今、何时、今后

2.2.3 其他名词:NN

其他名词包括所有其他名词。其他名词NN,除了地方名词,一般不能修饰动词短语(有

“地/DEV”或者没“地/DEV”)。

2.3 方位词:LC

很多名词单独使用时不能作为介词如“在”、“到”的论元,也不能直接修饰VP(动词短语)或者S(主语)。方位词的一个功能是连接前述的名词短语或者主语,从而使整个短语可以作为这些介词的论元或者来修饰动词短语或主语。

一些方位词可以独立使用作为介词或动词的论元。一些方位词可以被“最”修饰。方位词不能被Det+M所修饰。

方位词分为两类:

·方位词:这类方位词表示方向、位置等。它们来自名词。一些可以单独使用作为介词或动词的论元。一些可以被“最”修饰。它们不能被Det+M所修饰。

—单音节方位词:如:前,后,里,外,内,北,东,边,侧,底,间,末,旁。

—双音节方位词:它们由以下部分组成:

*单音节方位词加上诸如“以、之”等的语素。

例子:之间,以北。

*两个单音节方位词。

例子:前后,左右,上下,东北。

·其他:我们把以下情况标注为LC。

. 为止:到目前为止。

. 开始:从四月开始。

. 来:5年来。

. 以来:1998年以来。

. 起:一九九三年起。

. 在内:包括他在内。

2.4 代词:PN

代词的功能是作为名词短语的替代物或者表示事先详细说明的或者从上下文可知晓的被叫的人或事。它们一般不受Det+M或者形容词性短语修饰。

代词包括人称代词(如我、你),当作为名词短语单独使用时为指示代词(如这、那),所有格代名词(如其)以及反身代词(如我自己、自己)。

2.5 限定词和数词:DT,CD,OD

2.5.1 限定词:DT

限定词包括指示词(如这、那、该)和诸如“每、各、前、后”等词。限定词不包括基数词和序列词。

参见4.11限定词部分。

2.5.2 基数词:CD

CD包括基数词并随意与一些概数词连用,如“来、多、好几”和诸如“好些、若干、半、许多、很多(如很多学生)”等词。

例子:1245,一百。

2.5.3 序列词:OD

序列词被标注为OD。我们把第+CD看做一个词,并标注它为OD。

例子:第一百。

2.6 度量衡:M

度量词跟在数字后形成Det+M结构修饰名词或动词,包括类词(如“个”),表示一群的度量词,如“群”,以及公里、升等度量词。

一些度量词可以被有限的形容词(如一/CD小/JJ瓶/M水/NN),临时量词可以被名词和形容词修饰(如:一/CD铁/NN箱子/M书/NN)。

2.7 副词:AD

副词包括情态副词、频率副词、程度副词、连接副词等,大部分副词的功能是修饰动词短语或主语。

如:仍然、很、最、大大、又、约

2.8介词:P

介词可以把名词短语或从句作为论元。

注释:把和被不标注为P,详见2.11部分。

如:从、对

2.9连接词:CC,CS

注释:在传统中文语法书中,连词根据它们的句法分布标记为CC,CS或AD。

CC连接两个功能相同的等价的成分(名词短语,从句等),CS是在从属句前的连词,连接副词经常出现在主句和相应的从句中,如:如果/CS,……就/AD……。

2.9.1 并列连接词:CC

CC的主要模式是:XP{,},CC XP。

如:与、和、或、或者、还是(or)

2.9.2 从属连词:CS

从属连词连接两个句子,一个句子从属于另一个,这样的连词标记为CS。CS模式是:CS S1,S2和S2 CS,S1。

如:如果/CS,……就/AD……

2.10 虚词:DEC,DEG,DER,DEV,AS,SP,ETC,MSP

2.10.1 “的”作为补语标记/名词化标记:DEC(的,之)

如:吃的DEC

模式是:S/VP DEC{NP}

注:的还有其他标记

·DEC 他的/DEG车

·SP 他是/VC一定要来的/SP。

·AS 他是/VC在这里下的/AS车。

2.10.2 “的”作为关联标记或所有格标记:DEG

模式:NP/PP/JJ/DT DEG{NP}。

2.10.3 补语短语得:DER

在V-得-R和V-得结构中,“得”标记为DER。

注:有些以“得”结尾的搭配不是V-得结构,如记得,获得是动词。

2.10.4 方式“地”:DEV

当“地”出现在“XP地VP”,XP修饰VP。在一些古典文学中,“的”也用于这种情景,此时“的”也标注为DEV。

2.10.5 动态助词:AS

动态助词仅包括“着,了,过,的”。

2.10.6 句末助词:SP

SP经常出现在句末,如:他好吧[SP]?

有时,句末助词用于表停顿,如:他吧[SP],人很好。

如:了,呢,吧,啊,呀,吗

2.10.7 ETC

ETC用于标注等,等等。

2.10.8 其他助词:MSP

“所,以,来,而”,当它们出现在VP前时,标注为MSP。

所:他所[MSP]需要的/DEC

以或来:用……以/MSP(或来)维持

而:为……而[MSP]奋斗

2.11 其他:IJ,ON,LB,SB,BA,JJ,FW,PU

2.11.1 感叹词:IJ

出现在句首位置的感叹词,如:啊。

2.11.2 拟声词:ON

①修饰“ON地V”中的VP:雨哗哗[ON]地[DEV]下了[AS]一夜

②修饰“ON中的N”中的NP:砰[ON]的/DEG一声!

③自行成句:砰砰[ON]!

④一般不能被副词修饰,如:哗啦啦,咯吱。

2.11.3 长“被”结构:LB

仅包括“被,叫,给,为(口语中)”,当它们出现在被字结构NP0+LB+NP1+VP中如:他被/LB 我训了/AS 一顿/M .

注:当叫作为兼语动词时,“叫”标注为VV。

如:他叫/VV你去。

2.11.4 短“被”结构:SB(仅包括口语中的“被,给”)

NP0+SB+VP,他被/SB 训了/AS一顿/M。

注:“给”有其他标记:LB,VV和P。

如:你给/P他写封/M信。

2.11.5 把字结构:BA

仅包括“把,将”,当它们出现在把字结构中(NP0+BA+NP1+VP)。

如:他把/BA你骗了/AS。

注:“将”有其他标记:AD和VV,如:他将/VV了[AS]我的[DEG]军。

2.11.6 其他名词修饰语:JJ

包括三种类型:

①区别词只修饰模式JJ+的+{N}或JJ+N中的名词,且一定要有“的”,它们不能被程度副词修饰。

如:共同/JJ的/DEG目标/NN,她是[VC]女/JJ的/DEG。

②带有连字符的复合词

通常为双音节词JJ+N 如留美/JJ学者/NN

③形容词:新/JJ消息/NN

模式:JJ+N

注:当“的/DEC”在形容词和名词中间时,形容词标记为VA。

2.11.7 外来词:FW

FW仅被用于:当词性标注标记在上下文中不是很清楚时。外来词不包括外来词的翻译,不包括混合中文的词(如卡拉OK/NN,A型/NN),不包括词义和词性在文中都是清楚的词。

2.11.8 标点:PU

当标点是词的一部分时,不用标注为PU,如123,456/CD。

美国大学校名英文缩写

美国大学校名英文缩写 英文缩写英文全称中文全称 AAMU Alabama A&M 阿拉巴马农业机械大学ADELPHI Adelphi University 艾德菲大学AMERICAN American University 美国大学 ANDREWS Andrews University 安德鲁大学 ASU Arizona State University 亚利桑那州立大学AUBURN Auburn University 奥本大学 -B- BAYLOR Baylor University 贝勒大学 BC Boston College 波士顿学院 BGSU Bowling Green State University 博林格林州立大学BIOLA Biola University 拜欧拉大学BRANDEIS Brandeis University 布兰迪斯大学BROWN Brown University 布朗大学 BSU Ball State University 波尔州立大学 BU* Boston University 波士顿大学 BU SUNY Binghamton 纽约州立大学宾厄姆顿分校BYU Brigham Young Univ. Provo 百翰大学 *BU通常意义上指Boston University -C- CALTECH California Institute of Technology 加州理工大学 CAU Clark Atlanta University 克拉克亚特兰大大学 CLARKSON Clarkson University 克拉逊大学CLARKU Clark University 克拉克大学CLEMSON Clemson University 克莱姆森大学 CMU* Carnegie Mellon University 卡耐基梅隆大学CMU Central Michigan University 中央密歇根大学COLUMBIA Columbia University 哥伦比亚大学CORNELL Cornell University 康奈尔大学CSU* Colorado State 科罗拉多州立大学 CSU Cleveland State University 克里夫立大学CU* University of Colorado Boulder 科罗拉多大学波德分校 CU University of Colorado Denver 科罗拉多大学丹佛分校 CUA Catholic University of America 美国天主教大学 CWRU Case Western Reserve Univ. 凯斯西储大学*CMU 通常意义上指 Carnegie Mellon University *CSU 通用 *CU 通用

英文知名品牌与广告语翻译

DELL戴尔IBM HP惠普TCL LENOVO联想ASUS华硕BENQ明基LG (不用翻译) UNIS (清华紫光) sony(索尼)海尔HAIER 可口可乐(Coca-cola)、索尼(Sony)、金利来(Goldlion)、奔驰(Benz)、耐克(Nike)“翻得好(Findhow)”Vitasoy ( 维他奶 ) Johnson 婴儿护肤用品由原译名“庄臣”到现在译名“强生”;Reebok 运动鞋由“雷宝”更名为“锐步”;Hewelette Packare 电脑公司由冗长的“休利特一一帕卡德公司”简化为如今的惠普公司Head & Shoulders 译为“海飞丝”。 Panten 译为“潘婷”。 Safeguard 译为“舒肤佳”。 Olay 译为“玉兰油”。优雅动听、惟妙惟肖、回味无穷。日本Suntory 公司品牌的中文译名为三得利,不但发音贴切,且蕴涵中华人文精神。Kiss Me ( 化装品品牌 ) 奇士美。日本丰田公司的 LEXUS 汽车,其中文译名“凌志”取自“久有凌云志,重上井冈山”壮丽诗句。 锐步-Reebok彪马-Puma吉旺希-givenchy慕诗-MOISELLE欧时力-OCHIRLY阿勒锦-A.LerGin阿桑娜-azona瓦伦蒂诺-ntino卡西欧CASIO背靠背-Kappa欧莱雅-L"Oreal兰蔻-Lancome香奈儿-Chanel资生堂-Shiseido高丝-KOSE倩碧-Clinique玉兰油-OLAY兰芝-LANEIGE水之奥-H2O。za姬芮。娇兰-guerlain。POND'S 旁氏,迪奥-Dior, head-shoulders 海飞丝 head-shoulders舒蕾 slek曼秀雷敦 mentholatum宝洁pg爱家家居aika 飘柔纳爱斯屈臣氏 watsons联合利华 unilever高露洁 colgate欧尚 auchan丝宝集团 .c-bons.家乐福 carrefour沙宣佳洁士同仁堂安利 amway沃尔玛wal-mart特百惠 tupperware易初莲花 lotus* 吉列 Gilleffe 博朗 braun 护舒宝佳洁士 crest 欧乐-B oral--b帮宝适 pampers 汰渍 tide 兰诺lenor 金霸王 duraceli OLAY SK-II 伊奈美 illume 潘婷 pantene 飘柔海飞丝沙宣 vs 伊卡璐威娜 wella “福士伟根”“Volkswagen”, Bayerische MotorenWerke(拜耶里奇飞机引擎生产厂),简称为BMW,“宝马”名牌手机"诺基亚",芬兰文原名"Nokia",。 世界著名的十大化妆品有那些.主流产品是什么? Guerlain (娇兰)二:Lancome (兰蔻)三:Clarins(娇韵诗)四:Elizabetharden (伊丽莎白雅顿)五:Erno Laszlo (奥伦纳素)六:Estee Lauder (雅诗兰黛)七:Clinique (倩碧)八:Shiseido (资生堂)九:Christan Dior(迪奥)十:Chanel (香奈儿) Nike 耐克 H&M 瑞典 Levis 李维斯 GAP 盖普 Gucci 古琦 Prada 普拉达Hermes 爱玛仕 Versace 范思哲 Calvin Klein 卡尔文克莱恩 Dunhill 登喜路Lacoste 鳄鱼 MUJT 无印良品 Valentino 瓦伦蒂诺 Yves Saint Laurent伊夫·圣·洛朗 Dunhill 登喜路 112 美国,Lacoste 鳄鱼 72 法国,MUJT 无印良品 116 日本,Puma 彪马 56 德国,Lee 李 116 美国, Reebok 锐步 110 美国 Puma 彪马 Lee 李 Reebok 锐步 Giordano 佐丹奴 Mizuno 美津浓 Giorgio Armani 乔治·阿玛尼雪碧(饮料)Sprite小妖精,调皮鬼乐百氏(饮料)Robust健壮的金利来(领带)Goldlion金狮子司麦脱(衬衫)Smart潇洒的舒肤佳(香皂)Safeguard保护者纳爱斯(香皂)Nice美好的英克莱(自行车)Incline喜爱四通(打字机)Stone石头汰渍(洗衣粉)Tide潮流雷达(电蚊香)Raid袭击,搜捕飘柔(洗发水)Rejoice欣喜立士洁(卫生纸)Luxury奢侈品富绅(衬衫)Virtue美德神浪(服装)Sunland太阳地苏泊尔(压力锅)Super特级品天能(领带)Talent

CTB 词性标注中文版翻译

CTB词性标注指南 第一章 引言 中文几乎没有屈折语素。譬如,词语不随时态、格、人称和数量而曲折变化。因此,对特定文本中的词进行词性标注往往都很困难。 这个文件是专为宾州中文树库项目[XPS+00]所设计的。这个项目的目标是构建一个十万词的有语法托架的中文官话文本语料库。标注包括两个步骤:第一阶段是中文分词和词性标注,第二阶段是句法托架。每个步骤包括至少两个经过,即数据库由一个标注者标注,结果文件由另一个标注者检查。 词性标注指南,就如分词指南和托架指南,在项目进行过程中已经修订了多次。到目前为止,我们已经在我们的网站上发行了三个版本:第一部草作完成于1998年12月,在第一个中文分词和词性标注文件发行后;第二部草作完成于1999年3月,在第二个中文分词和词性标注文件发行后;这个文件,是第三部草作,修订于第二个托架文件发行后。在这个第三部草作中,与前两部草作相比,主要改变在于:(1)我们增加了一章引言来解释指南中存在的一些基本原理;(2)我们增加了对中文词语的注释;(3)我们把这个指南写成了一个技术性报告,报告被发表于宾夕法尼亚大学认知科学研究机构(IRCS)。 1.1 标注标准 词性标注(POS)的核心问题是词性标注是否应该基于意义或者句法分布来标注。这个问题自1950年以来就被热烈争论到现在,并且始终存在两种不同的观点。譬如,中文词“毁灭”可以被翻译为英文中的destroy或destroys或destroyed或destroying或destruction,并且如它英文所对应的词一样使用。根据第一种观点,词性标注应该只基于意义。因为词的意义在它所有的用法中基本都是一样的,它就应该总是被标注为一个动词。第二种观点是词性标注应该由词的句法分布来决定。当“毁灭”是一个名词短语的首词,它在那个文本中就应该被标注为一个名词;当“毁灭”是一个动词短语的首词,它就应该被标注为一个动词。 我们选择了句法分布作为我们词性标注的主要标准,因为这与当代语言学理论所采纳的原则一致,譬如X-bar理论和GB理论中的首字投射概念。 由于很多中文动词也出现在名词位置,因此需要两个词性标注标记,这就导致使用句法分布方法将会扩大词典的规模,因此这个原因常被用来反对句法分布方法。我们认为这个观点不足以让人信服,主要有如下两个理由。首先,两个词性标注标记可以让我们区别可以出现在名词位置的动词和不可以出现名词位置的动词(譬如单音词动词和重叠词形式的动词如AABB,A不A)。如果存在动词可以出现在名词位置或者不能出现在名词位置的实词虚化现象,这些实词虚化可以被看做构形规则,这会使得词典自动被扩大。另一方面,如果不存在这样的实词虚化现象并且名词化过程大部分都很特殊,这就验证了一个观点:这是一个词汇现象并且那些可以被名词化的动词在词典中应该有两个词性标注标记。其次,很多动词可以出现在名词位置的现象并不只存在于中文,在其他语言中设立的标准也是给予这些词两个标记。 1.2 词性标注标记集 我们的词性标注标记集有33种标记: 动词,形容词(4):V A,VC,VE,VV。

R语言学习系列12 文本分词

12.文本分词 文本分词,就是对文本进行合理的分割,从而可以比较快捷地获取关键信息。 例如,电商平台要想了解更多消费者的心声,就需要对消费者的文本评论数据进行内在信息的数据挖掘分析,而文本分词是文本挖掘的重要步骤。 R语言中,对中文分词支持较好的包有RWordseg包和jiebaR包。 一、配置Java环境 步骤1.下载JDK安装包 https://www.360docs.net/doc/368917326.html,/technetwork/java/javase/downloads/index.html 点Java Download图标进入下载界面(Java SE Development Kit);点Accept License Agreement,接受许可协议,选择对应系统的版本下载,比如Windows x64 步骤2.安装JDK 安装路径(可修改),比如D:\Program Files\Java\jdk1.8.0_101 特别注意:第2次出现选择路径时,是选择jre的安装路径,一定不要和前面jdk同一个路径,建议也在放在Java目录下,单放在jre 文件夹,比如D:\Program Files\Java\jre1.8.0_101否则将有问题。

步骤3.配置环境变量 右键计算机->属性->高级系统设置->环境变量,在“环境变量”窗口“系统变量”区域操作: (1)【新建…】,变量名输入:JAVA_HOME 变量值输入JDK安装路径:D:\Program Files\Java\jdk1.8.0_101 【确定】 (2)双击Path,在变量值框末尾加上 ;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin 【确定】 (3)【新建…】,变量名输入:CLASSPATH变量值输入: %JAVA_HOME%lib\dt.jar;%JAVA_HOME%\lib\tools.jar 【确定】 步骤4.测试是否配置成功 运行->cmd,回车,输入java–version回车,显示版本号等信息; 输入javac–version回车,也显示版本号,如下图所示,则表示配置成功

使用谷歌在线翻译看学术论文

如果想利用谷歌来翻译英文文献,简便方法是直接将英文文献名输入谷歌搜索栏 可以看到第三个结果就是我们要阅读的那篇文章,标题下面有“翻译此页”,点击即可翻译全文,优点是可以像论文页面那样看,缺点是无法与原文对应着看,结果如下:

通常我用更细致的翻译方法,步骤如下: 1.谷歌在线翻译网址:https://https://www.360docs.net/doc/368917326.html,/ 界面如下: 左边是待翻译文字,右边是翻译结果。 左边方框上面一行最好选择“检测语言”,这样就不用管输入的是什么语言了;右边选中文(简体) 2.取一段待翻译内容从原文复制粘贴到上图左边空白方框中,结果自动出现在右边浅灰色方框 将鼠标光标放在翻译结果的一个词上,那个词会变成黄色,同时它对应的英文也在左边方框变成黄色。这时如果觉得这个词翻译的不正确,就鼠标左键单击它一下,会出现这个词的其他涵义,可以看看其他涵义怎么样,如下图:“本文认为”---》“本文重在探讨”。另:这里谷歌把class都翻译成了类而不是阶级。

还有一个用法即上图黑底白字方框显示的可以拖动翻译结果中的一个词,使文章重新排序。我觉得这个没必要,因为句子顺序不对不影响理解。 3.小工具 上图最下边一行左边有一个小图标,右边有四个小图标,用法如下: 1)左下角那个是全选,可以把翻译结果全选中后复制粘贴到其他地方。 2)右下角第一个小喇叭图标是朗读(这个学术用处不大,但是可供娱乐)如: 选择翻译德语到德语→复制黏贴下列字段到翻译框: pv zk pv pv zk pv zk kz zk pv pv pv zk pv zk zk pzk pzk pvzkpkzvpvzk kkkkkk bsch→点击翻译结果框的“朗读”→可以听到吭哧吭哧的音乐~~ 3)右边第二个图标是显示字词的用法,很好用的~~但是不能在翻译一段话时使用,只能翻译一个词时用,如: 直接从网上找出例句

考研英语翻译要诀之词性转换

考研英语翻译要诀之词性转换 来自:Smile 2016-11-13 13:01:09 |阅读原文 在英译汉过程中,有些句子可以逐词对译,有些句子则由于英汉两种语言的表达方式不同,就不能用"一个萝卜一个坑"的方法来逐词对译。原文中有些词在译文中需要词类转换和结构转换,才能使汉语译文通顺自然。 转换成动词 1、名词转换成动词 经典例题: Interest in historical methods has arisen,less through external challenge to the validity of history as an intellectual discipline and more from internal quarrels among historians themselves. 分析:interest在原文中是名词,而在译文中为了符合中文的表达方式,在不改变意思的前提下,将它改成动词。 参考译文: 人们之所以关注历史研究的方法,主要是因为史学家们内部分歧过大,其次才是因为外界并不认为历史是一门学科。 经典例题: With the click of a mouse,information from the other end of the globe will be transported to your computer screen at the dizzying speed of seven_and_a_half times around the earth per second. 参考译文: 只要一点鼠标,来自世界另一端的信息便会以每秒绕地球七周半的惊人速度传输到你的电脑屏幕上。 2、形容词转换成动词

服装品牌名英汉互译探讨

服装品牌名英汉互译探讨 摘要:国外服装品牌名翻译方法与普通英语词汇的翻译一样,也都有音译、意译等。品牌名称的翻译是必须做好的一项工作,好的品牌名称对于提高商品的市场占有率起着十分重要的作用。本文重点探讨服装品牌名称的翻译,旨在找出其翻译的一般及特殊方法,为品牌更好地走入市场提供一定参照。 关键词:服装品牌;音译;意译 一、引言 随着人们生活水平的提高,人们越来越多地关注各种服装品牌,国内外众多品牌纷纷抢占市场。越来越多的企业已逐步意识到商标名称是企业的巨大资产。因为这种竞争不但是商品的竞争、服务的竞争,更是企业形象的竞争、品牌的竞争。在加入WTO之后,中国的服装制造商越来越注意与世界接轨,很多服装品牌在注册中文商标的同时,也有了特定的英文翻译,有的直接采用汉语品牌名的拼音作为英文品牌名,有的则根据读音翻译成英文中有特定意思的词,而且是有特定含义的词。 二、服装品牌的翻译方法 1、音译 1.1外国服装品牌名译成中文名。

外国品牌名译成中文名时,多数都采取音译法,取其相近的音译成汉语。如:LouisVuitton——路易·威登;Bvlgari——宝格丽:Cartier——卡蒂亚;Fendi——芬迪;DonnaKaran——唐纳·卡兰;Hermes——爱马仕;Moschino——莫斯奇 诺;NinaRicci——莲娜·丽姿,Versace——“范思 哲”;Yvesssainlaurent——“伊夫,圣洛朗”;红贝——“herebe”:顺美——“smart”。这些名称翻译的主要技巧是注意翻译的本地化。既要译得上口吉利:又要注意节奏,还要符合当地人的文化欣赏。 很多外国服装品牌都是用创始人或设计师的名字作为商标,也采取音译法,就如同翻译英文名字一样。如:品牌名称:ChristianDior(克里斯汀,迪奥)——创始人、设计师(1946年—1957年):ChristianDior(克里斯汀·迪奥):品牌名称:Chanel(夏奈尔)——创始人、计师(1913年-1971年)均为GabrielleChanel(加布里埃·夏奈尔);品牌名称:Versaee(范思哲)——设计师:贾尼·范思哲。 1.2中国服装品牌名的英译 汉语品牌名用拼音。使用汉语拼音的好处主要是能直接宣传这个品牌名,但是从另一方面来说,这些品牌大多数是以开拓国内市场为主。如:威鹏——Weipeng;李——宁Lining;波司登——Bosideng:利郎——Lilang:报喜鸟——Baoxiniao:

当代汉语文本语料库分词词性标注加工规范

973当代汉语文本语料库分词、词性标注加工规范 (草案) 山西大学从1988年开始进行汉语语料库的深加工研究,首先是对原始语料进行切分和词性标注,1992年制定了《信息处理用现代汉语文本分词规范》。经过多年研究和修改,2000年又制定出《现代汉语语料库文本分词规范》和《现代汉语语料库文本词性体系》。这次承担973任务后制定出本规范。本规范主要吸收了语言学家的研究成果,并兼顾各家的词性分类体系,是一套从信息处理的实际要求出发的当代汉语文本加工规范。本加工规范适用于汉语信息处理领域,具有开放性和灵活性,以便适用于不同的中文信息处理系统。 《973当代汉语文本语料库分词、词性标注加工规范》是根据以下资料提出的。 1.《信息处理用现代汉语分词规范》,中国国家标准GB13715,1992年 2.《信息处理用现代汉语词类标记规范》,中华人民共和国教育部、国家语言文字工作委员会2003年发布 3.《现代汉语语料库文本分词规范》(Ver 3.0),1998年 北京语言文化大学语言信息处理研究所清华大学计算机科学与技术系4.《现代汉语语料库加工规范——词语切分与词性标注》,1999年 北京大学计算语言学研究所 5.《信息处理用现代汉语词类标记规范》,2002年, 教育部语言文字应用研究所计算语言学研究室 6.《现代汉语语料库文本分词规范说明》,2000年 山西大学计算机科学系山西大学计算机应用研究所 7.《資讯处理用中文分词标准》,1996年,台湾计算语言学学会 一、分词总则 1.词语的切分规范尽可能同中国国家标准GB13715《信息处理用现代汉语分词规范》(以下简称为“分词规范”)保持一致。本规范规定了对现代汉语真实文本(语料库)进行分词的原则及规则。追求分词后语料的一致性(consistency)是本规范的目标之一。 2.本规范中的“分词单位”主要是词,也包括了一部分结合紧密、使用稳定的词组以及在某些特殊情况下可能出现在切分序列中的孤立的语素或非语素字。本文中仍用“词”来称谓“分词单位”。 3.分词中充分考虑形式与意义的统一。形式上要看一个结构体的组成成分能否单用,结构体能否扩展,组成成分的结构关系,以及结构体的音节结构;意义上要看结构体的整体意义是否具有组合性。 4. 本规范规定的分词原则及规则,既要适应语言信息处理与语料库语言学研究的需要,又力求与传统的语言学研究成果保持一致;既要适合计算机自动处理,又要便于人工校对。 5.分词时遵循从大到小的原则逐层顺序切分。一时难以判定是否切分的结构体,暂不切分。 二、词性标注总则 信息处理用现代汉语词性标注主要原则有三个: (1)语法功能原则。语法功能是词类划分的主要依据。词的意义不作为划分词类的主要依据,但有时也起着某些参考作用。

R语言学习系列12-文本分词

12. 文本分词 文本分词,就是对文本进行合理的分割,从而可以比较快捷地获取关键信息。 例如,电商平台要想了解更多消费者的心声,就需要对消费者的文本评论数据进行内在信息的数据挖掘分析,而文本分词是文本挖掘的重要步骤。 R语言中,对中文分词支持较好的包有RWordseg包和jiebaR包。 一、配置Java环境 步骤1. 下载JDK安装包 https://www.360docs.net/doc/368917326.html,/technetwork/java/javase/downloads/index.html 点Java Download图标进入下载界面(Java SE Development Kit);点Accept License Agreement,接受许可协议,选择对应系统的版本下载,比如Windows x64 步骤2. 安装JDK 安装路径(可修改),比如D:\Program Files\Java\jdk1.8.0_101 特别注意:第2次出现选择路径时,是选择jre的安装路径,一定不要和前面jdk同一个路径,建议也在放在Java目录下,单放在jre 文件夹,比如D:\Program Files\Java\jre1.8.0_101否则将有问题。

步骤3. 配置环境变量 右键计算机->属性->高级系统设置->环境变量,在“环境变量”窗口“系统变量”区域操作: (1) 【新建…】,变量名输入:JAVA_HOME 变量值输入JDK安装路径:D:\Program Files\Java\jdk1.8.0_101 【确定】 (2) 双击Path,在变量值框末尾加上 ;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin 【确定】 (3) 【新建…】,变量名输入:CLASSPATH 变量值输入: %JAVA_HOME%lib\dt.jar;%JAVA_HOME%\lib\tools.jar 【确定】 步骤4. 测试是否配置成功 运行->cmd, 回车,输入java –version回车,显示版本号等信息; 输入javac–version 回车,也显示版本号,如下图所示,则表示配置成功

十个最流行的在线英汉翻译网站准确性评测对比

Facebook、Digg、Twitter、美味书签(https://www.360docs.net/doc/368917326.html,)……很多名声大噪且已逐渐步入主流的网络服务都是从国外开始引爆的,而即便是抛却技术上的前瞻性,仅从资源上来看“外域”的也更丰富.当网友们浏览国外网站时,即使有些英文基础,也大都或多或少要使用到翻译工具.在线翻译显然是最便捷的方式,目前提供此类服务的网站有不少,但机器智能翻译尤其考验真功夫,翻译质量的优劣直接影响着用户的阅读效果.在这里我们将全面网罗十个颇有些关注度的在线翻译服务,试炼其翻译质量、速度等各方面的表现. 参评在线翻译 1、Google翻译 网址:https://www.360docs.net/doc/368917326.html,/language_tools?hl=zh-CN 2、Windows Live在线翻译 网址:https://www.360docs.net/doc/368917326.html,/Default.aspx 3、雅虎翻译 网址:https://www.360docs.net/doc/368917326.html,/ 4、爱词霸 网址:https://www.360docs.net/doc/368917326.html,/trans.php

5、百度词典 网址:https://www.360docs.net/doc/368917326.html,/ 6、海词在线翻译 网址:https://www.360docs.net/doc/368917326.html,/ 7、金桥翻译 网址:https://www.360docs.net/doc/368917326.html,/ 8、谷词在线词典 网址:https://www.360docs.net/doc/368917326.html,/ 9、木头鱼在线翻译 网址:https://www.360docs.net/doc/368917326.html,/translation/ 10、nciku在线词典 网址:https://www.360docs.net/doc/368917326.html,/ 一、翻译质量比拼 单词翻译 测试项1:日常用语 翻译单词:boil 参考释义:煮沸 测试结果: 1、Google翻译:沸腾、煮沸等 2、Windows Live在线翻译:煮沸

中外高校校名国内研究所中文全称和英文缩写对照

中外高校校名国内研究所中文全称和英文缩写 对照 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

中文全称英文缩写 浙江大学ZHEJIANG UNIV 中国科学院CHINESE ACAD SCI 清华大学TSINGHUA UNIV 东南大学SOUTHEAST UNIV 大连理工大学DALIAN UNIV TECHNOL 南京大学NANJING UNIV 四川大学SICHUAN UNIV 上海交通大学SHANGHAI JIAO TONG UNIV 中山大学SUN YAT SEN UNIV 华中科技大学HUAZHONG UNIV SCI TECHNOL 北京大学PEKING UNIV 山东大学SHANDONG UNIV 复旦大学FUDAN UNIV 南开大学NANKAI UNIV 北京邮电大学BEIJING UNIV POSTS TELECOMMUN 中国科学技术大学UNIV SCI TECHNOL CHINA 吉林大学JILIN UNIV 西安交通大学XI AN JIAO TONG UNIV 哈尔滨工业大学HARBIN INST TECHNOL 天津大学TIANJIN UNIV 兰州大学LANZHOU UNIV 华南理工大学S CHINA UNIV TECHNOL 武汉大学WUHAN UNIV 湖南大学HUNAN UNIV 华南师范大学S CHINA NORMAL UNIV 北京航天航空大学BEIJING UNIV AERONAUT ASTRONAUT 东北大学NORTHEASTERN UNIV 电子科技大学UNIV ELECT SCI TECHNOL CHINA 华东科技大学 E CHINA UNIV SCI TECHNOL 中南大学CENT S UNIV 西安电子科技大学XIDIAN UNIV 同济大学TONGJI UNIV 厦门大学XIAMEN UNIV 北京交通大学BEIJING JIAOTONG UNIV 东吴大学SOOCHOW UNIV 安徽大学ANHUI UNIV 北京理工大学BEIJING INST TECHNOL 香港城市大学CITY UNIV HONG KONG 湘潭大学XIANGTAN UNIV 北京师范大学BEIJING NORMAL UNIV

英文商标名称翻译与策略

英文商标名称地翻译与策略 1.前言 商标是商品地标志,是商品经济发展地产物,是商品生产者或经营者为使自己生产销售地商品区别于其他商品而使用地一种显著标志.它是商品显著特征地浓缩,是商品文化地核心部分.在国际市场上,商标常被企业家和消费者视为简化了地企业名称.商标一出现就成为企业地象征,是生产者和消费者直接对话地桥梁,是企业参与国际竞争地有力武器.中国地对外开放正在进一步深化,随之而来地国外企业在华地经济活动也在增加.这极大地丰富着中国人民地经济生活,并因此而衍生出了诸多对于国人而言全新地经济及商业活动.大量地国产商品正在出口到世界各地,而国外地商品也已蜂拥至国内市场.合法地商品都有一个自己地商标.因此,随着中外产品地交流,商品商标地翻译问题不可避免地出现了. 2.英文商标翻译地策略 2.1.音译 商标翻译过程中,音译是一种不可忽视地手段,具有极强地普遍性.音译是指在不背离“汉语语言规范和不引起错误联想或误解地条件下,按照原商标名称地发音,找到与之语音相近地汉语字词进行翻译.其优点是简单易行,译文有异国情调,可使产品具有一定吸引力.音译又分为:纯音译﹑谐音译和省音译. 2.1.1. 纯音译 纯音译即根据英文地读音逐字地用相近发音地汉字进行匹配地翻译.主要适用于专有名词,如:人名商标和地名商标.这种翻译法是商标在译为中文

时,因无法找到相应地汉语表达而不得不采用地翻译方法. 2.1.1.1人名商标 有些商标是姓氏构成地,如:Hoover(胡佛)真空吸尘器,是源于生产商William Henry Hoover地姓氏;Rael-Brook(雷尔-布鲁克)男装,是源于公司创始人H.Rael-Brook地姓氏.有些商标是人地全名,如:Walt Disney(沃尔特·迪斯尼)制片公司,是根据公司创始人Walt Disney地姓名而定;Pierre Cardin(皮尔·卡丹)时装,是根据该时装地制造者Pierre Cardin地姓名而定;“benz”品牌最早含义是卡尔本茨地姓,根据译音,在中国翻译成“奔驰”. 2.1.1.2地名商标 Santana(桑塔纳)轿车,San Tana原是美国加利福尼亚洲一座山谷地名称;Nokia(诺基亚)手机是根据芬兰北部一座名为Nokia地小镇命名地. 2.1.2谐音译 这种译法是以音为引子,经常是在纯音译地基础上改动个别字眼,这些字眼与原商标读音谐音,改动后地音译商标又结合产品特征.例如:为纪念航空公司创始人Willian Edward Boeing 人们以其姓氏确定地商标Boeing,译作“博音”,但作为商标,译者改用谐音“波音”,这就可以使人们对这类超音速飞机产生无尽地遐想. 2.1.3省音译 省音译是根据中国人地审美习惯,双音节和三音节地商标更能令人过目不忘,有些英文商标单词较长音节较多,如果逐字翻译,读起来拗口且不便记忆,可采用省音译来简化. 2.2意译

词性标注说明_128601491

人民日报标注语料库(PFR)使用说明书 本文是PFR标注语料库的使用说明书,帮助用户了解它,更好地使用它。 PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。文章中的每个词语都带有词性标记。目前的标记集里有26个基本词类标记(名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、习惯用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,从语料库应用的角度,增加了专有名词(人名nr、地名ns、机构名称nt、其他专有名词nz);从语言学角度也增加了一些标记,总共使用了40多个个标记。

二.格式说明 1.语料是纯文本文件,文件中每一行代表一自然段或者一个标题,一篇文章有若干个自然段,因此在语料中一篇文章是由多行组成的。 2.文件名格式为“月-日-版号-篇章号”。 3.一篇文章里面的段落之间是不空行的,在两篇文章之间,会有一个空行,表示文章的分界线,同时,下一篇文章的“篇章号-段号”都会有所改变。 4.标号之后,是2个单字节空格,然后开始正文。 5.正文部分按照规范已经切分成词,并且加上标注,标注的格式为“词语/词性”,即词语后面加单斜线,再紧跟词性标记。词与词之间用2个单字节空格隔开。每段最 后的词,在标记之后也有2个单字节空格,保持格式一致。 6.语料中除了词性标记以外,还有“短语标记”,这种情况一般出现在机构团体名称、成语等情况中。如“通过/p [中央/n 人民/n 广播/vn 电台/n]nt 、/w”中,用 “[ ]”合起来的部分是一个完整的机构团体名称,方括号后面紧跟标注nt,nt之后 空两个单字节空格,保持了格式的一致。 三.例子 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n ——/w 一九九八年/t 新年/t 讲话/n (/w 附/v 图片/n 1/m 张/q )/w …… 在/p 1998年/t 来临/v 之际/f ,/w 我/r 十分/m 高兴/a 地/u 通过/p [中央/n 人民/n 广播/vn 电台/n]nt 、/w [中国/ns 国际/n 广播/vn 电台/n]nt 和/c [中央/n

常用分词词性对照表

1.名词(26个词性) n 名词 nr 人名 nrj 日语人名 nrf 音译人名 ns 地名 nsf 音译地名 nt 机构团体名 ntc 公司名 ntcf 工厂 ntcb 银行 ntch 酒店宾馆 nto 政府机构 ntu 大学 nts 中小学 nth 医院 nh 医药疾病等健康相关名词 nhm 药品 nhd 疾病 nn 工作相关名词 nnt职务职称 nnd职业 ng 名词性语素 ni 机构相关(不是独立机构名) nic 下属机构 nis 机构后缀 nm 物品名 nmc 化学品名 nb 生物名 nba 动物名 nbp 植物名 nz 其他专名 2.学术词(8个词性) g 学术词汇 gm 数学相关词汇 gp 物理相关词汇 gc 化学相关词汇 gb 生物相关词汇 gbc 生物类别 gg 地理地质相关词汇 gi 计算机相关词汇 3.简称省略语(1个一类,北大) j 简称略语4.成语(1个一类,北大) i 成语 5.习用语(1个一类,北大) l 习用语 6.时间词(1个一类,1个二类) t 时间词 tg 时间词性语素 7.处所词(1个一类) s 处所词 8.方位词(1个一类) f 方位词 9.动词(1个一类,9个二类) v 动词 vd 副动词 vn 名动词 vshi 动词“是” vyou 动词“有” vf 趋向动词 vx 形式动词 vi 不及物动词(内动词) vl 动词性惯用语 vg 动词性语素 10.形容词(1个一类,4个二类) a 形容词 ad 副形词 an 名形词 ag 形容词性语素 al 形容词性惯用语 11.区别词(1个一类,2个二类) b 区别词 bl 区别词性惯用语 12.状态词(1个一类) z 状态词 13.代词(1个一类,4个二类,6个三类) r 代词 rr 人称代词 rz 指示代词 rzt 时间指示代词 rzs 处所指示代词

文学术语翻译(谷歌翻译)

十四行诗是一首抒情诗,包括一个单节14抑扬格五音线连接的复杂的押韵。用英文写的十四行诗中的诗韵有两种主要模式。意大利彼特拉克的十四行诗(14世纪意大利诗人彼特拉克的名字命名的)包括一个倍频程(8线),押韵abbaabba和一个sestet的(6线),押韵cdecde 或cdccdc。倍频程的sestet的转变往往与“转向”的说法或心情的诗。 莎士比亚的十四行诗(其最大的医生的名字命名的)包括三个绝句和最后的对联,押韵ababcdcdefefgg。“转向”最后的对联,有时可能会达到一个警句。有一个显着的变体,斯宾塞斯宾塞十四行诗,其中每首四行诗联系起来,未来持续韵:ABAB BCBC CDCD EE。有三个著名的十四行诗在伊丽莎白时代- 斯宾塞的Amoretti,莎士比亚的十四行诗和悉尼的星者和Stella序列。 颂:一些长度,复杂的抒情诗,以崇高的有尊严的生活,本来是唱的主题。颂诗是写一个特殊的场合,,兑现一个人或一个赛季或纪念事件。 头韵,头韵或初步韵是指相同的声音,通常声母的字或重读音节中任何相邻的序列的重复。 英雄对联(英雄双韵体)是一个押韵的对抑扬格五音线。它是由乔叟作为一个主要的英文诗叙事和其他种类的非戏剧诗歌的形式,它占主导地位的18世纪英语诗歌在19世纪初的重要性下降之前,特别是在教皇的诗歌。 斯宾塞节是9行节押韵的ABAB BCBC C,斯宾塞发明的。第一八是抑扬格五音线,最后一行是一个抑扬六步格线。 意识流:威廉·詹姆斯(William James)的看法,想法和感情在清醒的头脑来形容不间断的流,这是一个短语,它已被用来描述现代小说的叙事方法。它始终以内心独白的形式。詹姆斯·乔伊斯和弗吉尼亚·伍尔夫是英国作家的青睐和采用这种技术。 是一种常用的抑扬格五音韵律线,在传统的诗歌和诗剧。这个术语描述特定的节奏,在该行建立。这种节奏的测量音节的小团体,这些小团体的音节被称为“脚”。“抑扬”,描述了脚的类型,即(英语,非重读音节重读音节)。“五音”字表明,这些“脚行有五个。” 无韵诗(无韵诗)是在无韵抑扬格五音步诗。它是在一些英国最伟大的诗歌,其中包括威廉·莎士比亚和弥尔顿的诗歌形式。 象征主义:象征主义的写作技巧使用符号。这是一个文学运动在19世纪,并极大地影响了许多英语作家,尤其是诗人,20世纪后半期出现在法国。它使诗人压缩成一个图像,甚至一个字一个非常复杂的思想或一套想法。这是一个最强大的,诗人创作中采用的设备 唯美(唯美主义)文学运动在19世纪,那些相信“为艺术而艺术”的功利学说的反对,一切都必须在道德上或实用的。沃尔特·佩特和王尔德的唯美主义运动的关键数字。 具有讽刺意味的(反讽)之间的差异是什么,是什么意思的表达。 戏剧性的独白(戏剧独白)的一首诗,在一个充满诗意的扬声器地址的阅读器或内部监听器

南京高校中英文校名集锦

南京大学Nanjing University 东南大学Southeast University 南京航空航天大学Nanjing University of Aeronautics and Astronautics 南京理工大学Nanjing university ofscience &technology 南京工业大学Nanjing tech university 南京邮电大学Nanjing University of Posts and Telecommunications 南京林业大学Nanjing forestry university 南京信息工程大学Nanjing University of Information Science & Technology 南京农业大学Nanjing Agricultural University 南京医科大学Nanjing medical university 南京中医药大学Nanjing university of Chinese medicine 中国药科大学China Pharmaceutical University 南京师范大学Nanjing Normal University 南京财经大学Nanjing University Of Finance & Economics 江苏警官学院Jiangsu police institute 南京体育学院Nanjing Sport Institute 南京艺术学院Nanjing University of the Arts 三江学院Sanjiang university 南京工程学院Nanjing institute of technology 南京审计大学Nanjing audit university 南京晓庄学院Nanjing xiaozhuang university 南京特殊教育师范学院Nanjing Normal University Of Special Education 南京森林警察学院Nanjing forest police college 东南大学成贤学院southeast university chengxian college 金陵科技学院jinling institute of technology 南京大学金陵学院Nanjing university jinling college 南京理工大学紫金学院Nanjing University of Science and Technology ZiJin College 南京航空航天大学金城学院 nanhang Jincheng college 中国传媒大学南广学院Communication University of China, Nanguang College

品牌翻译的信达雅

品牌翻译的信达雅 中国已日渐成为成熟的商业社会,我们每天都要接触各色中外品牌。由于经济全球化,许多国外品牌有了中文名字,而中国品牌也纷纷挂上了洋气的英文名字。如何翻译品牌?品牌的翻译应该遵循哪些原则?本文将尝试浅析这个问题。 本文讨论的品牌翻译是指品牌所有者在品牌本土化过程中首创性地译制品牌名的活动,而不是一般的翻译问题。翻译品牌的方法不外乎音译、意译、音意复合翻译和自由翻译。以下各举一例,音译,Coca Cola翻译为“可口可乐”;意译,中国彩电品牌“熊猫”译作Panda;复合翻译,Unilever译为“联合利华”,Uni 是常见的英文词根,意为联合,Lever是杠杆,“联合利华”采取了音意复合译法;自由翻译,Hewlett-Packard,英文姓氏构成的品牌名被翻成了“惠普”。此外,还有不译,国外品牌IBM、3M等无中文品牌,而许多中国品牌的英文名就是其汉语拼音。可以看出品牌翻译的方法具有随意性,那背后的指导原则又是什么呢? 品牌翻译与其它体裁的最大不同就是品牌翻译不是纯粹的翻译活动,它比一般的翻译活动具有更大的创造性和灵活性。品牌的作用十分丰富,如提高辨识度、宣传产品等,最终的落脚点是提高产品销量和市场占有率。所以品牌翻译也应该以此为最终目标,这点区别于传统翻译的翻译目的。翻译目的决定翻译策略,而策略又具体体现在翻译方法上。品牌翻译的特殊性决定了其采取的翻译策略有别于其它翻译类型。 品牌翻译是一种特殊的翻译类型,有着与其它体裁相同的共性,也有着独特的个性,因此用一般的翻译评价标准来评价品牌翻译,有其适用性,也有局限性。翻译评价标准中,中国人最熟悉的当属严复在《天演论·译通言》中提出的“信、达、雅”的标准,信者,忠实于原文也,达者,自然通顺也,雅者,文采之谓也。严复之后的许多学者也提出许多新见解,如林语堂的“忠实、通顺、美”,梁实秋的“宁错务顺”和鲁迅的“宁信不顺”,傅雷的“神似”,钱钟书的“化境”等等。纵观这些翻译主张,其实都是对“信、达、雅”的不同演绎。笔者认为品牌翻译可以用“信达雅”为准绳,但具体评价标准要有别于其它翻译体裁。 先从“信”字说起。奢侈品品牌Hermès其实是古希腊商业之神“赫尔墨斯”的名字,但该品牌显然没有沿用此译名,美国快餐品牌Subway为地铁之意,该品牌也显然没有使用地铁二字。这样的例子,不胜枚举,反映出达意并不是品牌翻译的必要标准。但是“信”字在品牌翻译上却常体现为声音上的接近,但品牌翻译中不完全采用单纯的音译,更多的是在音译基础上附加一些信息。这种方法在翻译专有名词时较常用,因为汉语是语素文字,每个字都有意思,所以译者喜欢在音译时附着一些其它信息,比如美国Yosemite公园就译为“优胜美地”。国际饮料品牌Coca Cola并没有翻成“扣卡扣拉”,而是“可口可乐”,体现出其企业文化和形象。所以综合而言,品牌翻译对“信”的要求并不高。 那么“达”呢?品牌一般都是简短的单词(字)或单词(字)组合,并不是成篇的文字,所以通顺便无从谈起。但“达”字可以理解为符合译语语言偏好和习惯。

相关文档
最新文档