语义特征编码

语义特征编码

语义特征编码

语义特征编码属于信息处理的范畴,主要是对语句信息的处理,解决了语句的存储和检索问题,有利于基于自然语句搜索的全文搜索的研究。语义特征编码定义

语句增量Hash的结果作为特征量,依次表示语句的特征,相同的语句只有唯一的特征量.

语义特征编码技术特点

语句经过特征编码处理后转换为统一长度的字符串或者整型结构的数据,解决了语句的存储和检索问题。

语义特征编码功能

1、语义特征编码技术保证了语句中文字之间顺序关系,决定了语句的存储量只与不同语句的多少有关,相同的语句无需再次存储。

2、对所有语言采用统一的处理方式---语义特征编码技术,查找:采用先计算特征编码再查找的方式进行,保证了检索的效率和精准度。

把字句的语义特征

“把字句”的语义分析 孙志景 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+谓词性词语”。 在现代汉语中,句子是语言运用的基本单位,它由词、词组(短语)构成,能表达一个完整的意思,如告诉别人一件事,提出一个问题,表示要求或者制止,表示某种感慨,表示对一段话的延续或省略。句子和句子中间有较大停顿。它的结尾应该用上句号、问号、省略号、或感叹号。 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+ 谓词性词语”。把字句强调的是对某物的处理结果。把字句是一种有特色的句子,那么这种句式到底有什么特点呢?第一,谓语动词大多数是表动作的及物动词,并且在语义上能支配把字后边的词语。及物动词一般后面都可以接宾语。例如:他把书看完了。“看”是及物动词,在语义平面“书”是“看”的受事。当然,这里的“书”可以被“看”所支配。又例如:“我踩到了石头”一句就不能改成了把字句,这里的“踩”对“石头”没有支配能力。第二,谓语动词(特别市单音节词)的后面或前面通常都有一些别的词语。例如:他把作业做完了。动词“做”的后面加了“完了”一词,表示一种结果,作业完成了。同时,又例:我把论文认真地审查了一遍。这个句子中,谓语动词前面加了“认真地”修饰动词,表明一种态度;而谓语动词的后面也加了“一遍”表示一种频率或者一个量。当然,有些谓语动词本身含结果意义,如“采纳、接受、拒绝、说服”等,这类动词如果前面有某些状语,后面可以没有别的词语。例如:董事会已经把她的建议采纳了。“已经”一词表示一种完成的结果,同时 采纳也有一定的结果含义,那么动词后面可以不用加词语。第三,“把”字后面的词语所代表的事物一般是定指的,是上下文出现过或交际双方都知道的。上例中的“作业、话、论文”都是定指的。有时候“把”字后面的词语包含有“一个、几个”之类的词语,但说话人认为所指的对象或范围仍是明确的。例如:我们把一个强大的中国带入了二十一世纪。这里的“中国”这个当然是特指,而后面的“一个”也是特指的,是大家都知道的,所表示的物象是明确的。第四,如果句中有否定副词或助动词,则出现在“把”字前面。例如:他没有把话说清楚。这里的“没有”要放在把字的前面。其实,看到这个特点,我想起了英文中的一个词“think”,跟我们这个把字句的这个否定特点很相似,都是将否定词放在前面。 前面都是在讨论“把”字句一些特点,下面我们就要讲讲把字句的作用。首先,语用表达的需要:强调动作的处置结果。这种把字句有不用把字的相对格式。例如:他推翻了原计划。//他把原计划推翻了。把字句就是把大家的焦点聚焦在句末,聚焦在谓语动词上,是大家能够更好地理解句意。在这个例子中强调的是已然的处置结果推翻了。又例:我明天可以看完这本书。//我明天可以把这本书看完。这里强调的是未然的处置结果看完。当然,也有一些“把”字句强调动作的致使结果,这种把字句的谓语中心通常是不及物动词或形容词。例如:繁忙的工作把他累垮了。其次,是在使用过程中结构上的需要。同时它们没有其相对格式。这里,有三种情况:第一,动词紧接着补语,不允许宾语将它跟动词隔开,这种情况一般用把字短语。例如:他把自行车放在车棚里。(“放”与“在……”关系密切)。第二,动词带双宾语,其中的一个或两个宾语都比较复杂,放在一起累赘拖沓,这种情况一般用“把”字把直接宾语提前。例如:我们把那封最后的通牒式的信退还给了他们。第三,动词后有“为、

语义分析

语义分析 1.语义分析? 机器机和人不一样的地方是人可以直接理解词的意思,文章的意思,机器机不能理解。 人看到苹果这两个字就知道指的是那个圆圆的,挺好吃的东西,搜索引擎却不能从感性上理解。但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。 可参考:https://www.360docs.net/doc/5f8393905.html,/dispbbs.asp?boardID=2&ID=74541 2.为什么要使用语义分析? 我国中文自然语言处理普遍采用西基于拉丁语系的“关键词”技术,以此来分析理解中文。然而,中文本身的特点决定它与西语之间巨大的区别,所以从汉语信息处理的需要看,当前急迫需要突破的是语义问题。 可参考: https://www.360docs.net/doc/5f8393905.html,/dicksong2008/blog/item/88fb751e9ac9501a4134 17f4.html 2.1中文与西语不同决定我们无法采用西语的架构体系来处理中文,具体区别在于: 西语词间有间隔,汉语词间无间隔。众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。 例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。 “我是一个学生”,分词的结果是:“我是一个学生”。中文分词就成了计算机处理的难题。 汉语形态不发达,句尾没有形态标记。英语动词、名词很清楚,加上词尾可以是副词;西语有时态,过去式、现在式等等非常清楚,中文则依靠词语或者依靠自己的判断来确定时态。 同音字多增加了机器识别的难度。 汉语语义灵活,由于形态不发达,所以语序无规律。在一次学术会议上,一位著名的人工智能专家说:“按…主-谓-宾?或…名-动-名?这一规则,计算机可显出…牛吃草?,也可显出…草吃牛?。从语法格式上看,…草吃牛?也不错,但这句话是说不通的。 人依靠自己的经验可以判断,机器如何来判断呢?

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法 很有用,请好好学习之。 北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里 很重要的一个内容,老师上课也会讲到,我在这 里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓

语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。(2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,

层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系 不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。

现代汉语语法分析报告地五种方法

北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里很重要的一个内容,老师上课也会讲到,我在这里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵: 一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。 (2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。

封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。 基本精神: 1.承认句子或句法结构在构造上有层次性,并在句法分析上严格按照内部的构造层次 进行分析; 2.进行分析时,要明确说出每一个构造层面的直接组成成分; 3.分析时只管直接成分之间的语法结构关系,不管间接成分之间的语法结构关系或句 法结构中实词与实词之间的语义结构关系; 优越性: 1.注意到了句子构造的层次性; 如: 他刚来我们便宜他了 ││__│││___│ │___││_____│ 他刚来我们便宜他了 __ _______ ____ ___________ ___ ___ ____ _____

义素分析法分析“看的方式”语义场

义素分析法分析“看的方式”语义场 摘要:“看的方式”的语义场可以归为同义语义场。通过义素分析的方法,并写出 每个词的基本义的义素表达式,来分析该语义场内的词之间的异同。词不仅有理 性意义还有感性意义,通过感性意义能更好的区别和运用同义词。 关键字:义素分析法,同义词辨析,看的方式 一、义素分析法在同义词辨析中的运用 同义词辨析一直以来都是语言研究的重要方面,不仅是在语言研究,还是在 语言运用中,甚至在语言的教学中都具有特殊的意义。义素分析法是准确描写和 掌握词义的有效方法。词义并不是一个整体,而是有若干层次的结构,义素是构 成词义的最小意义单位。将义素分析法引入对外汉语词汇教学,可以对词义的微 观层面进行准确有效的分析,把词义分割成若干个义素的组合,不仅有利于准确 掌握同义词之间的大同小异,还能提高人们对语言的运用能力,有利于第二语言 学习者在语言学习中理解两个及两个以上抽象的同义词,加深对汉语词汇的理解 和运用。 本文主要通过义素分析法来分析比较“看的方式”的语义场,来说明义素分析 法在同义词比较中的运用。运用义素分析法的表达式来研究“看的意义相同或相近的词”。本文研究的看的方式词有:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰。 二、“看的方式”的语义场义素分析的方法和步骤 1.确立语义场 语义场是通过不同词之间的对比,根据它们词义的共同特点或关系划分出来 的类。同义语义场相当于一些论著中讲的一组广义的同义词(即不包括等义词),它所包括的各个义位间大同小异。所谓的同,表现为基本义相同或者是基本义有 一部分相同。所谓的异,就是附加义不同,或者是基本义有一部分不同,又或是 不只是基本义有一部分不同附加义也不一样。“看的方式”语义场内的词是眼部动 作描写都有“用眼睛看”这一基本义项,因此,这些看的方式词都可以看作是“看” 这个词的同义词。那么“看的方式”就构成了一个眼部动作的同义语义场。根据义 素分析法的分析并通过表达式的比较,可以准确的辨析出同义语义场内各个词之 间的细微区别,有利于第二语言的学习。 2.通过义素的具体对比分析“看的方式:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰”的异同。 这些字从现代汉语词典第七版中查到“看的方式”词的意义如下所示: (1)看: [动] 使视线接触人或物:~书|~电影|~了他一眼。 [动] 观察并加以判断:我~他是个可靠的人l你~这个办法好不好。 [动] 取决于;决定于:这件事能 不能成功全~你了|飞机能否准时起飞,要~天气如何。 [动] 访问;探望:~望|~朋友。 [动] 对待:~待|另眼相~|别拿我当外人~。 [动] 诊治:王大夫把我的病~好了。照料:照~l衣帽自~。 [动] 用在表示动作或变化的词或词组前面,表示预见到某 种变化趋势,或者提醒对方注意可能发生或将要发生的某种不好的事情或情况: 行情~涨|别跑!~摔着!|~饭快凉了,快吃吧。 [助] 用在动词或动词结构后面, 表示试一试(前面的动词常用重叠式):想想~I找找~|等一等~l评评理~先做几 天~。 (2)望: [动] 向远处看:登山远~|一~无际的稻田。观看;察看:~风!观~|~ 闻问切。探望:拜~|看~。盼望;希望①:~子成龙l~准时到会。盼头;希望②:

中文语义依存分析评测大纲

中文语义依存分析评测大纲 一、评测对象 本次评测的对象是中文句子的词语之间的语义及句法依存关系分析技术。 二、评测内容 本次评测主要评测依存关系分析系统对中文句子进行依存分析的准确性。 三、评测方法 1.评测方式 本次评测为离线评测,参评单位自行处理数据,生成相应结果后提交。训练语料将提前1个月公布。 2.评测步骤 1)评测单位预先给出若干训练数据(已标注依存分析结果); 2)评测单位给出测试数据(未标注依存分析结果); 3)参评单位运行被测系统,得出测试结果; 4)参评单位提交测试结果; 5)评测单位标注答案,运行自动评测程序,统计评测结果。 3.评测标准 1)量化指标 本次评测采用三个指标对被测试系统进行评测,分别为: i.依存标注准确率(Labeled Attachment Score, LAS) ii.依存准确率(Unlabeled Attachment Score, UAS) iii.标注准确率(Labeled Accuracy, LA) 令整个测试预料包含的词数为N,任意词语的依存用三元组进行表示,其中word为词本身,word以关系relation依存于headword。在被测试系统的输出中,令所有headword正确的词语的数目为N a,所有relation正确的词语的数目为N l, 所有headword和relation都正确的词为N al,那么,测试指标的计算方法如下: LAS=N al N UAS=N a N LA=N l N 三个指标的优先级分别为LAS>UAS>LA。 4.数据格式 测试数据采用CONLL1格式,数据文件采用UTF-8编码。测试数据总共提供6列值,分别为:词语ID、词语、词性(粗粒度)、词性(细粒度)、被依存词ID和依存关系,即CONLL 格式中的第1、2、4、5、7和8列。其他列留空(用“_”填充)。列与列之间用“\t”分隔,行与行之间用“\n”分隔,句子与句子之间用空行分隔。被测试系统可以自行对其他列进行补充,但不允许修改分词结果(清华大学SDN语料的词性为自动标注结果,参评者可对词性进行重新标注)。 输出数据同样采用CONLL格式,其中第1、2列应当与测试数据严格一致,分析结果填充到第7,8列。其他列可留空(用“_”填充),也可以保留自行补充的数据。 1http://ilk.uvt.nl/conll/#dataformat

义素分析

○对下面各组词进行义素分析。 1.名词 a.毛笔铅笔圆珠笔钢笔粉笔 毛笔:[+书写用具]、[+笔头用毛制成]、[+用墨汁书写] 铅笔:[+书写用具]、[+笔心用石墨或加颜料的黏土制成]、[+用笔心材料书写] 圆珠笔:[+书写用具]、[+笔尖是小圆钢珠]、[+用油墨书写] 钢笔:[+书写用具]、[+笔头用金属制成]、[+用墨水书写] 粉笔:[+书写用具]、[+笔身用白垩、熟石膏粉等制成]、[+用笔身材料书写] (注:为了简明,每词只注出具有的义素。不具备的义素一对比便知。) b.哥哥弟弟姐姐妹妹 哥哥:[+同胞]、[+年长]、[+男性] 弟弟:[+同胞]、[-年长]、[+男性] 姐姐:[+同胞]、[+年长]、[-男性] 妹妹:[+同胞]、[-年长]、[-男性] 2.动词 动词的义素结构模式可概括为{动词}=[主体、方式、动作、客体、结果]。试分析下列各组动词的义素结构模式。 a.切砍剁削 {切}=[+用刀、+向下、-用猛力、+分开、+物体本身、+成块状或片状] {砍}=[+用刀斧、+向下、+用猛力、+分开、+物体本身、+成块状] {剁}=[+用刀斧、+向下、+用猛力、+分开、+物体本身、+成小块或碎末状] {削}=[+用刀、+向下、-用猛力、+分开、+物体表层、+成片状] b.坐蹲站 {坐}=[+身体动作]、[+臀部着物]、[-脚部支撑身体重量]、[-直着身体] {蹲}=[+身体动作]、[-臀部着物]、[+脚部支撑身体重量]、[-直着身体] {站}=[+身体动作]、[-臀部着物]、[+脚部支撑身体重量]、[+直着身体] c.走跑跳 {走}=[+脚部动作]、[+双脚交互运动]、[+向前]、[+迅速]、[+用力] {跑}=[+脚部动作]、[+双脚交互运动]、[+向前]、[+迅速]、[+用力] {跳}=[+脚部动作]、[-双脚交互运动]、[+向前]、[+迅速]、[+用力] 3.形容词 请用义素分析法对下列词的词义进行辨析和描写。 优秀优良优异良好 优秀:[+好]、[+用于成绩]、[-修饰习惯]、[+修饰人才]、[-修饰品种]、[+程度2] 优良:[+好]、[+用于成绩]、[-修饰习惯]、[-修饰人才]、[+修饰品种]、[+程度1] 优异:[+好]、[+用于成绩]、[-修饰习惯]、[-修饰人才]、[-修饰品种]、[+程度3] 良好:[+好]、[+用于成绩]、[+修饰习惯]、[-修饰人才]、[-修饰品种]、[+程度0] (注:程度0表示基础级,1、2、3表示程度渐高。)?第七章语用 ?语用,即语言的使用。语用学(pragmatics)是语言学的一门新兴学科,也是符号学 (semiotics)的一个部门。它研究语言符号同符 号使用者之间的关系,即研究人们怎样运用语言 符号进行交际。它从语言使用的角度,探讨人们 在用语言进行交际时出现的种种现象及其规律。 ?第一节语用要素 一、语用要素概说 ?一次言语交际,必须具备以下要素:发话人(sender)、受话人(receiver)、话语 (discourse)、语境(context)。 ?发话人是言语行为的主体,受话人是言语行为的客体,话语是联系主、客体的媒介,语境是 言语行为存在的环境。 ?我们理解的语境是:与言语行为密切相关的各种主客观因素构成的交际环境。主要包括三个 方面: ?(1)言辞语境:前后词、前后语、上下段等。 ?(2)情景语境:交际时的具体情景因素构成的语境,如时间、地点、场合、受众(如人数 多少)等。 ?(3)社会语境:言语交际双方具有的社会人文因素所构成的语境,如地位、职业、性别、 年龄、信仰、情绪、修养等。 ?第二节语用行为 一、什么是语用行为 ?语用行为是使用语言进行交际的行为,也叫言语行为(speech act)。如问“这书是不是你 的?”你可以用点头这种身体行为表示肯定回答, 也可以用“是的。”这种言语行为进行回答,两 者是等价的。因此,言语行为和其他行为一样, 也是人类重要的行为。 二、语用行为的类型

语义特征分析

语义特征分析 一、含义 ?语义特征是语言单位之间相互联系或相互区别的语义要素,它很大程度上制约着语言单位相互组合的可能性以及组合的方式,反映了语言单位的组织形式跟现实世界的对应关系。 ?语义特征分析为进一步分化同形句式,为根据句法研究的需要对同一类实词划分小类,提供了更为可靠的句法、语义依据,因此语义特征分析无疑使语法研究朝着形式和意义相结合的方式迈出了更可喜的一步 二、作用 ?语义特征分析能够促使语法研究的精密化,从而使语法研究更具解释力。20世纪80年代以来,语义特征分析在汉语语法研究中得到了广泛的运用。除朱德熙以外,陆俭明、邢福义、马庆株、邵敬敏等都是积极实践者。概括起来,语义特征分析在以下诸多方面有很强的解释力,具有广泛的实践价值。 ?(一)语义特征分析能够较好的揭示一个句法组合能否成立的原因。“香蕉、苹果、梨子、杨桃”因为共有[+水果]的范畴特征而被认为是有意义的组合,而“香蕉、石子、泉水、黄土”因为缺乏共同的范畴特征而不被理解。“笔墨纸砚”、“桌椅板凳”、“锅碗瓢盆”、“油盐酱醋”都是这种类型的并列。“吃馒头”可说而“喝馒头”不能被接受,同样“喝汤”可说而“吃汤”不能被接受。“吃”和“喝”的这种对立可以用语义特征表示为:吃[+施事;+固体食物;+咀嚼;+吞咽],喝[+施事;-固体食物;-咀嚼;+吞咽]。 ?(二)语义特征分析可以揭示某些词语的比较隐蔽的语义特征。例如“写、搛、留、舀”等动词本身并不包含“给予”的意义。但当说到“写信、搛菜、舀汤、留座位”的时候,就有可能取得“给予”的意义[6]。这时,它们可以跟“卖、送、递、让”等本身包含“给予”意义的动词一样,可以出现在“V+NP(受)+给+NP(与)”或“V+给+NP(与)+NP(受)”格式中。例如:?(2)写一封信给老王? 写给老王一封信 ?舀一瓢水给小张(喝)? 舀给小张一瓢水(喝) ?留一个座位给老大爷? 留给老大爷一个座位 ?“写、搛、留、舀”等的这种特性使它们有别于其他行为动词,如“看、读、撞、拉”等。?(三)语义特征分析可以揭示某些句式能否成立的语义依据。例如,现代汉语里有一种由形容词加“(一)点儿”构成的祈使句:形容词+(一)点儿!可是,并不是所有的形容词都能进入该句式[7]。试比较: ?(3)A. 虚心点儿!积极点儿!坚强点儿! ?主动点儿!灵活点儿!大方点儿! ?B. 粗一点儿!近一点儿!高一点儿! ?浓一点儿!大一点儿!慢一点儿! ?C. *骄傲点儿!*悲观点儿!*罗嗦点儿! ?*胆小点儿!*嘈杂点儿!*蛮横点儿! ?D. *可爱点儿!*健康点儿!*伟大点儿! ?*优秀点儿!*美丽点儿!*高尚点儿! ?(3)中四组格式中的形容词的语义特征可以用矩阵图区别如下: ?(3')形A:[+褒义,-贬义,+可控] ?形B:[-褒义,-贬义,+可控] ?形C:[-褒义,+贬义,±可控] ?形D:[+褒义,-贬义,-可控] ?可见,只有同时具备[-贬义]和[+可控]两项语义特征的形容词才能够进入以上格式。?(四)语义特征分析能够较好地解释某些看似狭义同构的句式的内部差异,同时为词类的进一步细分提供“最可靠的语法、语义依据”[4]。例如:

语义特征的界定与提取方法_邵敬敏

2005年1月 第37卷 第1期 外语教学与研究(外国语文双月刊) Foreign Language Teaching and Research(bimonthly) Jan.2005 Vol.37No.1语义特征的界定与提取方法 暨南大学 邵敬敏 周 芍 提要:本文首先对语义特征进行了界定,通过与义素的对比分析,揭示语义特征的本质内涵,并在此基础上将语义特征分成四类。文章重点提出,语义特征可有四种提取方法:内省概括法、组合分析法、对立比较法和变换分析法。语义特征分析法虽然还存在一些不足,但作为一种研究方法,对于我们研究汉语语法规则有着不可替代的作用。 关键词:语义特征、内省、组合、比较、变换 [中图分类号]H03;H04 [文献标识码]A [文章编号]1000-0429(2005)01_0021-8 朱德熙先生指出:“语法研究发展到今天,如果光注意形式而不注意意义,那只能是废话,如果光注意意义而不注意形式,那只能是胡扯”(见陆俭明1997:61)。变换分析法把句法分析从语法结构关系范畴扩大到语义结构关系范畴,通过变换,不但可以分化歧义句式或给原句式定性分类,而且也可扩大我们的视野,帮助我们把研究工作进一步引向深入。然而,变换仍然有其局限,它无法解释造成歧义的根本原因。这一局限迫使人们寻找新的突破口,探求新的分析方法来解决这些问题。变换法以前的汉语句法分析,几乎都纠缠于语言形式方面,从显性语法形式到隐性语法形式,形式方面的研究已臻完善,很难出现重大突破,而语义方面却还有许多领域等待开发和进一步探讨。这就引起人们深思,形式研究中出现的棘手难题,其答案是否正埋藏于语义层面呢?在这样的背景下,语义特征分析法等语义分析法应运而生。 一、语义特征的界定 1.简要回顾 “语义特征分析法”作为一种语法分析方法,来源于语义学中的语义成分分析法。1943年,哥本哈根学派创始人叶姆斯列夫提出了词义可分的设想;1955年,布龙菲尔德等提出“语义特征”这一术语,但没有上升到语义分析的高度;1956年,人类学家威廉·古迪纳夫在《成分分析与意义研究》(Componential Analysis and the Study of Meaning)中提出了语义成分分析法,用以从文化角度研究亲属称谓语等意义(转引自张庆云1994)。这一方法很快被美国语言学家卡茨和福特借鉴运用于语言学,用来为转换生成语法寻求语义特征,引起了当时语法学和语义学界的特别关注。 在国内,最早对语义特征做出分析并运用于汉语语法研究的当推朱德熙。他在《现代汉语形容词研究》(1956)中把形容词分为两类:甲类成分(红)和乙类成分(红红的、红通通的、通红、很红),指出:两者的区别“不在基本的词汇意义上,而在抽象的、概括的意义上,即前者表示的是性质,后者表示的是这种性质的状况或 21 本文得到暨南大学优秀人才引进项目“汉语语义语法的理论探索”的资助。

义素分析法

义素分析法 义素分析是把词语的义项进一步分析为若干义素的组合,以便说明词义的结构、词义之间的关系以及异同,因此,义素分析往往要分析一组相关的词语,系统地分析词语的意义。这就使义素分析不仅要遵守定义的一般原则,还要遵循自己独特的原则。这些原则有系统性原则、对等性原则和简明性原则。 所谓系统性原则,就是说义素分析必须在一定的语义系统中进行,不在一个系统中无法进行义素分析。例如汉语中的“叔叔”,有两个义项,一个是亲属称谓,一个是社交称谓,这是两个系统,分析义素时作为亲属称谓,“叔叔”要和“舅舅”“伯伯”“姑父”等在一个系统。而作为社交称谓,“叔叔”则要与“同志”“师傅”“先生”等在一个系统。否则就难以进行有效地义素分析。 所谓对等性原则,就是说义素分析的结果必须与义项的意义相等,所指范围不能过宽或过窄。例如汉语中的“男人”,其义项为“男性成年人”。其义素分析为[人,男性,成年],这样就与义项的意义对等。假如义素分析为[人,男性],则范围过宽,不能与“男孩”区别开来。假如分析为[人,男性,成年,胡子长],则范围过窄,难道胡子短的男人就不是男人吗? 所谓简明性原则,就是说义素分析在明确的前提下,用尽可能少的义素来揭示词语的区别性特征。例如“男人”分析为[人,男性,成年],就符合简明性。如果分析为[人,男性,成年,有思维能力,动物],“动物”还可分析为[能运动的,生物]等等,则不符合简明性原则。 义素分析的方法就是对比,其程序首先是确定比较的范围。例如我们要分析“哥哥”的义素,就要将其与“姐姐”“弟弟”“妹妹”等在一起分析,因为它们有共同点“同胞”,属于一个范围。如果将“哥哥”与“桌子”“司机”“苹果”等放在一起,就无法进行义素分析,因为它们没有可比性,不属于一个范围。 第二个程序就是通过对比,找出一组词的共同语义特征和不同语义特征。共同语义特征就是它们的共同义素,不同语义特征就是区别义素。例如“哥哥”“姐姐”“弟弟”“妹妹”这四个词,经过比较,从中找出共同义素[同胞],然后再提取出

语义特征分析法

第四讲语义特征分析法 变换分析的局限与语义特征分析的产生 先看第三讲举过的例子: (1)a. 台上摆着鲜花→ 鲜花摆在台上 -/→ 台上正摆着鲜花 门上帖着对联→ 对联贴在门上 -/→ 门上正帖着对联 黑板上写着字→ 字写在黑板上 -/→ 黑板上正写着字 床上躺着病人→ 病人躺在床上 -/→ 床上正躺着病人 前三排坐着来宾→ 来宾坐在前三排 -/→ 前三排正坐着来宾 b. 台上演着梆子戏-/→ 梆子戏演在台上→ 台上正演着梆子戏 门外敲着锣鼓-/→ 锣鼓敲在门外→ 门外正敲着锣鼓 外面下着大雨-/→ 大雨下在外面 → 外面正下着大雨 教室里上着课-/→ 课上在教室里 → 教室里正上着课 大厅里跳着舞-/→ 舞跳在大厅里 → 大厅里正跳着舞 (1)a和(1)b左列可以分别抽象为: (2) [A]式:名词[处所]+动词+着+名词语 [表示存在,表静态] [B]式:名词[处所]+动词+着+名词语 [表示存在,表动态] 问题:格式相同——词类序列相同,内部结构层次相同,每一层面的直接

组成成分之间的语法结构关系相同,为何产生歧义 仔细观察不难发现,歧义的产生跟句式中的动词有关。(1)a 的动词虽然具体意思各不相同,但是都具有共同的“使附着”的语义内涵。请大家查查词典,看词典里的释义。 如果把出现在[A]式中的动词记为“动词a”,那么“动词a”所具有的语义特征可以标示为: (3)动词a:[+使附着] 相应地,[B]式中的动词可以记为“动词b”,“动词b”布局有“使附着”的语义特征,所以“动词b”的语义特征可以标示为: (4)动词b:[-使附着] 上文(2)的歧义格式“名词[处所]+动词+着+名词语”可以分化为: (5)[A]式:名词[处所]+动词a+着+名词语 [B]式:名词[处所]+动词b+着+名词语 上文采用的分析手段就是语义特征分析法。语义特征分析发就是通过分析句法格式中处于关键位置上的动词在该句法格式内所呈现的互有差异的不同小类的词的不同语义特征,来达到说明造成该同形、歧义格式的原因的。这是语义特征分析法的精神所在。 “语义特征”的定义 4.2.1 词汇语义特征和语法语义特征 音位学(phonology)“区别特征”(distinctive feature)的理论诱发了语言学“义素”(seme)和“语义特征”(semantic feature)等重要概念的形成。然而,“义素”和“语义特征”的所指并非完全等同。义素是词的能够独立运用的语义单位即义位的构成要素,是从义位中分解出来的最小的语义成分(semantic component);语义特征是一组语义相关的词内部相同或相异的语义要素,是通过对一组在语义上有关联的词语进行对比,从相关义位中分解出来的

第三章-义素分析法

第三章义素分析 一、语义场的提出 “语义场理论”(The Theory of Semantic Fields)是德国学者特雷尔(J. Trier)最先提出來的。他的语义场理论以下述观点为依据: (1)语言词汇中的词在语义上是互相联系的,它们共同构成一个完整的词汇系統。一方面,词汇消亡,新词出现; 另一方面,随着时间的消逝,词与词之间的语义关係也在不断地调整变化。 (2)既然语言词汇中的词在语义上互相联系,我们就不应该孤立地研究单个词的语义变化,而必须把语言词汇当作是一个完整的系統來加以研究。 (3)既然词与词之间在语义上有密切的联系,我们只能透过分析、比较词与词之间的语义关係,才能确定一个词的真正涵义。也就是说,词只有在“语义场”中才有意义。 当代的语义学理论都强调词与词之间的语义关係。不同语言里的某一个“共同概念”支配下所构成的语义场可能不同。 二、语义场的性质 “场”概念本是具体的。“场”的基本意义是“场地”、“场所”。具有空间性。引申为“物理场”,开始抽象化,即指相互作用场,但它仍是物质存在的两种基本形式之一,存在于整个空间。如:引力场、电磁场、电子场等。它也具有空间性,同时强调是相互作用“场”,指出实物之间的相互作用就是依靠有关的“场”来实现的。这种“场”均与基本粒子有不可分割的关系。 再进一步引申为分面有某一种物理量或数学函数的空间区域本身,不一定是物质存在的形式,例如:标量场、矢量场、张量场。有时为了研究的方便,甚至可称有火炉的房间有一个温度场,河流中有一个流速场。“场”概念进一步虚化,但也具有空间性。 语义场是基于概念关系场。它以语义网络形式构成一种完全虚化的非物质的空间区域。语义场也具有空间性,只不过在这个空间区域内分布的不是物理量或数学函数,而是构成义位的义素。

从语义特征分析到行为类型分析

123 摘要:本文对比汉语动词的语义特征分析方法和“行为类型”的分析方法,在针对本文所讨论的对象来看,“行为类型”的分析具有更强的解释力。行为在时间(事件进程)上的不同类型不仅可以用来解释一些句式之间的差别,而且也与不同动词所能选择的体标记有直接关系。学者们通常采用Vendler 的四范畴来解释行为类型或情状类型,而现代汉语动词在形态上表现出来的是“状态”“成就”和“活动”类型,“活动”和“完成”则属于情状类型。 关键词:语义特征动词行为类型情状类型 引言 动词的行为类型(Aktionsart )近年来引起国内不少学者的注意,在德语、希腊语等语言中动词都分属于不同的行为类型,不同行为类型的动词构成句子的不同时体类型,因此动词的行为类型和句子的时体类型之间有较为整齐的对应关系。此外,行为类型也和事件的情状类型(Situation Type ,我们用来指称动词短语或小句的事件时间类型)有关。情状类型不仅仅有时体分析的意义,而且也有语义分析的价值。汉语句子的时体类型一直是学者们关注的问题,也有不少学者从汉语动词的行为类型角度作出了很有意义的探索。本文先用行为类型的理论来解释两类著名的句法结构在语义上的差别,然后讨论动词和行为类型之间的关系,并试图在Vendler 的基础上将汉语动词时间结构的研究引向深入。 1.“±附着”语义特征的解释力 现代汉语语法研究中有一个很经典的例子:“台上坐着主席团”和“台上唱着戏”的比较,朱德熙(1981)曾经将这两个句子的差别归于“±附着”义的对立。如下: (1)a 黑板上写着两个字。b 台上唱着戏。 朱先生认为a 类句式的动词都有“附着”的意义,b 类句式中的动词则没有这个意义。这一类动词还包括:“坐、站、躺、蹲”等。朱先生认为,这是这类动词本身的语义特征,他说“这可以从词典里对某些Vd 类动词的释义里看出来”。上面的a 组可以变换为下面的c 组: (2)a 院子里放着四方桌。c 四方桌放在院子里。 (3)a 屋子里躺着一个人。c 一个人躺在屋子里。 (4)a 草地上站着张三。c 张三站在草地上。 但是b 组的例子不能变换成与c 平行的d 组: (5)b 台上唱着戏。d*戏唱在台上。 (6)b 屋子里跳着舞。d*舞跳在屋子里。 金立鑫 从语义特征分析到行为类型分析 从语义特征分析到行为类型分析——————————————— ※感谢韩国釜山庆星大学图书馆提供的外文资料,感谢上海外国语大学邵菁老师的修改意见。 ※2008?4

语义分析的一些方法

语义分析的一些方法 语义分析的一些方法(上篇) 5040 语义分析,本文指运用各种机器学习方法,挖掘与学习文本、图片等的深层次概念。wikipedia上的解释:In machine learning, semantic analysis of a corpus is the task of building structures that approximate concepts from a large set of documents(or images)。 工作这几年,陆陆续续实践过一些项目,有搜索广告,社交广告,微博广告,品牌广告,内容广告等。要使我们广告平台效益最大化,首先需要理解用户,Context(将展示广告的上下文)和广告,才能将最合适的广告展示给用户。而这其中,就离不开对用户,对上下文,对广告的语义分析,由此催生了一些子项目,例如文本语义分析,图片语义理解,语义索引,短串语义关联,用户广告语义匹配等。 接下来我将写一写我所认识的语义分析的一些方法,虽说我们在做的时候,效果导向居多,方法理论理解也许并不深入,不过权当个人知识点总结,有任何不当之处请指正,谢谢。 本文主要由以下四部分组成:文本基本处理,文本语义分析,图片语义分析,语义分析小结。先讲述文本处理的基本方法,这构成了语义分析的基础。接着分文本和图片两节讲述各自语义分析的一些方法,值得注意的是,虽说分为两节,但文本和图片在语义分析方法上有很多共通与关联。最后我们简单介绍下语义分析在广点通“用户广告匹配”上的应用,并展望一下未来的语义分析方法。

1 文本基本处理 在讲文本语义分析之前,我们先说下文本基本处理,因为它构成了语义分析的基础。而文本处理有很多方面,考虑到本文主题,这里只介绍中文分词以及Term Weighting。 1.1 中文分词 拿到一段文本后,通常情况下,首先要做分词。分词的方法一般有如下几种: ?基于字符串匹配的分词方法。此方法按照不同的扫描方式,逐个查找词库进行分词。根据扫描方式可细分为:正向最大匹配,反向最大匹配, 双向最大匹配,最小切分(即最短路径);总之就是各种不同的启发规则。 ?全切分方法。它首先切分出与词库匹配的所有可能的词,再运用统计语言模型决定最优的切分结果。它的优点在于可以解决分词中的歧义问 题。下图是一个示例,对于文本串“南京市长江大桥”,首先进行词条检索(一般用Trie存储),找到匹配的所有词条(南京,市,长江,大桥,南京市,长江大桥,市长,江大桥,江大,桥),以词网格(word lattices)形式表示,接着做路径搜索,基于统计语言模型(例如n-gram)[18]找到最优路径,最后可能还需要命名实体识别。下图中“南京市长江大桥” 的语言模型得分,即P(南京市,长江,大桥)最高,则为最优切分。 图1. “南京市长江大桥”语言模型得分

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法现代汉语语法的五种分析方法是语法学基础里很重要的一个内容,老师上课也会讲到,我在这里把最简略的内容写在下面,希望能对2017汉硕考研学生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:了解更多的汉硕考研信息、资料加丹丹老师Q。依旧义乌散散刘思伊尔 一.中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[]标注状语,用<>标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。 (2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性:

1.在一个层面上分析句子,层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3.一些由于句子的层次关系不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二.层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。 基本精神: 1.承认句子或句法结构在构造上有层次性,并在句法分析上严格按照内部的构造层次 进行分析; 2.进行分析时,要明确说出每一个构造层面的直接组成成分; 3.分析时只管直接成分之间的语法结构关系,不管间接成分之间的语法结构关系或句 法结构中实词与实词之间的语义结构关系; 优越性: 1.注意到了句子构造的层次性; 如:他刚来我们便宜他了 ││__│││___│ │___││_____│

相关文档
最新文档