浅谈《现代汉语词典》(第五版)词性标注的几个问题

浅谈《现代汉语词典》(第五版)词性标注的几个问题
浅谈《现代汉语词典》(第五版)词性标注的几个问题

浅谈《现代汉语词典》(第五版)词性标注的几个问题摘要:本文主要从功能的角度对《现代汉语词典》(第五版)的词性标注进行了初步的探索,主要涉及词性标注及其与释义和配例相一致、兼类词的释义等几个方面的问题,对《现汉》(五)的成功和不足之处作了一定说明。

关键词:《现代汉语词典》(第五版)词性标注释义

《现代汉语词典》是目前国内最有影响的语文辞书之一。对现代汉语词典质量产生影响的根本性因素,是词典的释义问题。

一、《现代汉语词典》(第五版)词性标注

现代汉语词典标注词性,给汉语教学、用户的学习和使用和中文信息处理等带来了很大的方便。标注词性必须要对词类系统和词与非词进行界定。科学的给词归类,主要根据词的语法功能。陆俭明提出的词类划分标准是:1、词充当句法成分的功能,2、词跟词结合的功能,3、词表示类别的功能,即语法意义。《现代汉语词典》(第5版)依据的词类是中学语文课本的教学词类系统,是比较科学的。如:

集成:【动】同类著作汇集在一起(多用做书名):《丛书~》|《中国古典戏曲论著~》。(《现汉》(五)p592)集锦:【名】编辑在一起的精彩的图画、诗文等(多用做标题):图片~|邮票~。(《现汉》(五)p593)

《现代汉语词典》(第5版)中的“集成”与“集锦”根据配例来看,“丛书集成”、“图片集锦”、“邮票集锦”,二者看似相同,但

现代汉语词性专题练习资料

现代汉语词性专题练 习

现代汉语词性专题练习 一、选择题 1.能带宾语的是()A名词 B动词 C形容词 D副词 2.“上来”是()A助动词 B判断动词 C趋向动词 D及物动词 3.“不、没”都是()A程度副词 B时间副词 C范围副词 D否定副词 4.“很、挺、十分”是()A程度副词 B范围副词 C语气副词 D情态副词 5.“我、你、他”是()A指示代词 B疑问代词 C人称代词 D名词 6.“他在黑板上写字”的“在”是()A动词 B副词 C介词 D方位词 7.“哎哟”是()A拟声词 B语气词 C叹词 D助词 8.代词包括()A人称代词 B指示代词 C疑问代词 D代名词 E代动词 9.虚词包括()A介词 B副词 C连词 D助词 E语气词 10.“报告”一词兼()A名词 B动词 C形容词 D连词 E代词 11.“和、跟、同、与”兼()A动词 B连词 C介词 D副词 E助词 12.下列语句中的“在”不属于介词的是() A我在家 B他在黑板上写字 C把东西放在桌子上 D他在看书 E在家要孝顺父母 13.下列句子中不属于介词“跟”的有()。 A我跟他一起去的 B你跟他要 C谁跟谁都没关系 D你抽空跟他谈谈 E你快跟着我走 二、指出下列词的词性:非常()这里()前后()小()哪里()终于()已经()不()赋予()轰隆()得()大()忽然 ()简直()才()半夜()除了()很多()勇敢()思想 ()啊()或许()只好()二万()迅速()进来()仅仅 ()立刻()

热爱()十几棵()喜欢()大约()次()哗啦()下去() 斟酌()怎样()起来()晚上()亩()前面()或者() 对于()跟()是()三百()美丽()叮当()夏天()鲁迅()我们()批评()的()吧()平坦()有()变化()十分()自己()聪明()从()专家()扩大()缓慢()应该() 按照()回来()喂()马上()消失()飞机()许多() 简直() 三、.指出下列句子中加标记词所属的词类。 (1)这件事已经讨论过了。(过)()(2)天渐渐冷起来了。(渐渐)() (3)他正在教室里看书。(正)()(4)自行车他骑出去了。(出去)() (5)我拿着—本书。(着)()(6)你吃了饭再走。(了)() (7)他是外国人吗?(吗)()(8)你应该努力学外语。(努力)()(9)他刚才来过。(刚才)()(10)最好听的是这首歌。(最)()(11)房子上面铺着瓦。(上面)()(12)这是一本袖珍词典。(袖珍)() (13)老张请我吃饭。(请)()(14)幸亏他来。(幸亏)() (15)我忽然想起来了。(忽然)()(16)这件事很突然。(突然)()(17)无论谁都说好。(无论)()(18)他连忙说不行。(连忙)()

现代汉语词典第六版新增3091词语

【A】【挨班儿】【矮化】【矮行星】【爱搭不理】【爱克斯刀】【爱理不理】【碍于】【安监】【安拉】【安慰剂】【安于】【氨纶】【暗地】【暗河】【暗下里】【黯然神伤】【凹镜】 【B】【八音】【霸王条款】【白板】【白道1】【白脸】【白名单】【白杆】【白寿】【白昼见鬼】【百搭】【百废待举】【百废俱兴】【百分百】【百战百胜】【百折不回】【摆渡车】【摆擂】【摆样子】【拜金主义】【拜票】【版权法】【板儿寸】【办结】【半决赛】【半路夫妻】【半日制】 【半数】 【扮靓】 【傍大款】 【保鲜膜】 【保险单】 【保险套】 【褓姆】 【报备】 【抱枕】 【保质期】 【豹子胆】 【暴堵】 【暴狱】 【暴走】 【爆仓】 【爆炒】1 【爆粗】 【爆粗口】 【卑鄙龌龊】 【背包客】 【背囊】 【背囊客】 【北京人】 【北漂】 【贝司】 【贝斯】 【背地】 【背投】 【被动吸烟】 【被告人】 【被叫】 【被迫】 【奔儿头】 【本邦菜】 【本着】 【绷弓】 【必将】 【逼供信】 【闭庭】 【闭眼】 【闭嘴】 【贲临】 【碧玺】 【觱栗】 【壁葬】 【边检】 【编委】 【编舞】 【鞭辟近里】 【变形金刚】 【便当】 【便宜从事】 【辩证施治】 【标本兼治】 【标间】 【标识】 【标准工资】 【标准间】 【标准像】 【飙高】 【飙歌】 【飙戏】 【别看】 【别说是】 【冰场】 【兵役制】 【饼屋】 【并称】 【并非】 【病急乱投医】 【病媒】 【病险】 【播客】 【播迁】 【舶来】 【博客】 【博文】 【博弈论】 【跛脚鸭】 【补编1】 【补编2】 【补气】 【补阙】 【捕快】 【不带】 【不得(de)】 【不敌】 【不点儿】 【不贰】 【不复】1 【不复】2 【不干胶】 【不敢】 【不攻自破】 【不关】 【不归路】 【不果】 【不教而诛】 【不觉】 【不开眼】 【不可或缺】 【不可胜数】 【不名一钱】 【不期而然】 【不求有功, 但求无过】 【不疼不痒】 【不痛不痒】 【不枉】 【不温不火】 【不瘟不火】 【不虚此行】 【不粘锅】 【步测】 【C】 【才赋】 【才俊】 【才貌】 【财产税】 【财神爷】 【彩点】 【彩调】 【彩铃】 【彩屏】 【采邑】 【菜鸟】 【菜籽】 【菜籽油】 【参事】 【餐券】 【餐叙】 【残奥会】 【残旧】 【残片】 【残渣】 【蚕蛹】 【灿灿】 【苍哑】 【草根】 【草就】 【插播1】 【茶道】 【茶寿】 【茶歇】 【茶叙】 【茶余酒后】 【查结】 【差一点儿】 【拆封】 【掺沙子】 【馋虫】 【产床】 【产能】 【产权证】 【产业链】 【颤颤巍巍】 【颤颤悠悠】 【颤悠悠】 【刬除】 【长存】 【长鸣】 【长三角】 【长蛇阵】 【长谈】 【长效】 【长痛不如短 痛】 【肠梗阻】 【常时】 【惝恍】 【唱多】 【唱空】 【唱衰】 【抄底】 【超尘出俗】

现代汉语的词性分类

现代汉语的词可以分为两类12种词性。一类是实词:名词、动词、形容词、数词、量词和代词。一类是虚词:副词、介词、连词、助词、叹词和拟声词。 实词 一.名词 表示人和事物的名称叫名词。如“黄瓜、猪、马、羊、白菜、拖拉机、计算机”。 1、表示专用名称的叫做“专用名词”,如“云南、上海、李白、白居易,中国”。 2、表示抽象事物的名称的叫做“抽象名词”,如“范畴、思想、质量、品德、品质、友谊、方法”。 3、表示方位的叫做“方位名词”,如“上、下、左、右、前、后、中、东、西、南、北、前面、后边、东边、南面、中间”等。二.动词 动词表示人或事物的动作、行为、发展、变化。 1、有的动词表示一般的动作,如"来、去、说、走、跑、吼、叫、学习、起飞、审查、认识"等。 2、有的动词表示心理活动,如“想、重视、注重、尊敬、了解、相信、佩服、惦念”等,这样的动词前面往往可以加上“很、十分”。 3、有的动词表示能够、愿意这些意思,叫做“能愿动词”,它们是

“能、要、应、肯、敢、得(dei)、能够、应该、应当、愿意、可以、可能、必须”,这些能愿动词常常用在一般的动词前面,如“得去、能够做、可以考虑、愿意学习、应该说明、可能发展”。 4、还有一些动词表示趋向,叫做“趋向动词”,如“来、去、上、下、进、出、上来、上去、下来、下去、过来、过去、起来”,它们往往用在一般动词后面表示趋向,如“跳起来、走下去、抬上来、跑过去”。 5、“是”“有”也是动词,跟动词的用法一样,“是”也成为判断动词。 三.形容词 形容词表示事物的形状、性质、颜色、状态等,如“多、少、高、矮、胖、瘦、死板、奢侈、胆小、丑恶、美丽、红色”。状态形容词通红、雪白、红通通、黑不溜秋等前面不能加“很”。 四.数词 数词是表示事物数目的词。如“一、二、两、三、七、十、百、千、万、亿、半”。 五.量词 量词是表示事物或动作单位的词。汉语的量词分为名量词和动量词。 1、名量词表示事物的数量,又可以分为单位量词和度量量词。单位量词表示事物的单位,如“个、张、、只、支、本、台、架、辆、颗、

HanLP

HanLP HanLP下载 文档 联系 关于调用简单欢迎使用HanLP HanLP v1.2.7HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言 处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。Download Free & Open SourceHanLP完全开源,包括词典。不依赖其他jar,底层采用了一系列高速的数据结构,如双数组Trie树、DAWG、AhoCorasickDoubleArrayTrie等,这 些基础件都是开源的。官方模型训练自2014人民日报语料库,您也可以使用内置的工具训练自己的模型。 Star Me Easy to Use

通过工具类HanLP您可以一句话调用所有功能,文档详细,开箱即用。底层算法经过精心优化,极速分词模式下可达2,000万字/秒,内存仅需120MB。在IO方面,词典加载速度极快,只需500 ms即可快速启动。HanLP经过多次重构,欢迎二次开发。Documentation组件一览技术参数 HanLP v1.2.7的特征: 最高分词速度2,000万字/秒(极速分词,2.0GHz i7) 35万词典,覆盖现代汉语常用词、网络新词等 337万接续BiGram文法模型 500 ms 词典加载 训练自2014年人民日报切分语料 词语标注集兼容《ICTPOS3.0汉语词性标记集》 词语标注集兼容《现代汉语语料库加工规范——词语切分与词性标注》 最低内存要求120 MB(-Xms120m -Xmx120m -Xmn64m)基于双数组Trie的AhoCorasick自动机算法实现O(n)多模

现代汉语词性及专题训练、答案

现代汉语词类专题练习 一、选择题 1.能带宾语的是()。A名词B动词C形容词D副词 2.“上来”是()A助动词B判断动词C趋向动词D及物动词 3.“不、没”都是()A程度副词B时间副词C范围副词D否定副词 4.“很、挺、十分”是()A程度副词B范围副词C语气副词D情态副词 5.“我、你、他”是()A指示代词B疑问代词C人称代词D名词 6.“他在黑板上写字”的“在”是()A动词B副词C介词D方位词 7.“哎哟”是()A拟声词B语气词C叹词D助词 8.代词包括()A人称代词B指示代词C疑问代词D代名词E代动词 9.虚词包括()A介词B副词C连词D助词E语气词 10.“报告”一词兼()A名词B动词C形容词D连词E代词 11.“和、跟、同、与”兼()A动词B连词C介词D副词E助词 12.下列语句中的“在”不属于介词的是() A我在家B他在黑板上写字C把东西放在桌子上 D他在看书E在家要孝顺父母 13.下列句子中不属于介词“跟”的有()。 A我跟他一起去的B你跟他要C谁跟谁都没关系 D你抽空跟他谈谈E你快跟着我走 二、指出下列词的词性: 非常()这里()前后()小()哪里()终于()已经()不()赋予()轰隆()得()大()忽然()简直()才()半夜()除了()很多()勇敢()思想()啊()或许()只好()二万()迅速()进来()仅仅()立刻()热爱()十几棵()喜欢()大约()次()哗啦()下去()斟酌()怎样()起来()晚上()亩()前面()或者()对于()跟()是()三百()美丽()叮当()夏天()鲁迅()我们()批评()的()吧()平坦()有()变化()十分()自己()聪明()从()专家()扩大()缓慢()应该()按照()回来()喂()马上()消失()飞机()许多()简直() 三、.指出下列句子中加标记词所属的词类。 (1)这件事已经讨论过了。(过)()(2)天渐渐冷起来了。(渐渐)() (3)他正在教室里看书。(正)()(4)自行车他骑出去了。(出去)()

商务印书馆《现代汉语词典》(第6版)

商务印书馆版《现代汉语词典》(第6版)首选词集锦 整理者:张华豹 商务印书馆版《现代汉语词典》在1978年为初版,1983年和1996年曾出版过两部修订本,2002年出版增补本,2005年出版第5版,2012年出版第6版。由此看来,修订的时间间隔多则十几年,少则五六年。商务印书馆版《现代汉语词典》历来都被传媒界奉为圭臬。鉴于此,本人利用大量业余时间整理出首选词部分,谨此以方便业界同人及研究者。 望转发的童靴注明出处和链接,谨此致谢!!! ※红色的部分是比第5版多出(或与第5版有出入)的词(组合字除外)。 ※蓝色的部分在本版不作为首选词处理,但在第5版时又作为首选词处理的词。 1.哀号(首选):悲哀地号哭。也作哀嚎。 2.艾窝窝(首选),也作爱窝窝。 3.爱答不理(首选),也作爱搭不理。 4.按捺(按纳)。 5.按语(案语)。 6.巴儿狗(首选),也作叭儿狗。 7.疤瘌(首选),也作疤拉。 8.疤瘌眼儿(首选),也作疤拉眼儿。 9.跋前疐后(首选),也作跋前踬后。 10.把式(首选),也作把势。 11.白茬儿(首选):未经油漆的(木制器 物):~大门。也作白槎儿、白碴儿。12.白茬(首选):未用布、绸等缝制面的(皮 衣):~老羊皮袄。也作白楂儿。 13.百废俱兴(百废具兴)。 14.百叶窗(百页窗)。 15.般配(首选),也作班配。 16.斑白(班白、颁白)。 17.斑驳(班驳)。 18.斑斓(首选),也作斒斓。 19.板型(首选),也作版型。 20.版筑(首选),也作板筑。 21.苞谷(首选),也作包谷。 22.苞米(首选),也作包米。 23.孢子(胞子)。 24.保镖(保镳)。 25.保姆(①保母②褓姆):①受雇为人照管 儿童、老人、病人或为人从事家务劳动 的妇女。②保育员的旧称。 26.曝光(首选),也作暴光。 27.卑辞(首选),也作卑词。 28.贝多(首选),也作梖多。(“梖”用简体。)29.贝斯(首选),也作贝司。 30.备不住(首选),也作背不住。 31.背搭子(首选),也作被褡子。 32.背时(首选),也作悖时。 33.悖晦(首选),也作背晦。 34.悖理(首选),也作背理。 35.悖谬(首选),也作背谬。 36.比画(首选),也作比划。 37.笔画(笔划)。 38.笔芯(首选),也作笔心。 39.毕恭毕敬(必恭必敬)。 40.筚路蓝缕(首选),也作荜路蓝缕。 41.愊忆(首选),也作腷臆。 42.觱篥(首选),也作觱栗、( +觱[上下 结构])篥、筚篥。 43.编者按(编者案)。 44.扁豆(萹豆、稨豆、藊豆)。 45.辨正:辨明是非,改正错误。也作辩正。 46.辨证:辨别症候。也作辨症。 47.辩白(首选),也作辨白。 48.辩词(首选),也作辩辞。 49.辩证:辨析考证:反复~。也作辨证。 50.标志(标识)biāozhì。 51.鬓角(鬓脚)。 52.秉承(禀承)。 53.拨浪鼓(首选),也作波浪鼓。 54.波罗蜜(首选),也作菠萝蜜。 55.勃谿(首选),也作勃豀。 56.脖颈儿(首选),也作脖梗儿。 57.擘画(首选),也作擘划。 58.峬峭(首选),也作庯峭、逋峭。 59.补丁(补钉、补靪)。

汉语语料库词性标注自动校对方法研究

收稿日期:2004-06-15;修订日期:2004-11-27 基金项目:国家863计划资助项目(2001AA4031) 作者简介:张虎(1979-),男,山西大同人,硕士研究生,主要研究方向:中文信息处理; 郑家恒(1948-),女,山西太原人,教授,主要研究方 向:中文信息处理; 刘江(1980-),男,山西太原人,硕士研究生,主要研究方向:中文信息处理. 文章编号:1001-9081(2005)01-0017-03 汉语语料库词性标注自动校对方法研究 张 虎,郑家恒,刘 江 (山西大学计算机与信息技术学院,山西太原030006) (four_tiger@https://www.360docs.net/doc/7e6657553.html,) 摘 要:从聚类和分类的角度入手,对大规模语料库中的词性标注的自动校对问题作了分析,提出了语料库词性标注正确性检查和自动校对的新方法。该方法利用聚类和分类的思想,对范例进行聚类并求出阈值,根据阈值,判定词性标注的正误;对标注错误的词性,按靠近各词性类别重心的原则归类,给出一个校对词性,进而提高汉语语料库词性标注的准确率。 关键词:聚类;词性标注;自动校对中图分类号:TP391 文献标识码:A Study on auto -proofreading method for POS tagging of Chinese corpus ZHANG Hu,ZHENG Jia -heng,LIU Jiang (College o f Computer &In f ormation Technology ,Shan xi University ,Taiyuan Shanxi 030006,China) Abstract:The auto -proofreading problem in the large -scale corpus was analyzed,and a new method inspecting the correctness of POS tagging and an auto -proofreading method based on clustering and classifying were put https://www.360docs.net/doc/7e6657553.html,ing clustering and classifying,the method firstly classified the sequences of part of speech of the example and got the threshold value.Then according to the threshold value,it classified the tes t sequences to judge its correctness,and gave out a proofreading POS to the wrong POS Tagging.Furthermore,i t enhanced the correctness ratio of the part of speech tagging on large -scale corpus. Key words:clustering;POS Tagging ;au to -proofreadi ng 0 引言 随着语料库语言学研究的兴起,建设高质量的大规模语料库已成为首要任务。语料库作为研究资源其价值是通过对语料的标注来体现的,对语料库标注得越准确,语料库的价值就越高。 近年来国内外对词性标注的研究有很多,大多是采用基于规则和基于统计的方法,标注正确率分别达到89%和96%[5]。对错误标注结果进行分析,可以看出,无论哪种标注算法都有其固有缺陷:概率标注方法总会抑制小概率事件的发生,而规则方法本质上说是一种确定性的演绎推理方法,因此它们很难对词性标注的准确率进行进一步的提高。显然,这样的准确率仍然严重影响语料库的加工质量。 要对标注错误的词性进行自动校对,一个首要问题是词性标注的正确性检查。受一些文献的启发[6],本文提出了基于聚类和分类的词性标注自动校对的方法。该方法首先随机抽出一些含有兼类词的句子,经人工校对后,将含有相同兼类词的词性序列进行聚类并求出阈值;然后根据阈值对每个含有兼类词的词性序列进行逐一分类;通过计算相似度,找出标有该类的词性但相似度不在该类的阈值范围之内的序列,这些序列就被认为是词性标注不正确的;对词性标注错误的词性,按靠近各词性类别重心的原则归类,给出一个校对词性。我们对网上下载的中文核心期刊中的50万语料进行实验,正 确性检查的有效性约为76%,准确率约为83%,自动校对的准确率约为70%,对词性标注的准确率可以提高2~3个百分点。 1 词性错标现象分析 语料库中已标注词性的词语有两种标注结果:单标记词语和多标记词语。所谓单标记词语,即在语料库中只有一种词性标记的词语;多标记词语则为在语料库中标有两种或两种以上词性的词语。我们所做的正确性检查是针对多标记词语而言的。经分析,这些多标记词语包括两种情况: 1)词表中是单标记词语,但在语料中标了不同的词性,出现了词性标注的不正确。 词条:量化 语料中的多标记词性:k 、v 错例:所/u 获得/v 的/u 部分/n 集体/n 量化/k 资产/n 不/d 允许/vu 转让/v 校正词性:v 分析:/量化0这一词是非兼类词,在词表中只有v 这一唯一词性,没有标注k 的词性。 2)词表中是兼类词,即有不同标记的词语,这部分词语可能存在词性标注错误,即:在相同的语境中出现了不同的词性。 词条:高 第25卷第1期 2005年1月 计算机应用Computer Applications Vol.25No.1Jan.2005

现代汉语词性及专题训练答案

现代汉语词性及专题训 练答案

现代汉语词性及专题训 练答案 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

现代汉语词性 一.名词 表示人和事物的名称叫。如:黄瓜、猪、羊、白菜、拖拉机、计算机。 1、表示专用名称的叫做专用名词,如云南、上海、、白居易,中国。 2、表示抽象事物的名称的叫做抽象名词,如范畴、思想、质量、品德、品质、友谊、方法。 3、表示方位的叫做方位名词,如上、下、左、右、前、后、中、东、西、南、北、前面、后边、东边、南面、中间等。 二.动词 表示人或事物的动作、行为、发展、变化。 1、有的动词表示一般的动作,如来、去、说、走、跑、吼、叫、学习、起飞、审查、认识等。 2、有的动词表示心理活动,如想、重视、注重、尊敬、了解、相信、佩服、惦念等,这样的动词前面往往可以加上"很、十分"。 3、有的动词表示能够、愿意这些意思,叫做,它们是能、要、应、肯、敢、得(dei)、能够、应该、应当、愿意、可以、可能、必须,这些能愿动词常常用在一般的动词前面,如得去、能够做、可以考虑、愿意学习、应该说明、可能发展等 4、还有一些动词表示趋向,叫做趋向动词,如来、去、上、下、进、出、上来、上去、下来、下去、过来、过去、起,它们往往用在一般动词后面表示趋向,如跳起来、走下去、抬. 5、"是、有"也是动词,跟动词的用法一样,“是”也成为判断动词。 三.形容词 表示事物的形状、性质、颜色、状态等,如多、少、高、矮、胖、瘦、死板、奢侈、胆小、丑恶、美丽、红色…… 状态形容词通红、雪白、红通通、黑不溜秋等前面不能加“很”。 四.数词 是表示事物数目的词。如一、二、两、三、七、十、百、千、万、亿、半……五.量词 量词是表示事物或动作单位的词。汉语的量词分为名量词和动量词。 1、名量词表示事物的数量,又可以分为单位量词和度量量词。 单位量词表示事物的单位,如个、张、、只、支、本、台、架、辆、颗、株、头、间、把、扇等; 度量量词表示事物的度量,如寸、尺、丈、斤、两、吨、升、斗、加仑、、欧姆、立方米等。 2、动量词表示动作的数量,用在动词前后表示动作的单位,如次、下、回、趟、场… 六.代词 能代替实词和。表示指称时,有定指和不定指的区别。不定指往往是指不确定的人、物或某种性状、数量、程度、动作等。他不常指某一定的人物,也就不可能有一定意义,介乎虚实之间。 1、:代替人或事物的名称。如我、你、您、他、她、它、我们、你们、他们、她们、它们、咱们、自己、别人、大家、大伙……(自己能和其他代词连用,起强调作用。例如:我自己、你们自己、大家自己等)

《现代汉语词典》第7版修订的变化

《现代汉语词典》第7版修订的变化 《现代汉语词典》自1978年正式出版以来做过多次修订,以适应社会的发展,更好地反映现代汉语词汇新面貌,体现有关学科研究的新成果,落实国家有关语言文字方面的新规范。 本次修订,主要内容为:全面落实2013年6月由国务院公布的《通用规范汉字表》;增收近几年涌现的新词语400多条,增补新义近100项,删除少量陈旧和见词明义的词语;根据读者和专家意见对700多条词语的释义、举例等做了修订。

重要字音总结 未变化: “血”还是原来的读法,没有改变; “下载”的“载”还是读去声(四声); “纪”在做姓氏的时候还是读上声(三声); “粳米”的“粳”还是统读为jīng; 连累lěi、累lěi及、硕果累léi累léi读音也不变;

应yīng届、应yīng名儿、应yīng许也不变; 血晕yùn、晕yùn车也不变; “心宽体胖”读音也不变,不读pàng; 除“作坊”读zuō外,其余都读zuò不变,包括“作死”、“作揖”、“作弄”; 已变化: 说服,改念shuō服; 芥统读jiè,不读gài了; “荫”不统读yìn了,“林荫道”读yīn,“福荫”读yìn; 大dài黄,改“大dà黄”; 拜,增加“bái”音,用于“拜拜”; 的,增加“dī”音,用于“打的”; 螫统读shì(但字后同时注有zhē)。 另外,“六”也只有liù一个读音,因此地名“六安”按规范应读作liù安,不读lù;“宁”做姓氏时读阳平(二声),区别姓氏“甯”,去声(四声)。 从总结来看,《现代汉语词典》第7版其实这次修订的变化并不多,删改还是比较谨慎的,基本是增加了400多个新词及100多项新义等等,但目前官方并未给出到底增补了哪些内容。

《现代汉语词典》第六版中的改动

《现代汉语词典》第六版中的改动 第6版《现代汉语词典》于2012年6月面世,7月15日在北京首发。与2005年的第5版相比,第6版主要有以下变化: 新版词典共收单字1万3千多个,收录条目增加至6万9千多条,增收新词语近3000条,修订规模空前,其中既不乏“雷人”、“给力”等网络热词,也有ECFA(海峡两岸经济合作框架协议)、PM2.5(在空中飘浮的直径小于2.5微米的可吸入颗粒物)等外来词。 《现代汉语词典》第6版的变化(字形) 【鬼哭狼嚎】(鬼哭狼嗥)【神采奕奕】(神彩奕奕)【五彩缤纷】(五采缤纷) 【再接再厉】(再接再砺)【指手画脚】(指手划脚)【文身】【纹身】通用了。 【矇眬】已不收录。只留【曚昽】【朦胧】【蒙眬】【录像】(录象、录相)(“摄像”仍仅此一种写法。) 【百废俱兴】第六版中取消“百废具兴”。 【斫轮老手】第6版中取消“斲轮老手”。 【百废俱兴】取消括号形式的“百废具兴”写法。 【以偏概全】第5版“赅”字条下的组词有“以偏赅全”,第6版“赅”字条下的组词删去“以偏赅全”,另在第1538页列有“以偏概全”词条,且有解释。 【起航、启航】第5版只有“起航”一词,第6版增加“启航”一词,但意思不同。启航:(轮船、飞机等)第一次航行。起航:(轮船、飞机等)开始航行。如:天气恶劣,不能起航。 【知书达理、知书达礼】第5版只有“知书达理”一词,第6版增加“知书达礼”(也说知书识礼)一词,但意思有差别。知书达理:有知识,通事理。指人有文化教养。知书达礼:有知识,懂礼貌。也说知书识礼。 【执著、执着】第5版“执著”为常用词,“执着”为非常用词;第6版“执着”为常用词,“执著”为非常用词。 【莫名其妙、莫明奇妙】:第5版中二者是一个词的两种写法,第6版中二者是两个意义不同的词。第5版解释如下:莫名其妙:没有人能说明它的奥妙(道理),表示事情很奇怪,使人不明白。也作莫明奇妙。第6版解释如下: 莫名其妙:没有人能说明它的奥妙(道理),表示事情很奇怪,使人不明白。 莫明其妙:没有人明白它的奥妙(道理)。 注意:“莫明奇妙”由“莫名其妙”衍化而来,但二者含义略有不同:“名”义为说明,“明”义为理解。 《现代汉语词典》第6版的变化(字义) (一)扩大局部意义的成语 【急风暴雨】急剧而猛烈的风雨,多用来比喻声势浩大的革命运动或激烈的斗争。 【居高临下】处在高处,俯视下面。形容处于有利的地位或傲视他人。 【绠短汲深】比喻能力薄弱,任务重大,难以胜任(多用作谦辞)。 【七窍生烟】形容气愤、焦急或干渴之极,好像耳目口鼻都冒火。 【石破天惊】形容事情或文章议论新奇惊人。 【行云流水】漂浮的云,流动的水,形容诗文、书画、歌唱等自然流畅。 【百废俱兴】各种被废置的或该办未办的事业都兴办起来。 【投桃报李】泛指相互赠答,友好往来。 【无可厚非】不可过分指摘,表示虽有缺点,但是可以理解或原谅。 【吴牛喘月】比喻疑心遇到不利的情况而害怕。 【对簿公堂】第5版只有“对簿”词条,解释为“受审问”,第6版删“对簿”,增“对簿公堂”,解释为:动词,在官府公堂上受审问,后来指在法庭上对质或上法庭打官司(相对成语词典新补充的)。 【置若罔闻】放在一边儿不管,好像没听见一样,形容不重视,不关心。 【道高一尺,魔高一丈】第6版释义如下:原为佛家告诫修行的人警惕外界诱惑的话,意思是修行到一定阶段,就会有魔障干扰破坏而可能前功尽弃。后用来比喻取得一定成就后遇到的障碍会更大,也比喻正义终将战胜邪恶。也说魔高一尺,道高一丈(新补充的)。

关于现代汉语词语的语法功能分类

关于现代汉语词语的语法功能分类 俞士汶 北京大学计算语言学研究所 1.信息处理用现代汉语词语分类体系 在朱德熙先生的语法理论的指导下,北大计算语言学研究所与中文系合作,经过几年的研究,提出了一个服务于语言信息处理的现代汉语词语分类体系,并将数以万计的词语实际进行了归类,与此同时还按类详细描述了每个词语的多种语法属性,初步建成了“现代汉语语法电子词典”,另外对数十万字的语料进行了切分和词性标注。这就又进一步检验了词类划分的科学性与可操作性。这到如此规模和如此浓度的汉语语言工程实践可能是罕见的。 本文介绍现代汉语词语分类体系、分类的理论基础,并以若干词类例详细介绍具体的划类准则。 现代汉语的词分以下18个基本词类,括号中的拉丁字母是各个词类的代码。 名词(n),时间词(t),处所词(s),方位词(f),数词(m),量词(q),区别词(b),代词(r),动词(v),形容词(a),状态词(z),副词(d),介词(p),连词(c),助词(u),语气词(y),拟声词(o),叹词(e)。 这些基本词类可以合并为较大的词类。名词、时间词、处所词、方位词、数词、量词统称为体词,动词、形容词、状态词统称为谓词。有一部分代词属于体词,另一部分代词属于谓词。体词、谓词、区别词和副词又合称为实词。介词、连词、助词、语气词合称虚词。实词与虚词是汉语两大词类。此外还有拟声词与叹词,它们游离于这两大词类之外。 自然语言处理的常规技术要求庆自然语言处理系统中配备一部电子词典。对于计算机来说,可以认为作为电子词典的登录项的语言单位是“词”。基本中大部分肯定是语言学家认同的词,这也就是暗示了其中一部分不能看作“词”。从计算机处理实际文本的需要出发,从提高计算机处理效率的角度考虑,词典中另外包含了以下7类语言成分: 前接成分(h):阿,老,非,超,单 后接成分(k):儿,子,性,员,器 语素字(g):民,衣,失,遥,郝 非语素字(x):鸳,批,蚣 成语(i):接部就班,八拜之交 习用语(l):总而言之,由此可见 简称略语(j):三好,全总 前4类是比“词”更小的单位,不成词。这些成分的数量是有限的,只要电子词典的规模允许,应当尽可能地将这些成分全部收入。后3类是比“词”更大的单位,词典中只能收一部分使用频率高的。本文将电子词典中登录的各种语言万分笼统地叫做“词语”。

计算所汉语词性标记集ICTPOS3.0

计算所汉语词性标记集 Version 3.0 制订人:刘群张华平张浩 0.说明 计算所汉语词性标记集主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1.北大《人民日报》语料库词性标记集; 2.北大2002新版词性标记集(草稿); 3.清华大学汉语树库词性标记集; 4.教育部语用所词性标记集(国家推荐标准草案2002版); 5.美国宾州大学中文树库(ChinesePennTreeBank)词性标记集; 由于计算所的汉语词法分析器主要采用北大《人民日报》语料库进行参数训练,因此本词性标记集主要以北大《人民日报》语料库的词性标记集为蓝本,并参考了北大《汉语语法信息词典》中给出的汉语词的语法信息。 本标记集在制定过程中主要考虑了以下几方面的因素: 1.有助于提高汉语词法分析器的切分和标注正确率; 2.有助于提高汉语句法分析器的正确率; 3.有助于汉英机器翻译系统进行翻译; 4.易于从北大《人民日报》语料库词性标记集进行转换; 5.对于语法功能不同的词,在不造成词法分析和句法分析歧义区分困难的情况下, 尽可能细分子类。 基于以上考虑,我们在标注过程中尽量避免那些容易出错的词性标记,而采用那些不容易出错、而对提高汉语词法句法分析正确率有明显作用的标记。例如,在动词的子类中,我们参考了宾州大学中文树库的做法,把汉语动词“是”和“有”分别做成单独的标记,而没有采用“系动词”的标记。因为同样是“是”这个动词,其句法功能很多,作“系动词”只是其中一种功能,而要区分这些功能是非常困难的,会导致词法分析的正确率下降。 在名词子类中,我们区分了“汉语人名”、“日语人名”和“翻译人名”,这不仅仅是因为这三种人名要采用不同的参数进行训练与识别,而且在汉英机器翻译中也要采用不同的分析算法进行翻译。又如,我们把表示时间的“数词+‘年’”(如“1995年”)合并成一个时间词,而表示年头的“数词+‘年’”分别标注为“数词”和“量词”,这是因为我们通过实验发现这种区分在词法分析阶段通过统计方法可以达到较高的正确率,而且这种区分对于后续的句法分析和机器翻译有非常重要的作用。 对于某些词类(助词和标点符号),基本上是一个封闭集,而这些词类中各个词的语法功能相差很大,在这种情况下,我们尽可能地细分其子类。 另外,与其他词性标记集类似,在我们的标记体系中,小类只是大类中一些有必要区分的一些特例,但小类的划分不满足完备性。

现代汉语词性专题训练答案

现代汉语词性专题训练、答案. 现代汉语词性专题练习 一、选择题 1.能带宾语的是()。A名词B动词C形容词D副词 2.“上来”是()A助动词B判断动词C趋向动词D及物动词

3.“不、没”都是()A程度副词B时间副词C范围副词D否定副词 4.“很、挺、十分”是()A程度副词B范围副词C语气副词D情态副词 5.“我、你、他”是()A指示代词B疑问代词C人称代词D名词 6.“他在黑板上写字”的“在”是()A动词B副词C介词D方位词 D助词7.“哎哟”是()A拟声词B语气词C叹词 8.代词包括()A人称代词B指示代词C疑问代词ED代名词代动词 C连词B副词9.虚词包括()D助词E语气词A介词 10.“报告”一词兼()A名词BE动词C形容词D连词 代词D副词11.“和、跟、同、与”兼()A动词B连词C介词 助词E12.下列语句中的“在”不属于介词的是() A我在家B他在黑板上写字C把东西放在桌子上 D他在看书 E 在家要孝顺父母

13.下列句子中不属于介词“跟”的有()。 A我跟他一起去的B你跟他要C谁跟谁都没关系 E你快跟着我走你抽空跟他谈谈D二、指出下列词的词性: 非常()这里()前后()小()哪里()终于()已经()不()赋予()轰隆()得()大()忽然()简直()才()半夜()除了()很多()勇敢()思想()啊()或许()只好()二万()迅速()进来()仅仅()立刻()热爱()十几棵()喜欢()大约()次()哗啦()下去()斟酌()怎样()起来()晚上()亩()前面()或者()对于()跟()是()三百()美丽()叮当()夏天()鲁迅()我们()批评()的()吧()平坦()有()变化()十分()自己()聪明()从()专家()扩大()缓慢()应该()按照()回来()喂()马上()消失()飞机()许多()简直() 三、.指出下列句子中加标记词所属的词类。 )((渐渐))天渐渐冷起来了。2()((过))这件事已经讨论过了。1(. ))(4)自行车他骑出去了。(出去)((3)他正在教室里看书。(正)( )6)()你吃了饭再走。(了)((5)我拿着—本书。(着)( )(8)你应该努力学外语。(努力)((7)他是外国人吗?(吗)())10)最好听的是这首歌。(最)((刚才)(9)他刚才来过。()()12)这是一本袖珍词典。(袖珍)((11)房子上面铺着瓦。(上面)()

《现代汉语词典》第6版变化(整理版)

《现代汉语词典》第6版(与第5版比较)变化(整理版) 一、字音变化 。 【拜拜】第5 版注音bài bài ,第6版注音báibái 【的士】的“的”,第5 版注音dí,第6版注音dī。 【戛纳】“戛”第5版中只有一个读音jiá,第6版增加ɡā,“戛纳”读音gānà  【啫】【啫喱】第5版未收条,第6版收条,“啫”注音为zhě,“啫喱”注音为zhě?lí 【粿】第5版未收条,第6版收条,“粿”注音为guǒ。 ·lei ·lěi,第6版注音lián 【连累】第5版注音lián 【妥当】第5版注音tuǒ dang,第6版注音tuǒ dàng 【标识】第5版注音biāozhì (“标志”的异形词)和 (“标志”的异形词),第6版则有biāozhì (独立词条,有两个义项:①标示识别,②用来识别的记号。) biāoshí 【神父】第5版注音shén fu,第6版注音sh?n fù 【枇杷】第5版注音pí?pá,第6版注音pí?pɑ 【琵琶】第5版注音pí?pá,第6版注音pí?pɑ 【正经】第5版注音zhèng jing,第6版注音zhèng jing(口语中也读zhèng jǐng) 【一本正经】第5版注音yīběnzhangjīng,第6版注音yīběn—zh a ngjīng(口语中也读yīběn —zh a ngjǐng),成语分词连写,中间加短横。 ,第6版注音yī huì r (口语中也读yī huǐ r)。 【一会儿】第5版注音yī huì r ) (口语中也读èr liū zi ,第6版注音èr liú zi 【二流子】第5版注音èr liú zi 【主意】第5版注音zhǔ?yi,第6版注音zhǔ?yi(口语中也读zhú?yi) 【好好】第5版注音hǎo hāo r,第6版注音hǎo hǎo(口语中多儿化,读hǎo hāo r)。 【早早】第5版词条“早早儿”,注音为zǎozāor。第6版将“早早儿”更换为“早早”,注音 为“zǎozǎo(口语中多儿化,读zǎozāor)”。 注意:根据音变规律,单音节形容词重叠儿化(aa儿)时,后面的a往往变读阴平。词 典注音一般不注变调。《凡例》中指出,abb式形容词注音,一种情况是:bb注本调,在注音 后面的括号内注明口语中变读阴平,如【热腾腾】r a t?ng t?ng(口语中也读r a tēng tēng)。【跂】第5版注音qì,第6版注音qǐ 【倩】第5版收有两个“倩”,都读qiàn,“倩1”意为“美丽”,“倩2”意为“请”。第6版仍 收两个“倩”,但读音不同,“美丽”义仍读qiàn,“请”义改读qìng。 【柷】第5版只有一个读音chù,古代乐器。第6版改为两个读音:一音chù,用于人名,李 柷,唐哀帝;二音zhù,古代乐器。 (旧读dān sì hú jiāng )。 ,第6版注音dān shí hú jiāng 【箪食壶浆】第5版注音dān sì hú jiāng ,第6版注音wéi wéi nuò nuò  (旧读wěi wěi n uò nuò)。【唯唯诺诺】第5版注音wěi wěi nuò nuò 【虎不拉】第5版注音hù?b u lǎ,指伯劳鸟,第6版删“虎不拉”,“虎”只有一个读音hǔ。 【猫腰】第5版注音máo yāo,第6版“猫”只有一个读音māo,“猫腰”māo yāo,增加< 方>标记表示方言词,删“毛腰”。 【屎壳郎】第5版注音shǐ?ke làng,第6版注音shǐ?ke láng(口语里多读shǐ?ke làng)”。

现代汉语词性及专题训练答案汇编

学习-----好资料 现代汉语词性 一.名词 表示人和事物的名称叫名词。如:黄瓜、猪、羊、白菜、拖拉机、计算机。 1、表示专用名称的叫做专用名词,如云南、上海、李白、白居易,中国。 2、表示抽象事物的名称的叫做抽象名词,如范畴、思想、质量、品德、品质、友谊、方法。 3、表示方位的叫做方位名词,如上、下、左、右、前、后、中、东、西、南、北、前面、后边、东边、南面、中间等。 二.动词 动词表示人或事物的动作、行为、发展、变化。 1、有的动词表示一般的动作,如来、去、说、走、跑、吼、叫、学习、起飞、审查、认识等。 2、有的动词表示心理活动,如想、重视、注重、尊敬、了解、相信、佩服、惦念等,这样的动词前面往往可以加上很、十分。 3、有的动词表示能够、愿意这些意思,叫做能愿动词,它们是能、要、应、肯、敢、得(dei)、能够、应该、应当、愿意、可以、可能、必须,这些能愿动词常常用在一般的动词前面,如得去、能够做、可以考虑、愿意学习、应该说明、可能发展等 4、还有一些动词表示趋向,叫做趋向动词,如来、去、上、下、进、出、上来、上去、下来、下去、过来、过去、起,它们往往用在一般动词后面表示趋向,如跳起来、走下去、抬. 5、是、有也是动词,跟动词的用法一样,“是”也成为判断动词。 三.形容词 形容词表示事物的形状、性质、颜色、状态等,如多、少、高、矮、胖、瘦、死板、奢侈、胆小、丑恶、美丽、红色…… 状态形容词通红、雪白、红通通、黑不溜秋等前面不能加“很”。 四.数词 数词是表示事物数目的词。如一、二、两、三、七、十、百、千、万、亿、半…… 五.量词 量词是表示事物或动作单位的词。汉语的量词分为名量词和动量词。 1、名量词表示事物的数量,又可以分为单位量词和度量量词。 单位量词表示事物的单位,如个、张、、只、支、本、台、架、辆、颗、株、头、间、把、扇等; 度量量词表示事物的度量,如寸、尺、丈、斤、两、吨、升、斗、加仑、伏特、欧姆、立方米等。 2、动量词表示动作的数量,用在动词前后表示动作的单位,如次、下、回、趟、场… 六.代词 代词能代替实词和短语。表示指称时,有定指和不定指的区别。不定指往往是指不确定的人、物或某种性状、数量、程度、动作等。他不常指某一定的人物,也就不可能有一定意义,介乎虚实之间。 1、人称代词:代替人或事物的名称。如我、你、您、他、她、它、我们、你们、他们、她们、它们、咱们、自己、别人、大家、大伙……(自己能和其他代词连用,起强调作用。例如:我自己、你们自己、大家自己等) 2、疑问代词:用来提出问题。如谁、什么、哪(问人或事物)、哪儿、那里(问处所)、几 多(问数量)、多、多么(问程度)、怎么、怎样、怎么样(问性质状态)、什么、怎样、什么样

现代汉语词典

引言 《现代汉语词典》(下简称《现汉》)是人们日常生活中最常使用的一部工具书,具有极广的流传面和极高的权威性。它所收纳的词条在很大程度上反映着现代汉语的词汇构成与概貌。但是,词汇是语言系统中最为灵活的一个部分,它活跃于社会的各个领域和层面,总是处于不断的发展之中。作为一部收词具有全面性、选择性,编纂具有规范性的语文性辞典,《现汉》在规范词汇的同时,必须呈现出不断的变化,与时代和环境相契合,引导人们正确地认识和使用语言文字。音译外来词作为其中一大板块,对整部词典有着不可或缺的重要意义,随着时代的发展,与西方民族接触的增多,“从20世纪80年代开始,汉语借用外来词呈现出新趋势”。①《现汉》作为目前影响最大的、读者覆盖面最广的、享有最高声誉的中型汉语语文词典,它在收录音译外来词方面的规范性、实用性和时代性不容置疑。尽管外来词问题早已受到学术界的重视,迄今也有了不少高质量的研究成果,比较重要的论文有刘中富先生的《关于<现代汉语词典>收释外来词的几个问题》和许建中先生的《<现代汉语词典>中的音译外来词》,以及孙国秀的《05版<现代汉语词典>与02版<现代汉语词典>外来词对比分析》,针对5版的音译外来词问题的论著并不多见。 但是,对5版《现汉》中的音译外来词的研究,有利于加强和促进现代汉语音译外来词的规范化,进一步了解其收释外来词的基本原则,肯定成绩,找出不足,使其在收释音译外来词方面更加趋于完善。为此我们对比了《现汉》第5版(下简称5版)与第4版(指《现汉》2002年增补版,下简称4版),以计量的方式从词条、释义、词源的增删和修改的角度探讨了《现汉》在音译外来词方面的修订所取得的成绩和存在的不足。 本文研究的区域是《现汉》的第4、第5两个版本的A—Z部,“音译的外来语一般附注外文,如:【沙发】…[英sofa];【蒙太奇】…[法montage]。“英、法”等字,表示语别。【鶆】…[新拉Rhea],“新拉”表示是新拉丁文。从我国少数民族来的词只附注民族名称,如【萨其马】条附注[满]”。 ②本文所分析统计的外来词为词典中有标记的,即词条末附注语源的词条,得出的计量结果:5版共增加词条35个,删减词条25个,修改词条136个,另外还有“爱克斯射线”、“白金汉宫”、“贝塔粒子”、“伽马射线”、“互联网”、“来复枪”、“米制”、“拍档”、“檀越”等9个词条在4版中未标注语源,但在5版中进行了标注,以及“分贝”和“胲”两个词条在4版中标注了语源,但在5版中未进行标注。 一﹑词条的增减 ①韩淑红、吴远庆:《现代汉语词典》一、五版外来词语源对比考察[J].语文学刊.2008,第1期,第104页。 ②《现代汉语词典》[M].北京:商务印书馆,2005,凡例第6页。

相关文档
最新文档