中文简繁转换完全手则

中文简繁转换完全手则
中文简繁转换完全手则

中文简繁转换完全手则

2006《计算机应用》

乱码完美解决方案一在控制面版里面的语言和区域选项中的高级标签下设

置为台湾再重启就可以完美显示了.

依稀还记得很多年前的一些老玩家文章,写到他们初识电脑的时候为了能

玩一个游戏,拼命地学习DOS指令,讨论如何更好地分配仅有的640KB内存。

那个时候使用电脑,即便只是玩游戏,都须要懂很多专业知识。随着Windows 95的出现,安装和启动游戏的过程被不断简化,很多时候,游戏已经被浓缩成

一个个快捷方式,只要用鼠标双击就可以让玩家在其中畅游。要想在Windows

操作系统中更好地玩游戏,似乎只须要使用强大的硬件配备和合理的驱动程序

这么简单,虽然这就是微软最终的目的,但是现在游戏中仍然还没有完全解决

各种中文编码自动转换的问题。编码作为各种计算机应用软件最基本的组成部分,不但游戏须要编码的支持,各种网页,软件,同样需要编码的支持,凡是

我们能够看到的文字,只要不是图片形式存在的,那么理论上它都须要编码。

那么汉字编码是什么?是什么原因使得编码成为乱码,妨碍我们正常游戏、浏览网页和交流?

一、如何在游戏中正常显示繁体笔者这样的游戏玩家,虽不敢称为老鸟,

但是绝对不局限于简体版或者英文版的游戏,一般来说韩国、日本和繁体版的

游戏,只要好玩的都不会错过(当然时间长了也能看懂一些常用的日文和韩文字词),所以尽可能让系统显示游戏中的每个文字,而不是去容忍乱码。在Windows 2000诞生以前,解决乱码的主要方法是外挂一些转码程序,比如南极星,这些软件会控制Windows的GUI输出,在显存中进行转码。当然这些软件

也可以转换任何表现形式的不同编码,比如Web页面、邮件和各种文本文件等。

在基于NT技术的Windows 2000诞生之后,包括XP和2003在内的系统都

不能使用控制GUI输出的原理转码,加上不少程序开始跳过ExtTextOut、TextOut函数,所以单纯的外挂转码工具的应用效果都不尽如人意。以这些监

控原理为思路的软件虽然能解决部分的问题,但是兼容性和泛用性上都很不好,

当然最开始Windows 2000和XP的玩家还是用上了一款名为"化繁为简"的软件

解决了很多热门游戏的乱码问题。

软件名称:化繁为简

软件版本:2.13

授权方式:共享软件

软件大小:304KB 1.化繁为简(应该就是W2kXpCJK.exe吧?)《化繁为简》

的作者dayisi于2002年6月在深圳开发了这个软件,最开始他的目的很简单-为了让玩家在玩繁体或者日文游戏时不用在控制面板里变更区域设置。这个软

件随后在玩家中广为流传,而作者也因为这个原因在接下来的近一年时间中不

断地完善这款软件。笔者手中保留着一个2.13版的《化繁为简》,它的界面已经被优化得相当简单,玩家需要先根据游戏的语言环境选择一个字体,比如

Big5内码的繁体中文游戏,字体应该选择为PMingLiu,内码选择

chinese_big5;如果是shift_JIS内码的日文则选择Ms Mincho字体,内码选

择为日文。随后浏览选择游戏执行文件所在路径,最后进行区域模拟进入游戏。《化繁为简2.0》版后支持在显示过程中将繁体字显示为简体字功能,同时可

以使用动态挂接方式将正在执行的游戏转码。

2.区域设置Windows 2000开始所提倡的真正多语言支持体现在对Unicode

的支持和自由设定所在区域两项,但是这个优势在双字节版本的系统中都不易用,部分乱码的情况始终存在。用户普遍认为只是英文系统可以很方便的切换,所以当时相当数量的玩家为了玩游戏不得不安装英文版的Windows 2000以求获得更好的编码支持,这实在是太麻烦了。

区域设置的原理实际上是硬性指定系统的编码,从实质上来讲,将区域设

置为中国香港特别行政区的简体中文版Windows 2000系统和一个繁体中文版的Windows 2000系统在处理字符的时候没有任何区别。所以在解决乱码问题时,

区域设置是最有效的方法。

在Windows 2000系统中,进入"控制面板"中的"区域选项",在"常规"选项卡下点击"设置默认值",此时在弹出的"选定系统区域设置"的下拉列表中选择

即可。

软件名称:AppLocale软件版本:1.3授权方式:免费软件软件大小:

908KB 3.MS AppLocale最终这个问题由微软发布的一款小软件解决,这款被称

为AppLocale,大小不足2MB的软件可以很方便地制定须要转码运行的程序,

并且为之创建启动快捷方式。只要做一些简单的设定,无论游戏还是软件,无

论是任何编码方式,都能方便转码。惟一的缺点是它只能安装在Windows XP以上的操作系统中。

安装AppLocale软件后,玩家须要首先设定想要AppLocale转码的游戏所

在位置,然后选择程序的应用语言,比如繁体或者日文,最后还可以为游戏生

成快捷方式。笔者认为AppLocale的原理和《化繁为简》比较类似,当然微软

自己的转码软件在兼容性上要强过第三方软件,所以在AppLocale流行开之后,《化繁为简》逐步被玩家们忘记。

二、如何在游戏中正常输入繁体在单机游戏的时代,只须要转码基本上就

可以应付所有问题,除了日本光荣公司的《三国志》系列游戏的自定义武将名

字之外,很少有单机游戏需要玩家输入大量的文字。但是随着网络游戏的兴起,在网络游戏中交流就成了难事。

显而易见,参看本文第一部分内容,直接进行语言区域设置是解决问题的

最直接方案,比如繁体Big5下系统会给玩家相当多的繁体输入法选择,比如仓颉输入法,当然日文和韩文环境下同样也会有对应的输入法。如果熟悉这些输

入法的玩家就可以很容易的输入各种文字进行交流。对于完全不会这些输入法

的玩家,操作步骤就要繁琐一些,笔者总结出两种比较易用繁体中文输入方法。

首先大家须要理解到繁体字和Big5编码是两个不同的概念,比如""这三个字,事实上笔者前面两个都是以GBK编码输入,最后一个才是以Big5编码输入,如果在Big5编码环境看这三个字,它们会变成""这样的情况。因为Big5编码

并没有包括简体字,所以在Big5环境中有部分简体字会变成乱码。我们真正能用上的只是Big5编码的字,它一定是繁体的,而不是GBK环境下所能看到的繁体字。

软件名称:TextPro

软件版本:5.0

授权方式:免费软件

软件大小:400KB 1.二次转码

我们可以轻松地输入简体字,然后进行一次转码将简体字转换为繁体字,当然这只是GBK下能够看到的繁体字,接着进行二次转码,将繁体字的编码由GB2312转换成Big5。我们只须使用一个名为Textpro软件就可以完成这两个步骤。最后将乱码粘贴进游戏就可以正常显示。Textpro的使用非常简单,转码的按钮在软件最上方清晰的罗列在一起,依次使用这些功能便可以将Textpro 中显示的内容全部转码。软件名称:微软拼音输入法2003增强版

软件版本:Build 2524

授权方式:免费软件

软件大小:74.95MB 2.微软输入法2003只须要进行简单的设置,《微软输入法2003》可以以Unicode或者GBK的内码直接输入文字。而且输入法会自动根据环境内码自动转换文字内码,比如在GBK的环境下输入繁体字,那么这个时候会出现GBK编码的繁体字,而到Big5环境中输入繁体字,则会出现Big5内码的繁体字。同时还可以使用《微软输入法》或者《紫光输入法》的软件盘来输入少量的韩文或者日文文字,这里须要注意的是《紫光输入法》提供的繁体输入功能在某些繁体字的处理上会出错,比如"模拟"的"模"字,所以不推荐使用。

软件名称:汉字通KanjiWeb

软件版本:3.0

授权方式:共享软件

软件大小:1.8MB 3.汉字通KanjiWeb

相对《微软输入法2003》,《汉字通KanjiWeb》的功能更加强大,但是KanjiWeb在Windows 2000之后的操作系统上有一些兼容性问题,同时它所提

供的输入法也比较古老,所以KanjiWeb更适合在Windows 9x系列的操作系统

与其他输入法协同使用。KanjiWeb附有中、日文和广东音等多种输入法,在

BIG5、GB、SHIFT-JIIS码和EUC码下,都可以输入中文简体字、中文繁体字、

日本假名或日本汉字。除此之外KanjiWeb拥有HZ、GB、BIG5、JIS、Shift-JIS、EUC内码显示转换功能,同时提供一个"Multi-Code"程序能静态将文件转码。

软件名称:游戏拼音输入法

软件版本:1.0

授权方式:免费软件

软件大小:1MB 4.游戏拼音输入法

这是一个方便的多种编码输入法,以汉语拼音为基本输入形式,非常适合

国内玩家在繁体、日文等游戏中使用。不过这款输入法目前还不够完善,对于

一些繁体字的转码有问题,你有可能无论如何用这个输入法都输入不了某些字。

三、未来之路单纯从游戏方面来考虑,微软Windows图形和游戏负责人Lester在不久前接受Gamespot采访的时候谈到:"微软计划简化PC游戏运行

方式,将向游戏机游戏运行方式看齐,即'即插即运行',大大简化PC游戏安装和进行方式。"而有部分使用过Windows XP SP2的玩家则表示SP2似乎现在能

比较智能地转换字符编码,以前一些须要AppLocale加载的游戏和软件在SP2

上已经在启动的时候自行完成这个过程。

不过在游戏之外,这个进程似乎很缓慢。从技术上考虑,Unicode才是最

完美的解决方案,但是Unicode的推广并不容易,虽然Windows XP操作系统已经很好地集成了Unicode环境,但是为了延续性不得不兼容着其他编码形式。

而著名搜索引擎Google也率先在全站默认使用Unicode编码搜索,在网络上热透半边天的Blog系统,由于更多两岸三地网友交流的需要,也基本上采用了Unicode编码。

但是这还远远不够,目前各种转码的工具都有着各自的缺陷,比如

Textpro就可能在处理时忽略部分文字的转码,还有单纯的1对1的文字转换

也不代表能转换阅读习惯,比如"鼠标"和"滑鼠"的区别。如果没有智能化的,

能够方便处理目前已有编码文字资料的数字解决方案,则庞大而优秀的

Unicode编码也不能在短期内解决须要转码的繁琐问题。

游戏之外的编码应用案例只是简单地在游戏中解决乱码问题和输入其他编

码的文字这两件事看似简单,其实包括相当多知识和技巧。当然,会出现乱码

和须要输入其他编码的文字的情况绝对不会仅仅出现在游戏中。所以这些软件、输入法和技巧同样可以在碰到类似的问题时发挥作用。

1.浏览繁体站点,使用繁体站点搜索引擎

如果操作系统已经装有相应的字库,那么IE浏览器可以在访问繁体站点的时候自动切换到合适的编码模式。浏览自然容易解决,但要使用繁体站点搜索

引擎就须要利用前文所讲到的繁体字输入方法。对于Windows 98以前的操作系统,笔者推荐使用KanjiWeb,因为它对HZ编码的处理能力非常强。KanjiWeb

可以同屏显示BIG5、GB、HZ三种文字,而且可以将它们打印出来。比如一个论坛,可能第一帖是HZ编码,而回复的分别有BIG5和GB两种编码,则用KanjiWeb时不会看到任何乱码。同时它自带一个简单的字库,即便是英文操作

系统,它也可以正常显示各种编码的汉字。

在网络游戏中,或者实时聊天环境中,笔者认为《微软输入法2003》较为

方便,根据当前编码环境自动识别并输入文字的功能可以省却每次都须要转码

的烦恼。

如果须要输入大量的文字,用繁体输入法就比较麻烦,这个时候笔者推荐

以二次转码的方式来完成。首先用正常的简体环境输入内容,然后进行二次转码,最后将转码的结果张贴到浏览器中即可,这非常适合在繁体论坛拍砖。

小技巧:为Windows 98、2000系统安装更多的编码字库

当使用Windows 98、2000系统的IE浏览器访问繁体站点或者日文韩文站

点时,IE会提示安装新的编码字库,这个时候Windows98可以直接连接到微软

的官方网站下载字库并安装。对于Windows98的用户,如果无法正常访问微软

的网站,也可以选择下载繁体字库补丁直接安装。而Windows 2000的系统安装盘上都带有2000常用的字库,只须要插入安装盘,根据提示操作即可。Windows XP系统在默认安装的时候就带有标准的繁体、韩文和日文字库,用户

无须特别安装新的字库。

2.使用其他繁体软件虽然常用软件都是英文版或者中文版,但一些小工具

或者某些软件的最新版本出现的时候可能只有繁体版,其实这种情况就和一个

繁体版的游戏差不多,毕竟游戏也是软件的一种。这个时候可以先试试《化繁

为简》或者AppLocale来尝试简单的转码,绝大部分情况下都可以正常使用。

对于一些非常特殊的软件,如果须要转码的同时还输入繁体文字,则笔者推荐

直接将区域设置为中国香港特别行政区,然后使用《微软输入法2003》来完美

解决。

3.文件中的文字转换小规模的文字转换使用Textpro非常容易,但如果手

中有大量的Word文件或者文本文件须要转换则应该考虑其他方法。前文提到的KanjiWeb附带一个Multi-Code软件可以批量转换各种代码的文件。同时笔者

还推荐另外一款称为《搜易繁简通》的免费软件,它更可以对不限数量的多个

文件同时进行繁简转换,并且支持从资源管理器拖放文件到程序窗口。当然在

使用这些软件的时候都须要做好备份,尤其是Word文件的格式比较复杂,可能在转码过程中出现兼容性错误。对于部分无法正常转换的文档,用Textpro手

动处理也是解决方案之一,此外转换的过程中还应该特别注意GBK内码繁体字

和Big5内码繁体字的区别。

4.日常应用中解决乱码的要点(1)对于IE、Outlook等软件,解决显示乱码的基本办法是确认系统装有字库,同时已经为当前内容指定了正确的编码类型。须要注意多种字库的区别,比如HZ和GB2312虽然都是简体字库,但它们仍然

有一定区别。

(2)对于Windows 2000系统,须要运行非Unicode编码的软件时,解决乱

码的办法主要还是修改区域设置为编码文字所在区域,同时还须要将该编码设

置为默认文字编码。

(3)对于Windows XP系统,显然它更加适合作为个人工作、学习和娱乐的

平台,AppLocale软件很好地解决了乱码问题,并且使用简单。

(4)输入繁体中文最好的环境是区域设置为香港特别行政区的Windows XP

系统和《微软输入法2003》,而在XP系统下只须要安装AppLocale、《微软输入法2003》,则可以解决90%以上的繁体中文应用问题。显然作为操作系统的

重要组成部分,微软希望在系统中更好地集成这些功能,而不是使用第三方软件。

(5)可以转换Unicode编码的常用编辑器有Editplus和UltraEdit,而Windows XP系统的记事本(Notepad)也可以在保存的时候选择不同编码类型,

从而达到转换Unicode编码的效果。

(6)日文、韩文同样可能是导致乱码的原因,碰到乱码的时候不仅仅须要考虑Big5编码,还应该考虑HZ和其他语言。解决乱码的方法有很多,最好的办

法是根据操作系统和乱码的具体情况选择合适的方案。

知识了解:GB2312 GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集-基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆,新加坡等地也使用此编码。GB2312收录简化汉字及

符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。

GBK GBK是GB2312-80的扩展,是向上兼容的。它包含了20902个汉字,

其编码范围是0x8140-0xfefe,剔除高位0x80的字位。其所有字符都可以一对

一映射到Unicode2.0。

GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位不够,字形不足的问题。

Unicode Unicode于1992年6月通过DIS(Draf International Standard),目前最新版本V4.0于2004年公布。国际标准ISO/IEC 10646-1:2000(包含

CJK和CJK Extension A汉字27484),已于2000年10月5日正式出版,其内

容与工业标准Unicode3.0是完全等同的。而ISO/IEC 10646-2:2000(包含CJK Extension B汉字42711)已于2001年10月正式颁布。

BIG5 BIG5是我国台湾省的常用标准,编码汉字13061字,在Windows 2000诞生之前,俗称的繁体平台普遍采用此编码标准。

HZ码HZ是GB码的变体,只用每个字节的首7-bit作编码(即ANSI的首128个字符),常用于网络资料传送。

复杂的汉字编码是电脑发展历程中诸多标准从无到有,从混乱到统一的过程的映射,最开始流行于各个地区的标准肯定会在全球化应用的过程中带来诸多弊端。现在给中国玩家带来大麻烦的正是GB2312编码、HZ编码、BIG5编码三种编码,其中我国香港特别行政区以前流行的HZ编码已经逐步退出舞台,但是作为我国台湾省标准的BIG5编码至今还在部分地区广泛使用。很显然Unicode编码是"万码一家"的解决之道,但是要完成这个过程还需要相当长的时间。

"七"乐无穷,尽在新浪新版博客,快来体验啊~请点击进入~

特别声明:

1:资料来源于互联网,版权归属原作者

2:资料内容属于网络意见,与本账号立场无关

3:如有侵权,请告知,立即删除。

繁简字对照表

非对称繁简字对照表 2006年10月3日 12:04:01 发布:振之 此表来自网络,此表主要说明汉字繁简转换并不简单,包括word转换工具有时候也会出错,汉字中有些字在某些义项上繁简异形,存在简体转繁体的问题;而有些义项繁简同形,下列字加“○”以后的字的义项表示它的繁体在作该义项使用时与简化字同形,不变化。如老板的繁体是“老闆”,而木板的繁体还是“木板”,不能写成“木闆”。 沈如泉2010-11-7 以下文中,“○”表示字形无变化。 (一)同音兼并类(41组) 1 板bǎn闆①老板,私营工商业的财产所有者。○②其它义项:木~,门~,鼓~,~眼,死~,~结。 2 表biǎo錶①计时的器具:钟~、手~。○②其它义项:外~,~叔,发~,~述,~汗,~率,报~,水~。 3 才cái纔①副词:刚~,~不呢。○②名词:~能,英才。 4 丑chǒu醜①形容词:~陋,~态,出~。○②其它义项:~角,~时,子~寅卯。 5 出chū齣①量词:一~戏。○②动词:~门,~席,~众,~力,~人才,~气,~丑,~数,~纳。 6 淀diàn澱①沉淀:~粉。○②浅的湖泊:白洋~。 7 冬dōng鼕①象声词:丁~、~~响。○②冬季:寒~腊月。 8 范fàn範①其它义项:铁~,模~,~围,防~。○②姓:~仲淹。 9 丰fēng豐①其它义项:~富,~碑。○②美好的容貌和姿态:~采、~韵。 10 刮guā颳①风吹:~风。○②其它义项:~脸,~糨子,搜~。 11 后h?u後①其它义项:~门,前~,无~(子孙)。○②君主的妻子:皇~。

12 胡hú鬍①~须。○②其它义项:~人,~琴,~闹,~乱,~同。 13 回huí迴①曲折环绕:~旋。○②其它义项:~还,~头,~报,~禀,~绝,一~事,章~,~族。 14 伙huǒ夥①~计,团~,~同。注:表示多时不简化。○②~食,~房。 15 姜jiāng薑①草本植物:生~。○②姓:~子牙。 16 借jia藉①假托、凭借:~口,~题发挥。注:其它义项以及读jí时不简化。○②借进或借出:来~钱,不~给他。 17 克ka剋攻~,~食,~期。注:读kēi时不简化。○③~勤~俭,以柔~刚;千~。 18 困kùn睏①睡或想睡:~倦,~觉。○②其它义项:~苦,围~,~乏。 19 漓lí灕①~江。○②淋~。 20 里lǐ裏①表示跟“外”、“表”相对或处所意义:衬~,~边,~面,这~。○②其它义项:邻~,乡~,一~路。 21 帘lián簾①窗~、垂~听政。○②旗子状的标志:酒~。 22 霉 m?i ○虹雨~风,~变。黴~变,同“霉变”;~黑。 23 面miàn麵①食物、粉末义:~粉,粉笔~,~条,~糊。○②其它义项:脸~,~壁,表~,当~,平~,反~,下~,一~墙。 24 蔑mia衊①原指血污,比喻毁谤:污~、诬~。○②其它义项:~视,轻~,~以复加。 25 千qiān韆①秋~。○②其它义项:一~,~秋基业。 26 秋qiū鞦①~千。○②其它义项:~季,大~,多事之~,千~万代。 27 松sōng鬆①跟紧相对:~散,放~,~弛,手头~。/绒状或碎末状食品:肉~、鸡~。○②~树。 28 咸xián鹹①味道:~鱼、~菜。○②全、都:老少~宜。 29 向xiàng嚮①其它义项:面~,~暮,~前走。○②方~,偏~。

繁简切换注意事项

简体繁体相互转换注意事项 关于繁简转换,很多人习惯用电脑字体之间的繁简来转换。在很多时候,很多简体字不只有一个繁体字。这时候再转换,可能就会出错,这里附上部分繁简转换容易错的字以便参考,以下内容来自互联网: 几,象形。仅用作家具名称。这个意义也可以写作“机”。《书谱》“。。。书机。。。”。与“幾个”的“幾”不通用。机,作为家具名称时,与“機器”的“機”也不通用。 后,上古与王意义相近。如“后羿”意思即“王羿”。据说是个反“司”。与“前後”之“後”不通用。 饑,仅用于“饑荒”。与“饥饿”之“饥”不通用。 征,仅用于征讨,征伐。“徵”在征伐征讨等词语中与“征”不通用。而作为五音之一的“徵”(zhi)也不能写作“征”。“徵”可以用于徵收、应徵入伍。 逰,在“游泳”中与“游”不通用。其他的旅游、游玩中可以通用。 (另外,有几个字简繁汉时即通用,如:“无”与“橆”,“万”与“萬”。“万”用于复姓“万俟”时,好像与“萬”不通用。还有个特殊现象,即通假借用,如六朝时有“皇后”的“后”借用为“前後”的“後”,这个是特殊现象,以后另帖讨论。) 大家熟知的“司母戊方鼎”铭文“司母戊”,近来有说应读“后母戊”。可为“后”字参照。 “余”与“餘”也不通用。如作为“多出”的意思,“闰餘成嵗”不能写作“闰余成嵗”。作为第一人称“余”时,也不可写作“餘”。(顺便说一下,嵗,上面是从“止”,由于形近,也有讹为“山”的隶书楷书,也是可以的。但是写篆书就得回复本形“止”。有无知者如WENHUAISHA之流,按楷隶书的讹文反推为篆书,就是大错特错了。) “雲雾”也不可写作“云雾”。“子曰诗云”也不能写作“子曰诗雲”。 并非“反清复明”恢复繁体,而是在假设书法作品通是繁体情况下,列出较为规范的繁体写法。完全简体也可以。 “暴”,写作隶书楷书时,“暴怒”“暴晒”是无区别的。但是若是篆书,就是俩不同的字。不知道为何不能发图片了。暴晒,也可读PUSHAI。 “读”右半边,“卖”。楷书隶书无区别。篆书是俩不同的字。“读”右边是声旁。(这俩字打的是简化字) “极”“極”,也不通用。不过“极”古代极其少用,《说文》解释为“驴上负也。” “个”,“個”,古代不通用。“个”竹枝,一说半个“竹”。而“個”就是咱们通用的一个

简体繁体转换

简体繁体转换 // 网页简繁体转换 // 日期:2007年4月1日 // 作者:niker // 本js用于客户在网站页面选择繁体中文或简体中文显示,默认是正常显示,即简繁体同时显示 // 在用户第一次访问网页时,会自动检测客户端语言进行操作并提示.此功能可关闭 // 本程序只在UTF8编码下测试过,不保证其他编码有效 // -------------- 以下参数大部分可以更改-------------------- //s = simplified 简体中文t = traditional 繁体中文n = normal 正常显示 var zh_default = 'n'; //默认语言,请不要改变 var zh_choose = 'n'; //当前选择 var zh_expires = 7; //cookie过期天数 var zh_class = 'zh_click'; //链接的class名,id为class + s/t/n 之一 var zh_style_active = 'font-weight:bold; color:green;'; //当前选择的链接式样 var zh_style_inactive = 'color:blue;'; //非当前选择的链接式样 var zh_browserLang = ''; //浏览器语言 var zh_autoLang_t = true; //浏览器语言为繁体时自动进行操作 var zh_autoLang_s = false; //浏览器语言为简体时自动进行操作 var zh_autoLang_alert = true; //自动操作后是否显示提示消息 //自动操作后的提示消息 var zh_autoLang_msg = '歡迎來到本站,本站爲方便台灣香港的用戶n1.采用UTF-8國際編碼,用任何語言發帖都不用轉碼.n2.自動判斷繁體用戶,顯示繁體網頁n3.在網頁最上方有語言選擇,如果浏覽有問題時可以切換n4.本消息在cookie有效期內只顯示一次'; var zh_autoLang_checked = 0; //次检测浏览器次数,第一次写cookie为1,提示后为2,今后将不再提示 //判断浏览器语言的正则,ie为小写,ff为大写 var zh_langReg_t = /^zh-tw|zh-hk$/i; var zh_langReg_s = /^zh-cn$/i; //简体繁体对照字表,可以自行替换 var zh_s = '皑蔼碍爱翱袄奥坝罢摆败颁办绊帮绑镑谤剥饱宝报鲍辈贝钡狈备惫绷笔毕毙闭边编贬变辩辫鳖瘪濒滨宾摈饼拨钵铂驳卜补参蚕残惭惨灿苍舱仓沧厕侧册测层诧搀掺蝉馋谗缠铲产阐颤场尝长偿肠厂畅钞车彻尘陈衬撑称惩诚骋痴迟驰耻齿炽冲虫宠畴踌筹绸丑橱厨锄雏础储触处传疮闯创锤纯绰辞词赐聪葱囱从丛凑窜错达带贷担单郸掸胆惮诞弹当挡党荡档捣岛祷导盗灯邓敌涤递缔点垫电淀钓调迭谍叠钉顶锭订东动栋冻斗犊独读赌镀锻断缎兑队对吨顿钝夺鹅额讹恶饿儿尔饵贰发罚阀珐矾钒烦范贩饭访纺飞废费纷坟奋愤粪丰枫锋风疯冯缝讽凤肤辐抚辅

常见繁体字错误汇总

繁体电子书稿易错字举例(增扩版) 在鲍国强先生基础上增扩 简体字由繁体字演变而来。但有些在古代分别有不同义和形的繁体字却归并成同一个简体字,所以繁体字和简体字并不是简单的一一对应关系。把这些简体字转变为繁体字时很容易出错。在繁体字电子书稿中,这些字就更容易被疏忽了。其产生差错的原因:或由五笔字形输入(字形相近)有误,或是输入法字表选择有误(眼误、手误),或因简繁字自动转换不准确(该转的不转或不该转的转了),或缘于字义理解偏差(没查核准确),或校对不细(漏了过去)等。现据有关校对记录整理了若干组容易出错的字,分为笔画简化、形义合并、异体统一、形义近误和特殊情形五类,每类中按各组首字笔画为序略加说明和举例,供同行审校时参考。 一、笔画简化 1.厂厂 两字本无关联,因“厂”简化为“厂”,就与古时的“厂”(音hǎn,山崖边的石洞)相混。古时之“厂”亦读ān。古籍中“厂”照录即可,不能转为“厂”。如撰《恕堂诗》的(清)宫鸿厂、《晋石厂丛书》等。

2.历历历 “历”与“历”应注意区分。如“万历”、“弘历”、“时宪历”与“经历”、“历下”等的区别,应重点校对,如《永历纪事》、《历代帝王法帖释文考异》、《乙酉日历》、《历城县志》等。“历”是它们的简化字。 3.只只只只 “只”有两读:读zhī有“单独的、量词”的意思,其繁体为“只”,如“只言片语”、“只身”等;读zhǐ有“副词表示限于某个范围、仅有”的意思,其繁体为“只只”,如“只许”等。 4.饥饥饥 “饥”是“饿”的意思,如“充饥”、“如饥似渴”等;“饥”则指“谷物不熟”,如“饥荒”、“饥馑”等;现均简化为“饥”。 5.汇汇滙 着作方式和版本类型中一般用“汇”字,不用“滙”字。书名等处照录即可。“汇”是它们的简化字。 6.发发发 古时,“发fā”与“发fà”是两个字,“毛发”,“发”的繁体作“发”。 7.达达逹 “达”与“逹”:中间有三横是对的。“达”的繁体字

汉字繁简转换的对应关系

汉字繁简转换的对应关系 本文是关于汉字繁简转换的对应关系,感谢您的阅读! 汉字繁简转换的对应关系中国大陆地区从60年代开始全面使用简化字,而台港澳地区以及其他华人华语社区依然使用繁体字。此外,在古籍出版、古汉语教学研究以及某些对外交往中,仍然使用繁体字。汉语繁简并存这一客观情况,对汉字的繁简文本转换提出了要求。在汉字繁简转换的过程中,有一些问题不容回避,有一些难题需要解决。 由于不能正确进行汉字繁简转换,曾经造成许多汉字使用的混乱和错误。下面是从简体字转换为繁体字时经常会出现的错误:以上错误既可能在手工转写、转排时出现,也可能在计算机繁简字体自动转换时出现。造成这种错误的原因大致有三个:一是不了解汉字发展演变过程中因音义不同而造成的字型分化;二是把古已有之、同时并存的两个汉字误以为是简单的繁简对应关系;三是计算机依据单字一对一原则进行汉字繁简自动转换,造成对汉字繁简的简单化处理。事实上,繁体字和简体字之间并非简单的一一对应关系,而是既有“一对一”的情况,又有“多合一”的情况。 其中,“一对一”的情况有两种: 一是繁简同形,无字形变化,即:A→A。如:中→中 “多合一”的情况也分两种: 一是几个繁体汉字简化后合为另外一个笔画数有所减少的新造字,即:

A1→AA2→AAn→A 二是几个繁体字简化后合为其中之一,不再另造新字,即: A→AA1→AA2→AAn→A 又如:后(皇后)→后後(先後)→后 “一对一”的情况中,第一种(A→A)繁简同形,不存在转换的问题。第二种(A1→A)繁简完全一一对应,转换也不成问题。 “多合一”的情况比较复杂,繁简转换中往往产生错误。下面是以国家语委1988年制定的《现代汉语通用字表》为依据,对表中7000个汉字中涉及到繁简转换“多合一”情况的汉字进行的整理和归类。 一A1→AA2→AAn→A 4.匯(匯合)→汇彙(詞彙)→汇5.獲(捕獲)→获穫(收穫)→获 6.儘(儘管)→尽盡(盡力)→尽 7.歷(經歷)→历曆(日曆)→历 8.簽(簽名)→签籤(求籤)→签 9.縴(qiàn縴夫)→纤纖(xiān纖細)→纤 10.壇(文壇)→坛罎(酒罎)→坛 11.團(團結)→团糰(湯糰)→团 12.須(必須)→须鬚(鬍鬚)→须 13.髒(骯髒)→脏臟(内臟)→脏 14.隻(zhī隻身,一隻鳥)→只祗(祗能)→只 15.鐘(鐘錶)→钟鍾(鍾情)→钟

繁体字转换表

繁体字转换表 A 皑(皚)嗳(噯) 蔼(藹) 霭(靄) 爱(愛) 暧(曖) 碍(礙)谙(諳) 鹌(鵪) 暗(闇)肮(骯)袄(襖) 鳌(鼇)袄(襖) B 坝(壩)罢(罷)摆(擺) 败(敗) 颁(頒) 板(闆)办(辦)绊(絆)帮(幫) 绑(綁) 谤(謗) 镑(鎊) 龅(齙) 饱(飽) 宝(寶)鸨(鴇) 报(報) 鲍(鮑) 贝(貝) 狈(狽) 备(備) 辈(輩) 惫(憊) 呗(唄) 绷(繃)笔(筆)币(幣)毕(畢) 闭(閉) 毙(斃) 边(邊) 编(編) 贬(貶) 变(變、変) 辩(辯) 辫(辮)标(標) 镖(鏢) 表(錶) 别(彆) 鳖(鱉) 瘪(癟)宾(賓)傧(儐) 滨(濱) 缤(繽) 槟(檳) 膑(臏) 摈(擯) 殡(殯) 鬓(鬢) 饼(餅) 拨(撥)饽(餑) 驳(駁) 铂(鉑) 卜(蔔) 补(補) 布(佈) C 才(纔) 财(財) 参(參) 残(殘) 蚕(蠶) 惭(慚) 惨(慘) 灿(燦) 仓(倉) 苍(蒼) 沧(滄) 舱(艙) 厕(廁) 侧(側) 测(測) 恻(惻) 层(層) 锸(鍤) 诧(詫) 钗(釵) 掺(摻) 搀(攙) 禅(禪) 蝉(蟬) 缠(纏) 谗(讒) 婵(嬋) 产(產) 铲(鏟) 阐(闡) 忏(懺) 颤(顫) 长(長) 肠(腸) 尝(嘗) 偿(償) 厂(廠) 场(場) 伥(倀) 畅(暢) 车(車) 彻(徹) 尘(塵) 陈(陳) 衬(襯) 称(稱) 蛏(蟶) 诚(誠) 惩(懲) 乘(乗) 撑(撐) 痴(癡) 驰(馳) 迟(遲) 齿(齒) 炽(熾) 冲(衝)

虫(蟲) 宠(寵) 绸(綢) 筹(籌) 踌(躊) 丑(醜) 出(齣) 刍(芻) 锄(鋤) 雏(雛) 础(礎) 储(儲) 处(處) 触(觸) 传(傳) 疮(瘡) 闯(闖) 创(創) 怆(愴) 锤(錘) 纯(純) 莼(蓴) 唇(脣) 鹑(鶉) 绰(綽) 辍(輟) 词(詞) 辞(辭) 赐(賜) 苁(蓯) 聪(聰) 冲(衝) 从(從) 丛(叢) 撺(攛) 蹿(躥) 窜(竄) 锉(銼) 错(錯) D 哒(噠) 达(達) 鞑(韃) 带(帶) 贷(貸) 担(擔) 单(単、單) 殚(殫) 掸(撣) 胆(膽) 惮(憚) 诞(誕) 当(當、噹) 裆(襠) 铛(鐺) 挡(擋) 党(黨) 荡(蕩) 档(檔) 导(導) 岛(島) 捣(搗) 祷(禱) 邓(鄧) 灯(燈) 籴(糴) 敌(敵) 涤(滌) 诋(詆) 谛(諦) 缔(締) 递(遞) 颠(顛) 巅(巔) 癫(癲) 点(點) 电(電) 垫(墊) 淀(澱) 钓(釣) 谍(諜) 钉(釘) 顶(頂) 订(訂) 冬(鼕) 东(東) 冻(凍) 栋(棟) 动(動) 斗(鬥) 窦(竇) 独(獨) 读(讀) 渎(瀆) 犊(犢) 牍(牘) 椟(櫝) 黩(黷) 笃(篤) 镀(鍍) 断(斷) 缎(緞) 锻(鍛) 队(隊) 对(對) 吨(噸) 钝(鈍) 顿(頓) 夺(奪) 铎(鐸) 堕(墮) (嶋) (闘) E 讹(訛) 鹅(鵝) 额(額) 轭(軛) 恶(惡、噁) 饿(餓) 谔(諤) 鳄(鱷) 儿(兒) 尔(爾) 迩(邇) 饵(餌) 贰(貳) F 发(發、髮) 罚(罰) 阀(閥) 矾(礬) 烦(煩) 贩(販) 饭(飯) 范(範) 访(訪) 纺(紡) 飞(飛) 诽(誹) 绯(緋) 废(廢) 费(費)

常见繁体字错误汇总(整理打印版)

. 繁体电子书稿易错字举例(增扩版) 在鲍国强先生基础上增扩 简体字由繁体字演变而来。但有些在古代分别有不同义和形的繁体字却归并成同一个简体字,所以繁体字和简体字并不是简单的一一对应关系。把这些简体字转变为繁体字时很容易出错。在繁体字电子书稿中,这些字就更容易被疏忽了。其产生差错的原因:或由五笔字形输入(字形相近)有误,或是输入法字表选择有误(眼误、手误),或因简繁字自动转换不准确(该转的不转或不该转的转了),或缘于字义理解偏差(没查核准确),或校对不细(漏了过去)等。现据有关校对记录整理了若干组容易出错的字,分为笔画简化、形义合并、异体统一、形义近误和特殊情形五类,每类中按各组首字笔画为序略加说明和举例,供同行审校时参考。 一、笔画简化 1.厂廠 两字本无关联,因“廠”简化为“厂”,就与古时的“厂”(音hǎn,山崖边的石洞)相混。古时之“厂”亦读ān。古籍中“厂”照录即可,不能转为“廠”。如撰《恕堂诗》的(清)宫鸿厂、《晉石厂叢書》等。 2.历曆歷

“曆”与“歷”应注意区分。如“万曆”、“弘曆”、“时宪曆”与“经歷”、“歷下”等的区别,应重点校对,如《永曆紀事》、《歷代帝王法帖釋文考異》、《乙酉日曆》、《歷城縣誌》等。“历”是它们的简化字。 3.只隻祇衹 “只”有两读:读zhī有“单独的、量词”的意思,其繁体为“隻”,如“隻言片语”、“隻身”等;读zhǐ有“副词表示限于某个范围、仅有”的意思,其繁体为“衹祇”,如“衹许”等。 4.饥飢饑 “飢”是“饿”的意思,如“充飢”、“如飢似渴”等;“饑”则指“谷物不熟”,如“饑荒”、“饑馑”等;现均简化为“饥”。 5.汇彙滙 著作方式和版本类型中一般用“彙”字,不用“滙”字。书名等处照录即可。“汇”是它们的简化字。 6.发發髮 古时,“发fā”与“髮fà”是两个字,“毛髮”,“发”的繁体作“發”。 7.达達逹 “達”与“逹”:中间有三横是对的。“达”的繁体字是“達”;“逹”是“達”的讹字。因电脑字库有“逹”字,2

繁体字和简体字转换容易出错的字总结

简体转繁体 =============================辨识区============================ (一)“只”读zhi1,作量词时作“隻”(区别于“双”的繁体“雙”),读zhi3时作“衹”、“只”均可,“衹”更为正式。 (二)“后”在“皇后、太后、皇天后土”等义时作“后”,其余诸如“前后、以后”等时作“後”。特别注意“后宫”特指“皇后居住的宫殿”时写作“后宮”,而常指的后宫则写作“後宮”。 (三)“杨”的繁体是“木+昜(昜)”,而不是“木+易”,区别于锡、赐等字。汤、畅、肠、荡、觞等字类推,另外提醒“伤”作“傷”,“阳”作“陽”。 (四)“制”在仅仅含“制造”义时作“製”,其余作“制”。例词:制定計劃,制止,制裁,限制,社會主義制度,制服,全日制;製作,監製,精製,製版。 (五)“尽”读jin3时作“儘”,读jin4时作“盡”。 (六)“干”的繁体有三个:干、乾和幹。读gan4时一律作“幹”,读gan1时,如有相对于湿之义作“乾”,其余均作“干”,另外“干妈”作“乾媽”。例词:干擾,干預,干支,干犯,干涉,干城,干戈,干將劍;主幹,幹部,幹練,幹活;乾淨,乾燥,牛肉乾,烘乾,乾脆。 (七)“范”作姓氏时作“范”,其余均作“範”。“余”作姓氏或指本人时作“余”,其余均作“餘”。 (八)“什么”的繁体可以写作什麼、什麽、甚麼、甚麽都可以,建议使用“什麽”。 (九)“杆”读gan1时作“杆”,读gan3时作“桿”。例词:大腸桿菌,槓桿原理,球杆,欄杆。

(十)“为”的可以作“為”或者“爲”。前一个是港澳繁体,后一个是台湾正体。 (十一)“台湾”的正式繁体应该是“臺灣”,而现在港澳台地区通用的写法是“台灣”(官方文件仍是“臺灣”)。注意“臺”的写法。 (十二)“冲”有“向前冲”义时作“衝”,其余像冲凉,冲剂,相冲等作“沖”,另外常见地名也作“沖”,如“沖繩島”。 (十三)“鸟”作“鳥”(鳥),不光只是把丶换成横,还要在中间加一横。另外“凫”的作“鳧”(中间有四点),而“枭”作“梟”(中间没有四点)【这些加或不加四点是现行写法,更古老文字中均有四点】。而“乌”则作“烏”(烏)。 (十四)“于”作“於”,但港澳繁体中,“于”作为姓氏时仍作“于”,其余作“於”。 (十五)“纟”部的繁体除了第三笔要变为三点外,上面还要变成“幺”,即糹,也可作“糸”(去掉倒数第二笔的勾)。 (十六)“变”作“變”(變),下面是“攵”,而不是“又”或者“夂”。上面是“糹”+“言”+“糹”。注意不能把“弈”、“奕”等上部是“亦”的字也类推成“變”字头。 (十七)“采”除了喝采、神采奕奕,神采飞扬、丰采、文采等名词时作“采”,其余均作“採”(即动词),如採購、採訪、採花、採礦。 (十八)“致”除了“标致”“细致”和“精致”三词作“緻”外,均作“致”。 (十九)“隽”作“雋”,“镌”等类推,但“携”作“攜”(左边扌,上面山,中间隹,下面冏)。 (二十)“帘”除了“酒帘”(即旗子的意思)义作“帘”外均作“簾”。

java 中文繁简体转换工具框架 opencc4j 入门介绍

opencc4j Opencc4j支持中文繁简体转换,考虑到词组级别。 Features 特點 ?嚴格區分「一簡對多繁」和「一簡對多異」。 ?完全兼容異體字,可以實現動態替換。 ?嚴格審校一簡對多繁詞條,原則爲「能分則不合」。 ?詞庫和函數庫完全分離,可以自由修改、導入、擴展。 ?兼容 Windows、Linux、Mac 平臺。 ?支持 jdk1.7(v1.0.3) ?支持自定义分词(v1.1.0) V1.2.0 版本新特性 ?支持判断单个字(词)是否为简体/繁体 ?支持返回分词后的列表信息 ?支持返回字符串中简体/繁体的列表信息 测试代码 见 test 文件夹。 可以用来学习相关方法的使用方式。 快速开始 maven 引入 com.github.houbb opencc4j 1.2.0 转为简体 String original = "生命不息,奮鬥不止"; String result = ZhConverterUtil.convertToSimple(original);

结果为 生命不息,奋斗不止 转为繁体 String original = "生命不息,奋斗不止"; String result = ZhConverterUtil.convertToTraditional(original); 结果为 生命不息,奮鬥不止 其他支持 上述两个方法都默认使用的花瓣分词,都有第二个参数,是否启用花瓣分词。如果不启用,则默认使用普通的一个 char 作为一个转换的对象。(不建议,唯一的优势性能好一点,但是准确性不行) /** *转换为简体 * @param original 原始内容 *@param huabanSegment 是否花瓣分词 *@return 转换后的内容 */ public static String convertToSimple(String original, boolean huabanSeg ment); 引导类方式 为什么需要引导类 v1.1.0 之后引入了类ZhConvertBootstrap 可以提供更加灵活的功能,支持 fluent 语法。 对比静态方法的优势 工具类的静态方法使用起来很方便,但是不是很利于拓展变化。 后期想添加更多的方法,就会发现静态方法开始有些不够优雅,方法数量也会变得较多。所以自定义分词没有暴露静态方法, 建议用户根据 ZhConvertBootstrap 灵活创建属于自己的工具类。 引导类使用案例 和工具类类似。

古今字异体字繁体字

附言:拙文是笔者多年地教学讲稿,最大地特点是应用数学地公式表明和概述古今字、异体字、繁简字地特点和关系,搜集例证很翔实. 摘要:本文比较细致深入地讲述了古今字·异体字·繁简字地定义、特点、辨别方法、发展变化情况、容易出现地误解和偏差,以及应注意地问题.这是学习古汉语地基础知识,解决一些学生不认识繁体字地困难,应很好地认识和理解此文,才能提高我们掌握文字地水平和学好古代汉语.拙文有自己地见解,并用数学公式表明这三种字地特点.多年来,本讲稿曾多次作为教案和刻印给学生参考,得到不少专家学者和广大学生地称赞..资料个人收集整理,勿做商业用途 关键词:古今字异体字繁简字 一、古今字 古今字,是指在某一种意义上先后产生地书写形体不同地字.一个字分化成两个或两个以上地对应字,分化字和原来字出现地时间有先后,代表地义项有多少,这种文字现象就叫做古今字.古今字,是古字和今字地省称,古字是指古代使用地字,如甲骨文、金文、籀文;今字是指由汉隶一直通行到今天还在使用地字,如汉隶、宋体、楷体等字.资料个人收集整理,勿做商业用途 (一)古今字产生地原因 汉字在发展变化地过程中,随着书写工具地发达,人类社会生活和科学文化地进步,人们逐渐要求文字在记录语言上更精确细致,尽量减少文字兼职过多而造成歧义地现象,因而为适应这种形势地需要,便另造了一批新字,尽量以求一字一职,更好地清楚地记录语言,便出现了古今字.例如“贾”是一个古字,它地本义是“商贾”地“贾”(ǔ),引申为“物贾”地“贾”(à)使用,甚至读音也变了,为了便于区分,人们便另造了一个新字“價”(à)来代表这个引申地意义,形成了古今字“贾價”.又如“说”在先秦具有“解说”、“喜悦”等意义,为了加以区别,人们便造了一个从竖心旁地“悦”来加以区分这两个不同地意义.总之,古今字地产生主要是通假字、同源字地逐渐分化、孪生,以及多义字在书写形式上地分工所造成地,这是一种文字繁化地趋势.设若古字形用“”代表,它有多个义项、、……,新字形为“”、“”等,那么用一个数学公式来表达即为:(、、……)=() +()+() ……资料个人收集整理,勿做商业用途 (二)常见地古今字 古今字实际上也是一种使用有时间先后地异体字,是语言中地同词异形现象.阅读古书时,常见地古字是该词早期地写法,故文字学家又称为“初文”;今字是根据所要代表地意义在古字上添加偏旁造成地,又称为“后起字”.大多数古今字都是一对一地,例如(古字在前,今字在后):大太、弟悌、閒間、說悅、孰熟、竟境、赴訃、馮凴、賈價、屬囑、伯霸、皃貌、康糠、采採、云雲、責債、禽擒、知智、田畋、反返、錯措、戚慼、景影、莫暮、嘗嚐、縣懸、取娶、道導、章彰、虛墟、卷捲、舍捨、斂殮、沽酤、自鼻、其箕、然燃、要腰、奉俸、展輾、原源、昏婚、州洲、內納、見現、志誌、益溢、暴曝、契鍥、冥暝、合盒、兩輛、尊樽、陳陣、為偽、名銘、隊墜,等等.资料个人收集整理,勿做商业用途有地古字兼职过多,因此同它对应地今字不止一个.例如:敝蔽弊、厲礪勵、或域國、豈愷凱、共供拱恭、辟避嬖僻闢,等等.资料个人收集整理,勿做商业用途还有一种情况也得注意:有地古字产生今字以后,随着时间地推移,今字又会产生较晚地今字,可称为“再今字”或“再后起字”,形成古今字地一种递变关系.如“猒厭”是古今字,稍后地“厭饜”又成为古今字.“气氣餼”、“或域國”也是这样地关系.资料个人收集整理,勿做商业用途 (三)古今字地造字关系 形声字地构字能力最强,故大部分地今字都是用形声字地方法造成地.归纳起来,今字地造字方法大致有如下几种:资料个人收集整理,勿做商业用途

繁体字转换表

简繁体字转换表 拼音简体繁體1i 皑皚2i 嗳噯2i 蔼藹2i 霭靄3i 爱愛3i 暧曖3i 碍礙`n 谙諳`n 鹌鵪`ng 肮肮2o 袄襖1o 鳌鼇b3 坝壩b3 罢罷b2i 摆擺b3i 败敗b`n 颁頒b3n 办辦 b3n 绊絆 b`ng 帮幫 b2ng 绑綁 b3ng 谤謗 b3ng 镑鎊 b`o 龅齙 b2o 饱飽 b2o 宝寶 b2o 鸨鴇 b3o 报報 b3o 鲍鮑 b7i 贝貝 b7i 狈狽 b7i 备備 b7i 辈輩 b7i 惫憊 bei 呗唄 b4ng 绷繃 b& 笔筆 b* 币幣 b* 毕畢 b* 闭閉 b* 毙斃 bi`n 边邊 bi`n 编編 bi2n 贬貶 bi3n 变變 bi3n 辩辯 bi3n 辫辮 bi`o 标標 bi`o 镖鏢 bi2o 表錶 bi4 鳖鱉 bi6 瘪癟 b%n 宾賓

b%n 傧儐b%n 滨濱b%n 缤繽b%n 槟檳b%n 膑臏b*n 摈擯b*n 殡殯b*n 鬓鬢b&ng 饼餅b8 拨撥b8 饽餑b9 驳駁b9 铂鉑bo 卜蔔b} 补補b] 布佈c1i 财財c`n 参參c1n 残殘 c1n 蚕蠶 c1n 惭慚 c2n 惨慘 c3n 灿燦 c`ng 仓倉 c`ng 苍蒼 c`ng 沧滄 c`ng 舱艙 c7 厕廁 c7 侧側 c7 测測 c7 恻惻 c5ng 层層 ch` 锸鍤 ch3 诧詫 ch`i 钗釵 ch`n 掺摻 ch`n 搀攙 ch1n 禅禪 ch1n 蝉蟬 ch1n 缠纏 ch1n 谗讒 ch1n 婵嬋 ch2n 产產 ch2n 铲鏟 ch2n 阐闡 ch3n 忏懺 ch3n 颤顫 ch1ng 肠腸 ch1ng 尝嘗 ch1ng 偿償 ch2ng 厂廠 ch2ng 场場 ch3ng 伥倀 ch3ng 畅暢

汉字简繁转换的复杂性和陷阱

The Pitfalls and Complexities of Chinese to Chinese Conversion
汉字简繁转换的复杂性和陷阱 漢字簡繁轉換的複雜性和陷阱
春遍雀来 (Jack Halpern)
日中韓辭典研究所 所长
華留萬陽貳 (Jouni
Kerman) Kerman)
日中韓辭典刊行會软件开发总工程师
目录
0. 摘要 1. 序 2. 转换的四级 3. 讨论和分析 4. 转换的新技术 鸣谢 参考材料 附录 作者介绍 日中韓辭典研究所
(株)日中韓辭典研究所 The CJK Dictionary Institute, Inc.
〒352-0001 日本国埼玉県新座市東北2-34-14 小峰ビル 3?4F
电话:048-473-3508 Fax:048-486-5032 E-mail:jack@https://www.360docs.net/doc/a02849276.html, 网址:https://www.360docs.net/doc/a02849276.html,
-1-

汉字简繁转换的复杂性和陷阱
春遍雀来,日中韓辭典研究所 所长 春遍雀来 華留萬陽貳,日中韓辭典刊行會软件开发总工程师 華留萬陽貳
0. 摘要
汉语有两种书面形式:中华人民共和国和新加坡使用的简体中文 简体中文,和台湾、香港、澳门以及 简体中文 大多数海外华人使用的繁体中文 繁体中文。但是存在一种常见的误解,认为这两个体系之间具有直接 繁体中文 的对应关系,相互转换只需要从一个字符集对应到另一个字符集就可以了,例如从国标码 (GB2312-80)转换到大五码(Big5)。 虽然很多代码转换工具实现了这种转换, 但事实却是截然相反的。 这两种体系在不同级别上 都存在重要的差异,不论是字符集,编码,拼写法(字的选择),词汇(词的选择),还是语义 (词义),都有着显著的差别。 随着东亚在世界经济里的地位日益重要, 地方化公司和翻译公司都有着对中文简繁体转换的 迫切需求,但也必须克服以下障碍:(1)现有的转换工具产生的结果不能令人满意;(2)缺乏 发展好的转换工具所需的知识;(3)无法得到高质量数据的字典;(4)手工转换费用太高。 1996年, 日中韓辭典研究所 日中韓辭典研究所(The CJK Dictionary Institute, Inc.)开始深入调查这些问题,并建 立了一个总括了中文简繁互转的数据库(300 300万条,且仍在发展中),其目的是要使转换软件 300 的准确性接近百分之百. 这篇论文解释了涉及的复杂问题,并展示这项基于Unicode的新技术将如何大大减少中文地 方化和翻译项目的时间和费用。
1. 序 1.1 历史背景
汉字在它几千年的历史中经历了许多变迁。很多书法风格,异体字,和字体设计都有逐步的 演变。有些完整的,复杂的字体被提升为“正字”,而那些令人眼花缭乱、泛滥成灾的变体 则往往被降级为“俗字”。 在中华人民共和国于1949年成立后不久, 新政权就发起了一场积极的运动, 贯彻大规模的书 面语改革。在五十年代,毛泽东和周恩来提出了简化汉字是一项应该优先完成的任务。1952 年成立的语言改革委员会开始深入研究这一问题,并从事编纂简化字表的任务。 这些行动导致了许多书面语的改革,最重要的有:建立了一套标准化的罗马字系统(拼音), 限制日常用字的数量,以及大大地简化了数以千计的字形。一度,这项运动的目的是完全废 除汉字,以罗马字母表代之,但后来还是倾向于使用简化字形而放弃了这项政策。 随后几年出版了几种简化字表,其中最著名的是1964年出版的“权威”简化字总表 简化字总表,之后又 简化字总表 重新发行了几次并作了次要的修改。最新版本是1986年出版的,收录了2244个简体字[简体 字总表 1986]。 台湾、香港和多数海外华人没有实行简化。尤其是台湾,还在严格地遵循着繁体的形式。台
-2-

古今字异体字繁体字

古今字·异体字·繁简字 附言:拙文是笔者多年的教学讲稿,最大的特点是应用数学的公式表明和概述古今字、异体字、繁简字的特点和关系,搜集例证很翔实。 摘要:本文比较细致深入地讲述了古今字·异体字·繁简字的定义、特点、辨别方法、发展变化情况、容易出现的误解和偏差,以及应注意的问题。这是学习古汉语的基础知识,解决一些学生不认识繁体字的困难,应很好地认识和理解此文,才能提高我们掌握文字的水平和学好古代汉语。拙文有自己的见解,并用数学公式表明这三种字的特点。多年来,本讲稿曾多次作为教案和刻印给学生参考,得到不少专家学者和广大学生的称赞。。 关键词:古今字异体字繁简字 一、古今字 古今字,是指在某一种意义上先后产生的书写形体不同的字。一个字分化成两个或两个以上的对应字,分化字和原来字出现的时间有先后,代表的义项有多少,这种文字现象就叫做古今字。古今字,是古字和今字的省称,古字是指古代使用的字,如甲骨文、金文、籀文;今字是指由汉隶一直通行到今天还在使用的字,如汉隶、宋体、楷体等字。 (一)古今字产生的原因 汉字在发展变化的过程中,随着书写工具的发达,人类社会生活和科学文化的进步,人们逐渐要求文字在记录语言上更精确细致,尽量减少文字兼职过多而造成歧义的现象,因而为适应这种形势的需要,便另造了一批新字,尽量以求一字一职,更好地清楚地记录语言,便出现了古今字。例如“贾”是一个古字,它的本义是“商贾”的“贾”(gǔ),引申为“物贾”的“贾”(jià)使用,甚至读音也变了,为了便于区分,人们便另造了一个新字“價”(jià)来代表这个引申的意义,形成了古今字“贾價”。又如“说”在先秦具有“解说”、“喜悦”等意义,为了加以区别,人们便造了一个从竖心旁的“悦”来加以区分这两个不同的意义。总之,古今字的产生主要是通假字、同源字的逐渐分化、孪生,以及多义字在书写形式上的分工所造成的,这是一种文字繁化的趋势。设若古字形用“x”代表,它有多个义项a、b、c……,新字形为“y”、“z”等,那么用一个数学公式来表达即为:x(a、b、c……)=x(a) +y(b)+z(c) …… (二)常见的古今字 古今字实际上也是一种使用有时间先后的异体字,是语言中的同词异形现象。阅读古书时,常见的古字是该词早期的写法,故文字学家又称为“初文”;今字是根据所要代表的意义在古字上添加偏旁造成的,又称为“后起字”。大多数古今字都是一对一的,例如(古字在前,今字在后):大太、弟悌、閒間、說悅、孰熟、竟境、赴訃、馮凴、賈價、屬囑、伯霸、皃貌、康糠、采採、云雲、責債、禽擒、知智、田畋、反返、錯措、戚慼、景影、莫暮、嘗嚐、縣懸、取娶、道導、章彰、虛墟、卷捲、舍捨、斂殮、沽酤、自鼻、其箕、然燃、要腰、奉俸、展輾、原源、昏婚、州洲、內納、見現、志誌、益溢、暴曝、契鍥、冥暝、合盒、兩輛、尊樽、陳陣、為偽、名銘、隊墜,等等。 有的古字兼职过多,因此同它对应的今字不止一个。例如:敝蔽弊、厲礪勵、或域國、豈愷凱、共供拱恭、辟避嬖僻闢,等等。 还有一种情况也得注意:有的古字产生今字以后,随着时间的推移,今字又会产生较晚的今字,可称为“再今字”或“再后起字”,形成古今字的一种递变关系。如“猒厭”是古今字,稍后的“厭饜”又成为古今字。“气氣餼”、“或域國”也是这样的关系。 (三)古今字的造字关系 形声字的构字能力最强,故大部分的今字都是用形声字的方法造成的。归纳起来,今字的造字方法大致有如下几种:

汉字对联

汉汉字字对对联联 日在东 月在西 天上生成明字 子居右 女居左 世间配定好字 寸土为寺,寺旁言寺,诗曰:明月送僧归古寺。 双木为林,林下示禁,禁云:斧斤以时入山林。 日月明朝昏,山风岚自起, 石皮破仍坚,古木枯不死。 天近山头行到山腰天更远 月浮水面捞到水底月还沉 月圆月缺,月缺月圆,年年岁岁,暮暮朝朝,黑夜尽头方见日。 花开花落,花落花开,夏夏秋秋,暑暑凉凉,严冬过后始逢春。 月月月明 八月月明明分外 山山山秀 巫山山秀秀非常 天上月圆,人间月半,月月月圆,逢月半 今年年底,明年年初,年年年底,接年初 龙怒卷风风卷浪 月光射水水射天 一大乔,二小乔,三寸金莲四寸腰,五匣六盒七彩纷,八分九分十信娇。 十九月,八分圆,七个进士六个还,五更四鼓三声向,二乔大乔一人占。 清风满地难容我 明月何时再照人 上联:「清」暗寓清朝统治。 下联:「明月」怀念明代。 汉汉字字的的字字谜谜 一人 ,猜一个字 答案是:大 一人一张口,口下长只手,猜一字 答案是:拿 一人在内,猜一字 答案是:肉 一人挑两小人,猜一字 答案是:夹 一人腰上挂把弓,猜一字 答案是:夷 一口吃掉牛尾巴,猜一个字 答案是:告 一口咬定,猜一字 答案是: 交

一斗米,猜一个字答案是:料 一月七日,猜一个字答案是:脂 一加一,猜一字答案是: 王 一半儿,猜一个字答案是:臼 一字十三点,难在如何点,猜一个字答案是:汁 一百减一,猜一个字答案是:白 一夜又一夜,猜一字答案是:多 一个人搬两个土,猜一个字答案是:佳 一个礼拜,猜一个字答案是:旨 一家十一口,猜一字答案是:吉 一家有七口,种田种一亩,自己吃不够,还养一条狗,猜一个字答案是:兽 一根木棍,吊个方箱,一把梯子,搭在中央,猜一个字答案是:面 一只牛,猜一个字答案是:生 一只狗四个口,猜一个字答案是:器 一一箭穿心,猜一字答案是:必 一点一横长,一撇到南洋,南洋有个人,只有一寸长,猜一个字答案是:府 一边是水,一边是山,猜一个字答案是:汕 一边是红,一边是绿,一边喜风,一边喜雨,猜一个字答案是:秋 七人八只眼,猜一个字答案是:货 七人头上长了草,猜一字答案是:花 七十二小时,猜一个字答案是:晶 七个人有八只眼,十人亦有八只眼,西洋人也眼八只,家母同样眼八只,猜四个字答案是:货真价实 九十九,猜一字答案是:白 九只鸟,猜一个字答案是:鸠 九号,猜一字答案是: 旭 九辆车,猜一个字答案是:轨 九点,猜一字答案是:丸 二八佳人,猜一个字答案是:妙 二小姐,猜一个字答案是:姿 二兄弟,各自立,猜一个字答案是:竞 人不在其位,猜一个字答案是:立 人有他则变大,猜一个字答案是:一 人我不分,猜一个字答案是:俄 人都到了,猜一个字答案是:倒 人无寸铁,猜一个字答案是:控 人无信不立,猜一字答案是:言 八十八,猜一个字答案是:米 八兄弟同赏月,猜一个字答案是:脱 刀出鞘,猜一字答案是:力 十一个读书人,猜一个字答案是:仕

繁体字和简体字转换容易出错的字

繁体字学习宝典 建议下面几类朋友阅读本文: 1.认为相对于繁体字,现行的简化字更为科学与先进; 2.认为“人云亦云”的繁体写法是“人雲亦雲”; 3.认为使用网上的简繁转换工具可以得出正确对应的繁体写法; 4.对繁体中文有兴趣,想加深了解我们中华民族繁衍发展几千年的正统文字,培养继承和弘扬中华传统文化的能力。 ===========================首先看这里========================== 1.本文绝大部分内容由铁鹫飞艇(我)原创总结(>99%)。 2.为了避免语词混淆,除组词,引义用繁体字外,其余均用简化字。并且在阐述时遵从“简体反推繁体”原则以方便大家学习。 3.本文是我学习繁体字的经验和知识,专门阐述如何区分非对称繁简对应和容易写错的繁体字,并普及新旧字形知识。 4.如果大家不清楚个别字的用法,无论是否已收录在文中,欢迎在评论中提出,周末将进行回答与补充。 5.本文每周更新,会根据新获取的知识将前面的内容进行修正、补充及完善,因此建议有意转载的朋友们使用百度的转帖功能

(会随文章更新而更新),也请那些未标出处的网络转载者自重!! 最近更新日期:2011年10月28日 最近更新内容: 【紧急修正】郁/鬱;風塵僕僕;老舍 =============================辨识区============================ (一)“只”读zhi1,作量词时作“隻”(区别于“双”的繁体“雙”),读zhi3时作“衹”、“只”均可,“衹”更为正式。(二)“后”在“皇后、太后、皇天后土”等义时作“后”,其余诸如“前后、以后”等时作“後”。特别注意“后宫”特指“皇后居住的宫殿”时写作“后宮”,而常指的后宫则写作“後宮”。 (三)“杨”的繁体是“木+昜(昜)”,而不是“木+易”,区别于锡、赐等字。汤、畅、肠、荡、觞等字类推,另外提醒“伤”作“傷”, “阳”作“陽”。 (四)“制”在仅仅含“制造”义时作“製”,其余作“制”。例词:制定計劃,制止,制裁,限制,社會主義制度,制服,全日制;製作,監製,精製,製版。 (五)“尽”读jin3时作“儘”,读jin4时作“盡”。

简化汉字利与弊

简化汉字的利与弊 简化是汉字发展的主要趋势之一。 简化的指导思想是“约定俗成”、“稳步前进”。 简化的原则是从俗从简。 简化的主要内容是精简字数和减少笔画。 传统汉字存在的主要问题是繁与乱,繁指笔画繁多,乱指异体纷呈。这两个问题给汉字的学习和应用带来了不便,解决的办法是简化和整理。 部分简化了的汉字从字型上难以分辨其正确意义,难以体现其形成的历史过程。 利:利于书写 弊:抹灭了部分文化 对于汉字简化,一直以来存在着两种完全对立的观点。近年来对于汉字简化的反思和争论开始升温。 赞同汉字简化的人认为: 1.从甲骨文到楷书,汉字在演化过程中不断简化。除中国大陆外,新加坡、马来西亚等国都在简化汉字,是大势所趋。 2.中国大陆规定的简体字基本源于民间业已流传的写法,其中一些来自古体,并非凭空创造。 3.汉字的简化减少了汉字的笔画数和汉字的数目,因而降低了汉字学习的难度,同时加快了书写的速度,有利于普及教育,且废除繁体中的异体字便于民众交流。

4.中国大陆的上海古籍出版社和中华书局等专事出版古代典籍的出版社通常使用繁体,繁体典籍很容易找到。 5.大部分受简化字教育的中国大陆人在阅读繁体字时并未出现明显理解困难。 6.在电脑、手机、PDA等数字设备,文字大小有限,简化汉字因笔画较简单,显示较清楚。 反对的观点主要集中在: 1.汉字简化后,不利于对中国五千年来传统文化的继承,推广汉字简化之后,很多现代中国人无法再直接阅读古代的典籍。即使把古书以简化字重印,亦往往会出现歧义,使读者误解。很多人忽略的是,自五四以来,一直有声音鼓吹废除汉字,改以拉丁字母-这是中共推动简体字背后的意识形态。作为世上最后一种活的表意文字系统,简体字是消灭一种文化的一部分的第一个步骤。 2.不利于中国大陆、台湾、港澳等地之间的文化交流,与日本等外国使用的汉字也进一步脱节,做成人为的“书不同文”。而新加坡、马来西亚等地,主要是考量到大陆地区在世界的地位日渐重要,故随之采用简体,所谓大势所趋,追究其根源,仍是来自中国政府的政治力。 3.简化字违反了六书造字原则,但又不是另行建立一套完整的造字系统,大大削弱了汉字的科学性与逻辑性。许多汉字失去表义的结构,使学习汉文的过程中失去以表义结构推测字义的学习途径。现行简化字的推类系统混乱,常有例外的或类推不一致情况,而且什么字依从类推、什么字不依从的随机性很高。结果使汉字系统更繁杂,增加学习者的负担。

相关文档
最新文档