求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

汉字查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索
原图链接汉字:是汉字文化圈广泛使用的一种文字,为世界上独有的一种指示会意文字体系。
汉字
汉语名称
简化字 汉字
繁体字 汉字
越南语名称
越南语 chữ Hán
喃字 𡨸
壮语名称
壮语 15px[1]
Sawgun
朝鲜语;zh-hk:韓國語名称
谚文 한자
汉字 汉字
日语名称
日本汉字 Template:Audio
平假名 かんじ

汉字( Chinese character )(日语:汉字かんじ Kanji */?朝鲜语:한자汉字 hanja),又称中文字华文字唐话字,是汉字文化圈广泛使用的一种文字,为世界上独有的一种指示会意文字体系,也是世界上唯一仍被广泛使用并高度发展的语素文字,由中国上古时代的汉族先民所发明创制,其字体也历经过长久改进及演变。

原图链接汉字起源

目前确切历史,可追溯至约公元前1300年商朝甲骨文籀文金文,再到春秋战国秦朝籀文小篆,发展至汉朝隶变,产生隶书草书以及楷书(以及衍生的行书),至唐代楷化为今日所用的手写字体标准——正楷,也是今日普遍使用的现代汉字。

原图链接仓颉画像

汉字在古文中只称“字”,为与少数民族文字区别而称“汉字”,指汉人使用的文字,后者称法在近代才开始通用,为日文借词[2]

原图链接河图洛书

作为中文的书写文字,汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的,相较而言,古埃及古巴比伦古印度文字都早已消亡,所以有学者认为汉字是维系中国南北长期处于统一状态的关键元素之一,亦有学者将汉字列为中国第五大发明。中国历代皆以汉字为主要官方文字,现时在中国大陆台湾均为实务上官方文字

原图链接隶书碑刻

汉字在古代已发展至高度完备的水准,不单中国使用,在很长时期内还充当东亚地区唯一的国际通用文字,在20世纪前都是朝鲜半岛越南琉球日本等国家的书面规范文字。除了汉语之外,古代东亚诸国都有一定程度地自行创制汉字。

原图链接欧阳询楷书

现代汉语汉字可大体分为传统的繁体字与后起的简化字两大标准,前者主要用于台湾以及香港澳门,后者则由中国大陆制定并使用,且为新加坡马来西亚华侨众多的国家采用。非汉语体系中,日本将部分汉字自行作简后成为现在的日本新字体韩国也制定了官方的朝鲜汉字使用规范,而历史上曾使用过汉字的越南北韩蒙古等国,汉字现今已不再具有官方规范地位。

原图链接怀素草书

“汉字”语源

原图链接赵孟𫖯行书作品

元朝之前的中国,因为是东方世界少数的大国之一,没有与他小国区分的必要,多称呼为“”或“文字”。“汉字”一词早出自元朝金史》卷九本纪第九,“章宗一”:“十八年,封金源郡王。始习本朝语言小字,及汉字经书,以进士完颜匡、司经徐孝美等侍读”。《金史》也出现多次,如:“女真初无文字,及破辽,获契丹、汉人,始通契丹、汉字,于是诸子皆学之”、“长子布辉,识女真、契丹、汉字,善骑射”,将汉族文字、女真族文字、契丹族文字之间互相区别。

原图链接仓颉造字

清朝前期,政府官方文字是满文,当时已用汉字一词称呼中国汉族的传统文字。另外,日本人也称呼为“汉字”,以别于由汉字衍生的假名。在南韩,汉字则与训民正音谚文)相区别。

汉字的历史

原图链接王羲之书法

汉字是四大古老文字之一(还包括古埃及圣书字苏美尔人楔形文字玛雅文字)。

传说汉字起源于仓颉造字。黄帝的史官仓颉根据日月形状、鸟兽足印创造了文字,使而“天雨粟,鬼夜哭”(《淮南子》)。从历史的角度看,复杂的汉字系统不可能由一个人发明。仓颉应该是在汉字的搜;zh-hk:蒐;zh-tw:蒐集、整理、统一上作出了突出贡献,所以《荀子·解蔽》中记载“好书者众矣,而仓颉独传者,一也”。

字形史

原始文字

文字发明前的口头知识在传播和积累中有明显缺点,原始人类使用了结绳、刻契、图画的方法辅助记事,后来用特征图形来简化、取代图画。当图形符号简化到一定程度,并形成与语言的特定对应时,原始文字就形成了。唐兰在《古文字学导论》中将古文字分成殷商系、西周系、六国系、秦系四系。

1994年,湖北杨家湾大溪文化遗址出土了大量陶器。在这些6000年前的陶器上发现了170多种符号,部分符号的特征与甲骨文很类似。此外,山东大汶口出土陶器上的象形符号、西安半坡彩陶上的半坡陶符以及河南贾湖遗址发现的距今8000年前的龟甲上的贾湖契刻符号等,都可能是原始文字形成中(或形成前)不同阶段的表现。但是,这些几何符号是否是文字、是否是汉字的前身,这些仍是争议颇多的问题。

象形指事时代

甲骨文小篆,汉字经历了从钜细靡遗描绘意象的方式往简化成容易纪录刻画的方向变迁,字形逐步脱离事物的具体形象。这一时期的汉字也称为古文字。唐兰在《古文字学导论》一书中认为小篆也算作古文字。

时期的甲骨文已经是一种比较完整的文字体系。在已发现的4500多个甲骨文单字中,目前已能认出近2000字。[3]与甲骨文同期,青铜器上铸造的文字被称为金文或钟鼎文。西周时期的《散氏盘》、《毛公鼎》具备很高的史料和艺术价值。

春秋时代开始,各地诸侯相争,而原本周文化独尊的局面逐渐破坏,各地区文化开始有“在地化”的改变趋势。到了战国时代以后,这种情况更明显,在文字使用方面可以粗略依照地域分为五大系统:东方齐系、东北燕系、南方楚系、北方晋系和西方秦系文字,各系统的文字大体上相近,只有小部份文字有所差异,因此彼此文书往来并没有太大问题。[4]

秦始皇统一六国后,李斯大篆(秦系文字)和六国古文的基础上,进行规范和整理,制定出了小篆作为秦朝的标准书写字体,统一了中国的文字,影响深远。小篆呈长方形,笔画圆润流畅。小篆解决了各国文字间出现大量异体字的情况,“书同文”的历史从此开始。文字的统一有力促进了不同语族间的文化传播,对中国的统一以及东亚各国的文化交流发挥了重要作用,为世界文字史所罕见。

汉字的发展经历了许多不同的演变。初期汉字系统的字数很少,以象形与指事的独体字为主,大量事物以通假字来表示,使文字表述存在较大歧义。例如先秦的“文”,兼有后世的新字“纹”的功能,表示一组成各种事务的规律、型式,不单指文字的“文”,也包含野兽身上的花“纹”、布上面的织“纹”、手指的指“纹”等数种含意。

除了“凹”、“凸”等特例直到唐朝才发明[5],大部分的象形指事字很早就已经定型,成为下个时代形声会意组字法的基础。

形声会意时代

为了能更精准的表述,最早从小篆的时代开始一直到现代,因应随文明发展不断增加的新事物,以基本的象形指事字为基础,发展了形声、会意的组字法,以组合方式,来细化大量的字出来,使得文书上记载越来越精密,到今天一直为造字的主力。

例如:

  • 最早海上的交通工具就只有:“舟”一种;但演化到现在,细分成“舨、舟、艇、船、舰”等不同小大规模与形制的“舟”。
  • 一开始金属只有“金”一种,但随著冶金技术的发展,对于金属的知识更加丰富,“金”被细化成“金”、“银”、“铜”、“铁”等等。
  • 隋文帝杨坚原为随国公,但因“随”字的“辶”有不稳定之意,故去掉“辶”,而造“隋”字作为国号
  • 唐朝武周时,武则天根据“日月当空”之意而造字“曌”(同“照”字)作为她的名字。同时发明的文字还包括圀、瞾、囝等。人称则天文字
  • 五代刘䶮取“飞龙在天”之意创了自己名字内的“䶮”字。
  • 在近代,由于大量西方事物的涌入,也造了许多字。例如随著“Beer”传入中国,如何用汉字表达是一个问题,最初译为皮酒,后觉不妥,于1910年左右创造了“啤”字——译为“啤酒”。(而在同一时期,朝鲜半岛与日本采用了“麦酒”这个名字作为“啤酒”的译名。)
  • 近现代科学名词用字许多都是新造的汉字,以形声字为多,亦有形声兼会意字和反切字。还有一部份是古字赋予新义(如“烷”在古书中也有,意为“火”)。
    • 化学元素中,常温下为固体的金属元素非金属元素一般分别用“”、“”为形旁,并以相应英文名称中的音节发音近似的汉字为声旁,如“”、“”、“”、“”等字;常温下为气体的元素从“”,如“”、“”等;“”、“”常温下呈液态,从“”。
    • 一些化学元素用字则与其性质和功能有关,如“”言其重量“轻”,“”有“滋养生命”之意,“”有“绿色”意。
    • 一些非金属元素加氢生成的基团常按其性质将形旁改为“”、“”(用“氨”字改),如“”、“”、“𬭸”、“”、“𬬹”、“”等,分别表示其相应的质子化的氢化物以及氢化物分子中的氢被烃基取代的化合物,其音从原字改变音调而来。
    • 热力学中,相关的形声字则从“”为形旁,如“”、“”等。
    • 有机化学中,命名原则如下,包括新造字和古字赋予新义:
      • ”表示含氧元素:等。
      • ”表示芳香烃:等。被用于指五个碳的环戊二烯(戊意思是五,表示五元环)。
      • ”表示含氮元素:(蛋白质旧称)等。
      • ”表示杂环化合物吡咯噻吩等。
      • 古字用来指母体是四个环和三个支链的一类化学物质。
      • 古字过去被用来指具有四个环的卟啉
      • 一些基团常取其组成元素的名称用字的偏旁合成,其发音取两部分字音合成,类似反切。如“”(碳氢)、“”(碳氧)、“”(氢硫)、“”(氢氧)等。
      • 烃类中,则为形声兼会意字,声旁分别取自“完”、“稀”、“缺”,表示其不同的饱和度
    • 工程中部份字属于新造或选用已有古字赋予新义:“”、“”等。
    • 生物学中部份字属于新造或选用已有古字赋予新义:㺢㹢狓猛犸的“犸”、𪄳鷎鸸鹋鵎鵼鶆䴈鿕属的“鿕”等。
  • 为了表示英制的单位,还造了一些多音节的字,如浬(海里)、嗧(加仑)、瓩(千瓦)、呎(英尺)、哩(英里)等度量衡用字。目前在台湾仍然使用,但多为单多音节混用,香港已经没有用嗧、瓩等,而浬、呎、哩等就已经是单音节。不过这些多音节的字在1977年7月20日大陆的中国文字改革委员会和国家标准计量局所发的《关于部分计量单位名称统一用字的通知》中被淘汰,在大陆地区不使用。

有了造好的象形、指事的独体字为基础,使用形声、会意组字法随著文明的发展,组出表示新事物的合体字,这使得记载为文时,以前述的各种不同的船来说,只要看一单位的字形,我们就知道指的是哪一种“舟”,这样辨识理解的效率非常高;反过来,以组词的方式就要看过前后文(或短或长)有其他哪些字才能判断正确的意义,较缺乏辨识效率,但方便口语沟通(汉字同音字太多,听觉不易辨识,解法一为组词,二为如韩日语数音为一字:“浬”发音为海里)。

简化

汉字结构复杂,异体字非常多。自古以来已经有许多的俗字,其中有一些是为了书写简便,较之正字笔画减少的简俗字,但俗字多半是人民私下使用,正式的文书仍然是用正体字。

近代,处于强势地位的西方文明开始进入东亚,整个汉字文化圈的各个国家中纷纷掀起了学习西方的思潮。当中有人坚持汉字的传统,亦有鼓吹放弃使用汉字。这些鼓吹放弃汉字运动的立论“汉字落后论”,内容为:跟西方拼音文字相比,汉字是繁琐笨拙的。尤其在近代个人电脑还没有普遍化以前,因为汉字不能透过打字机书写,而必须使用巨型的排版房的铅字,也就是说汉字已成为教育及资讯化上的瓶颈。但是近代个人电脑普遍化以后,汉字能透过个人电脑输入,此种论述已经不具说服性。许多使用汉字国家以政治推行的方式,进行了不同程度的汉字简化,甚至还有完全拼音化的尝试。日本的使用假名方案以及汉语多种拼音方案的出现都是基于这种考量。

1935年8月21日,中华民国国民政府教育部颁布《第一批简体字表》,1936年2月被通令“暂缓推行”。

中华人民共和国政府1956年1月28日发布《汉字简化方案》,1964年5月审定通过《简化字总表》,客观上配合了不久之后的文化大革命“破四旧”政策。1986年经少量修订后重新发表,一直在中国大陆地区使用至今。1977年,曾公布《第二批汉字简化方案(草案)》,发布“二简字”,试用一段时间(约八年)后因为字形过于简陋且混乱而停用,并于1986年正式宣布废除。新加坡马来西亚政府分别发布了同中国大陆《简化字总表》相同的简化字表。

日本政府在二战结束后也进行了汉字简化。1946年日本内阁公布了《当用汉字表》,收字1850个,其中对部分汉字进行了简化,有些简化后的汉字与中国大陆简化后的汉字一致,有些则有一定差异,部分为日本自创。

书体史

小篆笔画以曲线为主,后来逐步变得直线特征较多、更容易书写。到汉代隶书取代小篆成为主要书体。汉代以后,汉字的书写方式逐步从木简和竹简,发展到在帛、纸上的毛笔书写。隶书的出现,奠定了现代汉字字形结构的基础,成为古今文字的分水岭。隶书进一步发展为楷书,到唐代,楷体完全定形。除端正的楷书外,亦同时衍生出适于手写的行楷,并进一步衍生出笔画更加简省而飞动的草书。楷书行书草书等书体都发展为艺术。古代印刷术发明后,明朝出现了用于印刷的宋体、民初出现仿宋体,宋体亦传入日本韩国等使用汉字的国家,同样成为当地通行的汉字印刷体。现代手写体仍以楷体为标准(钢笔字),除了传统的宋体外,现代又陆续出现了笔画大小粗细均衡的黑体等字形。

汉字的特点

汉字的特点有以下几项:

  1. 字根组字:每个汉字可由物体及抽象事物构成。一个汉字偶尔只由一个构成字组成,通常是由两个以上构成部分合体而成。汉字本身即有意义的869个声母及265个形母的象形、指事字为最基本字根部件,称为“字源”,通常为独体字,例如“日”、“月”,可组成各种复合部件(如“明”,可再堆叠组合成汉字盟、萌、曌等字)、以及一般认知的字(“明”本身就是一个字)。《参考汉字的字形与编码第三页
  2. 表意:承上,字根本身表义,多个字根合成新义,且空间的配置对字义有影响。(朱邦复先生的字易即是探讨此)
  3. 相容并蓄:各语言、各领域应用可以六书基本规则,可贴近自身领域、地域所需组出所需要之字。
  4. 书同文:汉字本身不完全表音,不同方言、语言之间,仍可书同文,以文意、字义来互相了解。
  5. 独有的文化如对联书法艺术等。
  6. 任意排列:因为汉字属表意文字,故汉字可由上而下、由右而左、由左而右排列,不像其他表音文字只能固定一个方向读。

汉字的语文知识

构造原理

六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了“六书”这个汉字构造原理:象形指事会意形声转注假借

象形

这种造字法是依照物体的外貌特征来描绘出来,所谓“画成其物,随体诘诎”是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成现在的造型。

指事

这是指表现抽象事情的方法,所谓“各指其事以为之”是也。如人在其上写作“上”,人在其下写作“下”,有人称为抽象的象形。

会意

这个造字法,是将两个字根组合起来,使衍生出新的含意。如“日”和“月”组起来,就是日光加月光变成“明”。“人”字和“言”字合成“信”字,意思就是人过去所言;有信,就是这个人都很遵守自己说过的话。

形声

此乃文字内以特定形状(字根)表特有的音。例如:胡,这个字也可为一个声符,结合不同的属性部件,表不同意义如蝴、湖、葫、瑚、醐等,而以同样的发音元素(也有的是完全同音),表达不同的事物。但形声字,也因古今语言音韵变迁,不少古代同类形声字在今天的官话已无共同音素了,如过、蜗。

转注

六书中转注争议最大。汉代许慎《说文解字》中对转注的定义是:“建类一首,同意相受,考、老是也。”有人解释这句话的意思是:转注是用于两个字互为注释,彼此同义而不同形,如“老”、“考”二字。古时“考”可作“长寿”讲,“老”、“考”相通,意义一致,即所谓“老者考也,考者老也”。诗经的《大雅·棫朴》亦云:“周王寿考。”。苏轼的《屈原塔诗》也有“古人谁不死,何必较考折。”一语。其中的“考”皆“老”意。由于许慎对转注定义模糊,《说文解字》一书中除此例以外再无其他字被记载为转注字,因此,后代的文字学家针对许慎的前述的定义有许多解释和争议。其中包括“形转说、声转说、义转说”三类,只是这三种说法有人认为不够全面。当代古文字家林沄认为“转注”就是一个形体(字根)记录两个读音和意义完全不同的两个词,例如“帚和妇”与甲骨文中的“母和女”等等。亦有观点认为转注不是解释汉字字源必须的概念,中国著名文字学家、北京大学教授裘锡圭先生认为:“在今天研究汉字,根本不用去管转注这个术语。不讲转注,完全能够把汉字的构造讲清楚。……总之,我们完全没有必要卷入到无休无止的关于转注定义的争论中去。”[6]

假借

这法简言之,借用一字,去表达别的事物。一般来说,是有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如:“又”,本来是指右手(最早可见于甲骨文)[7],但后来被假借当作别的意思。闻,本意是用耳朵听东西的意思。例如《大学‧第七章》中有“视而不见,听而不闻,食而不知其味”,但后来被假借成嗅觉的动词(不过也有人认为这是错用)。 (其中“转注”“假借”两项的意义,至今争讼不休,尚无令人满意的说法。)

总结以上古代六书,前两项,“造字法”也;中两项,“组字法”也;后两项,“用字法”也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。

字形

汉字有各种不同的书写方式,即有不同的字体;不同的字体,汉字的字体形状不一样。就算是同样的字体,也会因使用地区或使用者的不同而有字形上的差异。由于各地对字形的使用并没有统一,加之大陆地区使用“新字形”、日本使用“新字体”,便产生了许多差异。例如“刃”及“角”,在各地写法都不尽相同。又如“口”字,台湾官方规定最后一横要写得超过上面的横折露出来一点,其他地区的写法却是不出头的(注意右图“启”字的口部)。

规整的字体(如:楷书宋体隶书篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字合体字独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如:“笑”、“尖”;左右结构,如:“词”、“科”;半包围结构,如:“同”、“趋”;全包围结构,如:“团”、“回”;复合结构,如:“赢”、“斑”等。汉字的基末级部件(或称基础部件)包括独体字、偏旁部首和其他非字部件。

所谓的“文字”,古代是两个东西,东汉许慎《说文解字》叙:“仓颉之初作书,盖依类象形,故为之文,其后形声相益,即谓之字。”;宋郑樵《象类书》云:“独体为文,合体为字”。这个,现代的术语叫作字根部件,汉字是以意念的表达需要组合所需部件于一方块,合成千千万万的字。

郑樵的搜集,以形为主的文有三百三十个,称为形母,以声为主的文共有八百七十个,称为声母,合计一千二百文。

但郑樵的声母形母已经失传,近代周何教授依据中文资讯交换码(CCCII)第二集的22394字的字集重新整理的结果,得出汉字有869个声母及265个形母,共计1134个。形母:郑樵的搜集,有三百三十个。现代的研究整理,是265个。声母:郑樵的搜集,有八百七十个。现代的研究整理,是869个。

末级部件,再行拆解,即为汉字的最小构成单位:笔画。汉字的笔画离不开“”、“”、“”、“”、“”、“”这六种基本笔画,另外还有“”。以书法为例,对各种笔画都有多种不同写法,尤其以折的变化最多。

书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,从上到下,从左到右,先横后竖,先撇后捺,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。

各地字差异

以下举出几个各地字差异:

中国大陆 台湾 日本 南北韩 香港
启啓 [[Category:含有Template:ISO 639 name zh-yue的条目]]
机机 [[Category:含有Template:ISO 639 name zh-yue的条目]]

读音

汉字是多种语言的共同书写体系,每个字代表一个音节或数个音节(视语言而定)。此外念法上在日语以及各汉语中,读音有“音读”和“训读”之分。

上古汉语,有人认为曾存在一个汉字多个音节的情况,但目前主流看法仍是以一字一音为主。中古汉语(以切韵及广韵音系为代表)已经确知为一字一音节。现代标准汉语中,皆由一个声母、一个韵母声调确定,实际用到1300多个音节。
从字源来看,由于汉语使用者习惯用不同字形书写同音异义的语素,且同一汉字常常存在许多书写变体,因此存在较多同音字现象(与之对比的是,西方语言习惯用同一词形书写同音异义的语素,因此存在较多多义词现象,如“蝙蝠”和“球拍”在英语中都用bat书写)。由于各种原因,汉字还有一字多音的情形,称为多音字或破音字,此外,许多地方的汉语具有文白异读的情况。中国其他少数民族借汉字表音时,也有存在一字多音节的情况。
汉字大致为一字一种发音,存在训读,但现今已不常用。
在汉字的发音上,有著多音节,如こく)、にく),也有单音节如空気(空气)的気(き,Ki),此外有许多字因训读、音读,在不同状况,发不同音的情形。

除了日本以外,其他汉字使用地区仍有少数字使用多音节字,如“浬”(海里)、“嗧”(加仑)、“瓩”(千瓦)、吋(英寸)、哩(英里)等。台湾官方机构或民间均普遍使用,在大陆地区由于官方废除已不使用,但一般人也理解其意思。

注音

最早的注音方法是读若法直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。 直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。

以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以发挥注音的作用,例如“袜音韈”等。

魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以透过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合并来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。

近代以来,又发展出了仿汉字形式的注音符号及众多拉丁化拼音方式。注音符号一直都是台湾官方教学的一部分,学生在学习汉字前先要求必需掌握。而目前中国大陆最为广泛使用的是汉语拼音

由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度,必须进行专门的汉语音韵学才能推测它们在上古汉语中古汉语的发音。例如“庞”从“龙”而得声,但今日北京话前者读“páng・ㄆㄤˊ”,后者为“lóng・ㄌㄨㄥˊ”。

潘悟云和法国学者沙加尔认为:汉朝之前,某些汉字可能代表著两个音节以上的发音,即这些字具有次要音节和主要音节。

汉字与词语

汉字是汉文组成的最小单位,大半可作单字词独立表义。随著语言发展,也出现了不少两字或多字词语,近代白话尤多,大致可分为三类:

  • 同义复词:“遭遇”、“学习”(两字同义)
  • 反义复词:“胜败”乃兵家常事(两字反义,两个意思都保留)
  • 偏义复词:毫无“动静”(两字反义,只保留“动”义)

不过,准确掌握其复杂的形式和用法也成为了学习汉语的一种负担。汉语中的常用词汇约几万条,总词汇量更有上百万条,数量的庞大可能使人却步。

在古文而言,使用单字比使用词语来得精确且有效率,例如朱邦复先生就提倡精确使用“字”的复古作为。

汉字的数量

汉字由于是开放集合,数量并没有准确数字,日常所使用的汉字约为几千字。汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。

近代编集的字典收字量更高,如清朝的《康熙字典》收字47035个;台湾的《中文大字典》收字49905个;大陆的《汉语大字典》(第一版)收字54678个,(第二版)收字60370个;最新的《中华字海》收字85568个,包含了《汉语大字典》、《中文大字典》、《康熙字典》和《说文解字》的所有收字;日本的《大汉和字典》收字48902个,另有附录1062个。21世纪已出版的字数最多的是日本《今昔文字镜》,收字17万个。

20世纪所新创的,还有第一批简化字后跟第二批的“二简字”,其中也包括社会上不少人造的文字,不过二简字已被大陆官方废除,只有少数字在社会上流行,但现时并没有于计算机编码中被收录。

在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录正体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,总共收录70244个汉字;GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode中日韩统一表意文字基本字集则收录汉字20976个,另有六个扩展区、兼容补充、笔画和部首,总数亦高达88782个字。

初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。过去在汉字组成基本因子(前述字根部件)研究与教学上落后,造成学习上必须逐字学习难以举一反三,汉字数量越多学习越困难,组建新字的风气日趋保守,也没有相应的资讯处理技术,于是有许多单一的汉语意义是以词表示,例如常见的双字词,所以近代书写的发展多朝向造新词而非造新字。

汉字字位数量

汉字字位(或者叫“字素”、“字种”)是指将同一个字的不同写法(正体字、简体字、二简字、异体字、新字形、旧字形、讹字、缺笔字等)计算为同一个字,而不是分别计算为不同的字。例如:“够”和“够”被视为同一个汉字的不同字位变体,而不是两个汉字。这一计算方法与英文类似,A与a写法不同,但只是一个字母,英语一共26个字母,而不是52个。

依据中华民国教育部《异体字字典(第六版)》,汉字正字为29,921字,异体字为74,407字,另有待考字2,002字,[8]但是以上不含85字[9]和制汉字255字[10]朝鲜汉字,故(不计中日韩以外)汉字字位数为30,261字。近代编纂的字典所收的字越来越多,实际上增加的绝大多数是字位变体而不是字位。例如,收字42,174个的《康熙字典》仅仅比收字85,568个的《中华字海》少1,000个左右的字位。[11]

常用字

 中国大陆

国家语言文字工作委员会于1988年颁布的《现代汉语常用字表》收录3,500字(2,500个常用字,1,000个次常用字),适用于中华人民共和国

2007年中国语言生活状况报告里,在10.07亿汉字的语料上,进行汉字使用情况数据调查,结果为:595字数的覆盖率达到80%,964字数的覆盖率达到90%,2394字数的覆盖率达到99%。[12]

山西大学计算机科学系受国家语言文字工作委员会委托,抽样统计200万字的材料,检测《现代汉语常用字表》收字的使用频率。结果是:2,500常用字覆盖率达97.97%,1,000次常用字覆盖率达98.49%,合计共3,500字覆盖率达99.48%。

香港

香港教育署于2000年颁布的《常用字字形表》收录4,759字,适用于香港

22x20px 中华民国

1979年,中华民国教育部颁布的《常用国字标准字体表》收录4,808字,适用于台湾

 日本

日本内阁于1946年颁布《当用汉字》,收录1,850汉字;文部省国语审议会(今文部科学省文化审议会)于1981年颁布《常用汉字》,收录1,945汉字,取代《当用汉字》。依《常用汉字》,1006个汉字在小学教授,939个在中学中教授,共计1,945个。2010年11月30日追加196个新的常用汉字,并削除5个汉字,合计共2,136字。

自1975年,日本汉字能力检定协会推出日本汉字能力检定,测试日本人对汉字的掌握。直至2007年,共2,716,711人考核。成绩分为12级,由最高至最低排列分别为:1级、准1级、2级、准2级、3级、4级、5级、6级、7级、8级、9级、10级。

多数日文汉字为一字多音,每个汉字在不同的词汇中有不同的发音,日文汉字会比中文汉字困难许多。

 韩国;zh-hk:南韓

汉文教育用基础汉字是韩国教育中规定的标准汉字,皆为与正体字大致相同的韩文汉字。于1972年8月16日公布,数量约1,800字,在中高等院校进行普及。

笔画最少与最多的汉字

原图链接汉字:笔画最多的汉字

最简单的汉字只有一笔画,但却不止一个字:除了“一”字以外,“乙”、“〇”、“丶”、“丨”、“亅”、“丿”、“乀”、“乁”、“𠄌”、“𠃋”、“𠃉”、“𠃊”、“乚”等都是汉字,而且都有各自的读音。

中文汉字中,笔画最多的汉字可能是“见右图”,是一种面食的名称,此字至今习用,其不同写法的笔画数在54至71画之间不等。被传统辞典收录的笔画最多的汉字为《字汇补》、《汉语大字典》中由四个“龙”字组成的“long|𪚥|由四个“龙”字组成”字,共64画;同样属于64划的字由四个“兴”字组成的“𠔻”字,收入自《中文大辞典》;之后的是由四个“雷”字组成的“䨻”字,有52划,收录于《说文解字》。

另外,日本汉字收录于日本的TRON计划中,但此字无法提供有效证据表明其确有使用,因此状况存疑。该字由3个“龙”字和3个“云”个组合而成,共有84划[13]。该字曾提交到当时的统一码扩展C区,编号为JMK66147,后因扩展C区的时间原因被安排到了扩展D区,之后因找不到合适证据被撤销[14]。最后提交到扩展G区并被接受。

汉字文化

衍生文字

汉字书写体系是世界上最主要的基础文字之一。在汉字的影响下,产生了许多文字。

契丹文女真文西夏文的创制受到了汉字的影响,它们跟汉字一样都是方块型文字,笔画形状也极其类似,也采用类似六书的造字法。但这些文字除个别字与汉字外形相同外,绝大部分字形都跟汉字不同,因此在Unicode中它们都是独立区块编码的。

古壮字(方块壮字)、古白字(方块白字)、古布依字(方块布依字)、字喃等文字可以说是汉字在其他语言中的扩充,因为它们很大一部分本身就是汉字(赋予新义),另一些则是用已有汉字偏旁组合构成新字,因此,这些文字的外观上与汉字很相似,在Unicode中与汉字一道编入汉字区。

女书是用于记录汉语的另一种文字,它们的造字法与六书有部分相似之处,但字的外观与汉字差异较大,Unicode中作为独立区块编码。

以上文字都因各种原因而消亡,如今除专家学者外无几人能识。

日语的假名仮名)是由汉字的草体、简笔演变而成的。朝鲜半岛使用的谚文在创制时深受汉字影响,将数个音素堆叠为一个方块的写法明显是在模仿方块汉字。[原创研究?]谚文和日语假名一样可以和汉字一同混写。

此外如蒙古文满文锡伯文等也是在汉字书写方式和书写工具的影响下,将从右向左书写的源自察合台文的书写方式改为从上到下书写,文字的结构也随之有所变化。

汉字文化圈

汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言、甚至语言都使用汉字作为共同书写体系。在古代日本朝鲜半岛越南琉球群岛,以及位于婆罗洲兰芳共和国,汉字都曾是该国正式文书的唯一系统,因而汉字在历史上对文明的传播分享有著重要作用。

由于汉字和发声的联系不是非常密切,比较容易被其他民族所借用,如日本、朝鲜半岛和越南都曾经有过不会说汉语,单纯用汉字书写的历史阶段。汉字的这个特点对于维系一个文化圈—一个充满各种互相不能交流的方言群体的民族——发挥了主要的作用。

汉字对周边国家的文化产生过巨大的影响,形成了一个共同使用汉字的汉字文化圈,在日本越南朝鲜半岛琉球群岛,汉字被融合成它们语言的文字“汉字(かんじ)”、“汉字(한자)”、“汉字(hán tự)”。直到现在,日语中仍然把汉字认为是书写体系的一部分。在北韩越南,已经完全不再使用汉字;在韩国,汉字的使用在近几十年来越来越少;但是由于朝鲜语/韩语中使用了大量的汉字词汇,并且重音现象严重,所以在需要严谨表达的场合时仍然会使用汉字。虽然在通常情况下人名、公司机构名称等均使用韩文书写,不过大多数的人名、公司机构均有其对应的汉字名称。

日本

汉字于公元3世纪经朝鲜半岛辗转传入日本。二战后日本开始限制汉字的数量和使用,颁布了《当用汉字表》及《人名用字表》等,其中简化了部分汉字(日本新字体),不过文学创作使用的汉字,并不在限制之列。日本除从中文中传入的汉字外,还创造和简化了一些汉字,如“”(十字路口)、“栃”、“峠”(山道)和“広”(广)、“転”(转)、“働”(劳动)等。

朝鲜半岛

公元3世纪左右,汉字传入了朝鲜半岛,朝鲜语/韩语曾经完全使用汉字来书写。相传薛聪在当时发明了吏读,把朝鲜语用同音或同义的汉字来表示。例如:“乙”字被用来表示韩语中的后缀“-l()”。由于有不少发音都没有对应的汉字,所以朝鲜半岛的人民又运用组字法,把两个或多个汉字合组成为一个新的吏读字。相传后来的契丹文就是受到吏读字的影响。此外尚有乡札口诀等以汉字表记朝鲜语的方法。

1443年,朝鲜世宗大王颁布《训民正音》,发明了谚文与汉字一起使用,但当中有不少部件仍然有昔日吏读字的痕迹。现在的大韩民国虽禁止在正式场合下使用汉字,并停止了在中小学中教授汉字(但是从2011年开始,大韩民国李明博政府已经决定将汉字重新纳入中小学的课程里),不过汉字在民间仍在继续使用,且可以按照个人习惯书写,但是现在能写一笔漂亮汉字的韩国人越来越少。朝鲜民主主义人民共和国于1948年废除了汉字,仅保留了十几个汉字(参见废除汉字)。

越南

公元1世纪汉字便传入了越南越南语也曾完全使用汉字做为书写用文字,并在汉字的基础上创造了喃字,但是由于书写不便,汉字仍是主要的书写方式。

1945年越南民主共和国成立后废除汉字,使用了称为“国语字”的拼音文字。现在的越南文已经看不出汉字的痕迹了。

汉字民俗

中国许多民俗都与汉字有关,例如:

  • 射虎:就是猜灯谜,也叫打灯虎,与汉字有著密切关系。旧时的射虎大致可以分成两类,一类是文人射虎,谜面深奥、谜格复杂多样、谜底多为四书五经中的原句;一类是市井灯谜,谜面谜底均很通俗。射虎是元宵节的一项重要活动。
  • 合文中国民间常将一些带有吉祥含义的短语合写为一个字,以祈求吉祥,常见的合文如“招财进宝”、“囍”(双喜)、“黄金万両”等。
  • 谐音字:华人喜欢利用汉字的同音特点用谐音字取吉祥之意,比如蝙蝠的“蝠”谐音为幸福的“福”,于是庙宇中常见石柱刻有蝙辐。而走兽的“兽”亦谐音为“寿”。
  • 九九消寒图:中国北方地区的一项民俗在每年数九的季节写下“庭前垂柳珍重待春风”九个双钩字,这九个字每字九划,从冬至开始每天根据天气为一个笔画填充颜色,到数九结束完成全图。
  • 花鸟字:一些民间艺人用一些花卉和禽鸟的图案拼写成汉字,近看细节是一些花鸟画,远看整体却是一幅字,这种字画结合的艺术形式被称作花鸟字,是一种多彩花鸟虫鱼组合书法。在中国,只有在春节庙会中,和一些节日集会中才可以看到。花鸟字在英美等西方国家也成为一种街头艺术。早期的鸟字画大多写的是一些吉祥话语,以祈求吉利,现在在庙会见到的鸟字画则以书写顾客的姓名为主,购买者的目的也由祈求吉祥逐渐转变为猎奇。
  • 测字:一种以求测者抽出汉字或写下汉字,再由相命者利用汉字的形、音、义、部件、增笔、减笔、拆合等,甚至凭据书写时的笔势、墨的浓淡、当时环境等因素作出命相的解释或论断吉凶。

汉字艺术

汉字独特优美的结构,书写的主要工具——毛笔有多样的表现力,因而产生了中文独特的造型艺术——书法。而篆刻是和书法相关的艺术,用刀在石材上雕刻出篆字作为印章,尚有勒石、山壁题字等。

字体

同一个汉字,可以有不同的字体。当前汉字字体主要有篆书隶书草书行书楷书等。

汉字变化

造字

汉字历史上是不断在组新字的,目前的各种汉字并非同时定型于某一年代,而是应时代需要逐渐发展而来的。例如:“人”字在商朝就已出现,“凹”字和“凸”字则是在唐朝才出现的。

此外不同的行业也会因用字需求而造字。例如:中国的传统音乐在记谱上会使用减字谱工尺谱

拉丁化

自十九世纪中叶后,亚洲和西方都发布了很多汉字拉丁化方案,如:

现在,汉语拼音方案是使用最广且被联合国接受的汉字拉丁化方案。而威妥玛拼音历史悠久,至今仍用于台湾的人名、地名拼写。

异体字整理

汉字中存在许多异体字,它们的意义和读音完全相同,只是写法不同。异体字的产生部分是由于历史原因,有的则是人为造字,如“和、和、龢”、“秋、秌、龝”等。

台湾也有使用所谓的异体字,例如“台”与“台”、“体”与“体”以及“学”与“学”等等。

中国大陆于1956年公布整理异体字表,废除了大量异体字,但后来因为各种原因恢复了部分异体字。如“于”曾被当作“于”的异体字废除掉,但在1988年发表的《现代汉语通用字表》中又恢复成为规范字,因为姓氏中“于”和“于”同时存在,不宜合并。另外,不同地区对异体字的取舍有所不同,例如:韩国就以汉字各种异体字中最早出现的样式为标准写法。所以,在韩语汉字的标准中,取“甛”而不取“甜”、取“幇”而不取“帮”、取“畵”而不取“画”。

计算机处理

由于英文文字是由26个字母排列组合而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上汉字虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量过多,这样不但不能达到简化输入的目的,反而显得更为繁琐。于是从汉字字音上去考虑,汉字输入被分成少量的语音元素组合排列,反而可以达到简化输入的步骤。因为是语音输入对汉字的读音必须清楚,某些生僻字或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。

由于打字机键盘是为欧美文字设计的,在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。

随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。目前中文输入法有上千种之多,主要包括表音输入和表形输入两类,也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。

如收录数千字的GB 2312(中国大陆)、Big5CNS 11643(台湾)、HKSCS(香港)、JIS(日本)、KS X 1001(韩国)、KPS 9566(朝鲜),以及收录两万多字的GBK(中国大陆)、国际标准UnicodeISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。

中国政府为了解决邮政户籍整理等的用字需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。后又发布了GB 18030-2005再次进行扩充,添加了42760个汉字。

汉字编码

为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。

  • 国标码在中国大陆使用。GB 2312收录6763个汉字,GBK收录20912个汉字,最新的GB 18030-2005收录70244字(其中包括大量的东亚文字)。中国大陆官方要求在中国大陆出售的软体必须支持GB 18030编码。
  • Big5码。收录13053个汉字。在台湾、港澳地区使用的一字节或两字节编码。
  • Unicode:在国际通信化和软体设计领域,中日韩统一表意文字编码收集了汉语日语朝鲜语/韩语中的汉字集。
  • 宋体-方正超大字符集。2002年由微软开发,包含GB18030-2000字符集、CJK Ext-B中的36862个汉字,共计64395个汉字[15]。并提供了增强型区位码输入法[16]。宋体-方正超大字符集支持这个字符集的显示。

动态造字

随著计算机技术的不断发展,汉字的输入方式越来越多样化、速度越来越快,并且这项技术仍在不断提高。

经过数十年的研究,很多人研究出动态造字这新兴技术,即借由资讯科技重新解放汉字原有的生命力:任何汉字都可以由基本的百来个字根(也就是汉字的字母)以二维编码的方式即时合成为汉字。

简单的理解,就以前面的“中央处理单元”来说,可以用“形声”的原则创造一个新的“单字”:“芯片”,既有效率,且本身表意,学过百来个字根的,就可以知道它代表甚么,再赋予一个读音(通常与“心”同音),如此这般以此类推,就可以一次解决汉字形音义、以及成本高的等等问题,使汉字与西文站在同样的资讯平等点,甚至因表意的特性,比起西文更占新时代资讯处理的优势(比较好做电脑理解)。

随著新的科学技术的爆炸性进步与发展,在一个语言正常发展的情况下,描绘新发现的情状的词汇也会不断发展。比如英文,其词汇数量即不断地发展、增长,但英文词汇也越来越多,很多词汇也越来越难记,甚至某些词汇已成为专业人士的专利,普通人难以触及;而反观中文,任何一个抽象的英文词汇都可以借助常用汉字轻松的转换为中文词,大部份民众只要晓得常用汉字,基本可以阅读科普书籍。由于汉字是表意文字,因此很多科学术语通过形象的汉字,可以让外行人一眼就能看出其所表达的意思。

汉字词汇更新的实例

化学领域,尤其需要大量描绘微世界的新词,因此化学学科汉字更新的情况最为显著。 化学名词曾用了“形声、会意造字法”,造了一系列的新字,很多是将两个字的字根组合,以表示新的意义的字,其发音也是原来两字发音之组合(反切法)。例如:

  • “烃”(tīng):碳(t-)、氢(-īng)
  • “羰”(tāng):碳(t-)、氧(-ang)
  • “巯”(qíu):氢(q-)、硫(-íu)
  • “羟”(qiǎng):氢(q-)、氧(-ǎng)
  • “烷”、“烯”、“炔”:则为“形声兼会意”字,声旁分别取自“完”、“稀”、“缺”,并且用来表示其不同程度的饱和状态

繁简体汉字的比较

  • 繁体字:由中国自古承袭演变的文字,优点是单一字内含意深远,缺点则是笔画较多,标准写法的书体书写速度较慢。
  • 简化字:相对于传统汉字,是简化程度比较大的,废除且合并了很多字,也简并了很多的部件,优点是书写容易、快速,缺点是有时难以精密用字,辨识困难,导致同义词增多,例如:“头发黑”,一般理解成“头髮黑”,另一种则为“头发黑”。

除了大陆使用的简化字外,日本与韩国也分别对汉字进行了简化。在台湾,官方用字或正式文书必须使用正体字;在手写的非正式文书中,有些人会使用行书草书或民间的俗写,例如:“台”(台)、“门”(门)、“与”(与);但是,不会使用简化字中较难辨识字意的合并字,例如:“里”(裡、里)、“后”(后)、“余”(馀)、“制”(製)、“面”(麵、麪)、“谷”(穀)、“复”(复、複)、“台”(台、檯、颱),皆不简化。

注释

参考文献

引用

  1. Sawndip Sawdenj (古壮字字典; [Dictionary of Ancient Zhuang Characters]), Guangxi Ethnicities Publishing (广西民族出版社), 1989. ISBN 978-7-5363-0614-1.
  2. “汉字(Kanji)”一词首先用于日本,又称真名(Mana),用来区别日本后起文字假名(Kana)之用。中国原称“国字/中文字”,后来拼音通行后为了区别罗马字(汉语拼音),借用日本“汉字”一词以示区别。(何群雄/2001《汉字在日本》)
  3. 关键词:甲骨文
  4. 春秋战国纷争和民族融合[失效链接]普通高中标准实验教科书《历史》必修一、必修三,人民教育出版社。
  5. 林西莉 著,李之义 译:《汉字的故事》,猫头鹰出版社出版。ISBN 978-986-7415-89-9
  6. 裘锡圭,《文字学概要》,1988年,商务印书馆
  7. 《汉字的故事》 林西莉著,李之义译,猫头鹰出版社出版。ISBN 978-986-7415-89-9
  8. 中华民国教育部异体字字典编辑略例
  9. 异体字字典日本特用汉字表编辑说明
  10. 异体字字典韩国特用汉字表编辑说明
  11. 汉字字位学. [2013-04-23]. (原始内容存档于2016-02-01). 
  12. 2007中国语言生活状况报告
  13. tron
  14. 2018年6月提交 |bot=InternetArchiveBot |fix-attempted=no
  15. 汉典
  16. 尉迟治平,汤勤,论中文字符集、字库及输入法的研制. 语言研究 2006年9月第26卷 第3期