内容摘要:现代汉字是以形声字为主要构造方式的表义兼表音的文字,这种文字体系不是纯表义的,但有相当的表义功能。这种文字体系也不是纯表音的,但在很多字形中又包含着表音的成分。表义成分和表音成分在现代汉字中互相制约、互相补充,却又很不完备。
关键词:汉字;输入;语料库;汉语信息处理;部件;构造;输入法
作者简介:
现代汉字是以形声字为主要构造方式的表义兼表音的文字,这种文字体系不是纯表义的,但有相当的表义功能。这种文字体系也不是纯表音的,但在很多字形中又包含着表音的成分。表义成分和表音成分在现代汉字中互相制约、互相补充,却又很不完备。
由于我国简化了一大批汉字,现代汉字字形构造已不再纯粹按照“六书”方式,它已经明显地分成了两大类:一类仍然按照传统的“六书”方式,主要有象形、指事、形声、会意四种造字方式。其中,形声字占现代汉字总数的80一90%。但是,形声字的声旁.由于本身不是音素符号,再加上语音演变的影响,其有效表音率是很低的;形声字的形旁,由于词义的复杂性.再加上词义的不断发展,其表义功能极为宽泛、模糊而又十分有限。另一类是经过简化后不能再归入象形、指事、形声、会意四种构造方式的字。它们的构造方式有轮廓字(如“齐、变乃、符号字(如“办、邓乃、省略字(如“声、际,、草书楷化(如“专、长勺等。传统和简化这两大类所包含的构造方式的总和,就是现代汉字全部的构造类型,也就是它的全部造字方式。
现代汉字的形体可以分为三个层次:
![]()
汉字是最高层次,部件是中间层次,笔画是最低层次。如“湖”字的三个层次如下图所示:

层次越高,表示一个汉字所用的符号越少,表示全部汉字所用的符号的总数越多。如最高一层,表示一个符号只需用一个符号,如果有五万个汉字,就得用五万个符号。层次越低,表示一个字所用的符号越多,而表示全部汉字所用的符号的总数越少。如最低一层,表示一个汉字最多要用几十个笔画符号(笔画最多的汉字有64画),而笔画符号的总数可减少到横、竖、撇、点、折等有限的几种。部件处于中间层次,它是组成现代汉字的能够相对独立的结构单位,它比笔画完整,又比汉字本身简单、灵活,所需符号数目适中。







