汉字总量递代累增
纵观汉字发展史,汉字的总量在不断扩容而常用字量趋于稳定,两条主线并行不悖,共同演绎着中华文化的千年字脉。汉字数量知多少?至今无人能说出确切的数字,但历代编纂的字典辞书,较为清晰地勾勒了汉字总量变迁的历史脉络。
东汉许慎撰《说文解字》,首次对汉字数量做出统计,它收正篆“九千三百五十三文,重一千一百六十三”。在此之后,人们依据《说文》对汉字的解构,创制了大量汉字,绝大多数存入了历代编纂的字书。晋代《字林》收12824字,南朝(梁)《玉篇》收16917字,宋代《类篇》收31319字,明代《字汇》收33179字,清代《康熙字典》收47035字,现代《汉语大字典》收54678字、《中华字海》收85568字,而2018年出版的《汉字海》收102434字,成为迄今收字数量最多的字书。可见从古到今,汉字总量在不断增加,而新增汉字成了解码时代社会风貌的符号密钥。
新增汉字是生产生活发展的记录。如甲骨文“幺”“糸”本为一字,《新甲骨文编》“幺”部收2字,“糸”部收12字,《说文》“幺”部收2字,而“糸”部收正篆达248字,数量剧增,一定程度上反映了先秦缫丝纺织的快速发展。再如,甲骨文“车”字异形较多,但实为1字,《新甲骨文编》列入“车”部者也仅3字,而《说文》“车”部收正篆达99字,其中单表示车的种类的字有21个,表示车的部件的字多达48个,展现了先秦时期车的迅猛发展与车文化的快速繁荣。
图1
新增汉字是先民认知观念的容载。如“牛”在古代农业生产、交通运输、宗教祭祀等方面扮演着极其重要的角色,《说文》:“牛,大牲。”又:“【图1】,二岁牛。”“犙,三岁牛。”“牭,四岁牛。”“牛”的不同年岁都被区别而造了专字,体现了先民对“牛”的细微认知。再如“曌”字,为武则天称帝期间所创,《旧唐书》载:“则天皇后武氏,讳曌。”上部为“日+月”,下部为“空”,取“日月当空,普照天下”之意,作为新造字,其构形与武周对权力的认识密切相关。
新增汉字是民族文化交融的产物。中古时期,政权更迭频繁,经济发展迅速,文化交融激烈。在与北方游牧民族和西域交流中,一些新事物被引入中原,如“琵、琶、葡、萄、狮、猩”等字应运而生。特别是佛经翻译中,新造了诸如“咒、萨、塔、魔、拐、僧、唵、吽、伽、梵”等一大批字,再加上传抄中产生的大量异体、俗体、讹体等,致使该时期汉字的数量急剧增加,文化的交流、交融成了中古汉字数量激增的强大推力。
图2
新增汉字是科学技术进步的见证。近代以来,科学技术快速发展,出现了大量专业术语,新造了一批专业用字。如“【图2】”,作为口腔医学领域的专用字,20世纪初由华西协合大学牙学院周少吾教授首创,其应用范围几乎涵盖了整个口腔医学,现已被确定为通用规范字;再如“熵、砼”等是物理与工程领域的新造字,“氢、砷、镁”等是化学元素的新造字。
伴随时代的发展,汉字作为满足多元化表达需求的符号感应,数量增加似乎成了一种刚需;而汉字体系的不断丰富,正展现了社会文化的发展风貌。
常用字量千年稳定
汉字总量在不断增长,但常用字量基本稳定。历代编纂的识字课本,便是常用字量千年稳定的直观标识。
春秋战国之交,《史籀篇》纂成,开创了识字课本主导的蒙学教育体系,这正与当时百家争鸣的文化景象相呼应:各家为了宣扬自己的学说,广招门徒,开馆授学,文教之风盛行。只是它已失传,收字数量未详。
秦代一统,书同文字,一批识字课本应时而制,李斯作《仓颉篇》,赵高作《爰历篇》,胡毋敬作《博学篇》,但均未能完整流传,据文献载,三者共收3300字。汉代官府重视教育,特别是汉武帝即位之后,设立五经博士,文化教育更加兴盛,识字课本相继而出,司马相如作《凡将篇》,元帝时史游作《急就章》,平帝时“扬雄取其有用者以作《训纂篇》”。这些识字课本虽多亡佚,但从流传至今的《急就章》来看,共收2016字,“分别部居”,依类归字,融识字教育与知识传授为一体,促进了文化的赓续传承。
南朝梁武帝时期,周兴嗣纂成《千字文》,其内容涵盖天文史地、飞禽走兽、农业生产、道德规范等,成为我国历史上流传最久的蒙学课本。唐宋之后,随着蒙学教育的发展和印刷术的发明,一批识字课本广为流传,其中成书于北宋初年的《百家姓》,收不重复单字504个,四言为句,句句押韵,兼顾识字教育与姓氏文化的传承,别具特色;南宋王应麟编纂的《三字经》,收不重复单字约540个,三字为句,朗朗上口,浸融有国学、史地、人文等方面的知识,独树一帜。自此,被誉为蒙学“铁三角”的“三百千”纂成,它们将识字教育与文化传承、人格修养相结合,组构了一部承载厚重民族历史文化的宝典。
新中国成立以来,人们对文化知识的需求迅速增长,汉字教学成为文教工作的重中之重。据统计,在现代汉字应用体系中,1000个常用字能覆盖92%的书面资料,2000字能覆盖98%以上,3000字已能覆盖99%以上。1988年,《现代汉语常用字表》发布,所收2500个常用字和1000个次常用字,成了现代汉字教学的依据。2022年,《义务教育语文课程标准》发布,其中《常用字表》收字也为3500个。
可见千百年来,各种识字课本虽层出不穷,但所收字数逐渐稳定于3500个左右。它们虽不能全面反映各时代汉字的应用状况,但应是相应时代知识传授和文化传承最为需要的常见字量。不可否认,中华文化的世代传承,离不开常用字量的千年稳定。
汉字数量统计与整理规范
汉字发展史,也是汉字数量的增长史。从目前对汉字数量的统计来看,即使收字最多的字书,也未囊括全部汉字。如果将各种古文字形体转写成楷书,则汉字的数量更会急剧膨胀。汉字总量的权威统计,成为信息时代新的课题。
在汉字数量累增过程中,有些字被存入历史档案,在日常生活中不再使用。然而,在现代社会,出现了部分历史汉字形体被重新启用的现象,最为典型者数现行通用规范字对古本字的重新启用。如“云”本是“雲”的古字,甲骨文就像云朵的形状,被借表“说”义后,加“雨”旁表示“云朵”之“云”,现行通用规范字则回归古体。再如“喆”,本为“哲”字异体,1955年发布的《第一批异体字整理表》已将其纳入应予淘汰的异体字,但它由两个“吉”字排置而成,左右对称,寓意美好,常被作为人名用字,因而2013年公布的《通用规范汉字表》又将其确立为规范字。这种历史汉字形体的再次启用是汉字简化的需要,也是实际应用的需要,无可厚非。
然而,对于一些生僻字的使用则需审慎对待。2024农历新年,祝福语“龙行龘龘、前程朤朤、生活鱻鱻、事业燚燚”广为流传,其中的“龘、朤、鱻、燚”等字,以及此前流行的网络热字“囧”“槑”等,都因构形独特而频频“出圈”,满足了新时期民众的多元汉字需求。无疑,类似生僻字可以“出圈”,但也要“入规”。如将“天”的异体“兲”,望形生义解释为“王八”,则有必要进行引导规范。
时至今日,汉字总量一般不会再因新造而增加。面对沉淀至今而数量众多的汉字,应做好两方面工作:
一是专业领域需做好整理研究。随着信息技术的快速发展,计算机的汉字编码与字库不断扩容,力求囊括全部汉字形体的“中华字库工程”也已启动,但打造各领域汉字随意输入取用的真正unicode编码体系,依然任重而道远;此外,对于疑难字、方言字及特殊场合专用字的整理研究,仍然是学界的重要工作。
二是普及领域需做好定量规范。定量是现代汉字规范化非常重要的工作之一,不容小觑。在信息化飞速发展的今天,应当与时俱进,通过全面整理和科学统计,确定通用规范汉字的总量及分级分类,制定教育、出版、科技等领域的用字标准,为基础教育和国际中文教育教材的编写与汉字教学提供字量依据。
汉字以其独特的身躯构筑了中华民族的精神家园,成了中华民族的文化瑰宝。在历史长河的大浪淘沙中,汉字的总量走向了浩繁而常用量渐趋稳定,这是时代的选择,也是必然之势。在此漫漫征程中,汉字始终与中华文化相依相伴、美美与共,一起肩负着续写中华文明的伟大使命。
(作者系浙江工商大学浙江省文化产业创新发展研究院研究员、人文学院教授)
来源:光明日报
作者: 雷黎明