新华网北京11月10日电(记者邰思聪)10日,由腾讯联合工信部电子工业标准化研究院、北京国家金融标准化研究院等机构共同发起的“汉字守护计划”公益行动发布一周年成果。作为该公益行动主要环节之一的“生僻字征集”小程序上线至今已有2500多万人次参与,提交生僻字16800个,但其中457个生僻字尚未获得强制性国家标准编码。为此,“生僻字征集”小程序当日上线“救字文档”功能,向公众征集上述未获得“数字身份”生僻字的相关考证资料,协助专家组加快完成考证及编码申请。
生僻字数字化是一项复杂的系统工程,每个汉字应用于数字系统,都要经历“发现、考证、编码、扩容国标、字形设计、输入显示、推广应用”等一系列环节。其中,由于汉字编码环节周期长、复杂性高,要对汉字的实际使用范围、形音义正确性、字形区别与认同等进行大量考证,涉及语言文字、文化、信息技术、标准化等多个领域,需投入大量人力查找文献古籍、搜寻实际应用案例。按照常规流程和进度估算,完成上述457个汉字的申请编码资料至少需要两年时间。
457个未编码生僻字中,地名用字328个,人名用字66个。以广东省佛山市高明区的地名用字“土㞧”(左右结构,专家初步考证音同qǐng)为例,该字用于荷城街道一乡村的名字“下长「土㞧」村”。当地居民只需拍下日常生活中该字使用的案例图片,或发现该字的使用历史、地方志等文化研究资料,上传至“救字文档”,即可助力专家收集考证资料,实现更高效的针对性考察。

工信部电子工业标准化研究院中文信息研究室主任黄姗姗表示,“此次筛选的457个未编码汉字,更多来源于各地居民的日常生活,有着很深的群众基础和鲜活的社会生命力,‘生僻字征集’小程序为‘收字’环节提供高效支撑。电子工业标准化研究院正全力优先开展此批汉字的考证工作,加快推动编码,扩容国标字库。”