字体视界
按图片找字
2020
08-06
22:46
上传者

圆子

来源

未知

对于汉字库设计的想法

     字集不是越大越好,因为现存于大型字典辞书的字有一部分是历史用字,还有大量的异体字。根据使用的需要和研究的情况,对汉字的信息处理可以分为几个层次

  1、日常生活用字:(可有一个人名、地名辅助集和错字集)

  日常生活用字就是常用字,这个数字可能就在3000字左右,再加上一些次常用字,可能也就在6000字左右,当然,其中哪些是常用字,哪些是次常用字,具体的字可能要随着时代不同而发生变化。日常生活用字要求有规范性,现在进行的“规范汉字表”课题研究可能有助于此字集的确定。

人名和地名用字是一个比较特殊的问题,国家语言文字工作委员会正在进行“人名、地名规范”的研究,如果此研究成果面世,则可能有助于解决现代人的人名、地名用字问题。

此集中最好还应该有一个错字集,在早期识字教育和对外汉语教学中,经常要使用到一些错别字,别字好打,缺笔少划的错字没有办法处理,所以应特置一个错字集,有利于错别字教学的信息化与错别字的集中纠正。

  2、一般古籍整理用字:(应该有一个异体字辅助集)

  古籍用字,数量比现代生活用字多。因为历代沉积下来的异体字、死字比较多。关于这个问题,首先应该进行异体字的整理,异体字整理完成后,正体字就可以确定一个数量。为了保持古籍版本原样,古籍整理工作者和语言文字研究者也要用到异体字,所以附录一个异体字集。

  还有一个问题就是方言字,很多方言字来源于古代的字典辞书、地方韵书和方言词典,少部分来源于民间文艺作品。首先方言字有一个规范的问题,那些有本字又意义比较明确的,应该首先选用本字。如本字不明,可沿用俗字。

  3、古文字用字:(也有一个异体字辅助集)

  关于古文字,一般定义为小篆以前的文字为古文字,其中有很多字还不可识,这种情况,就首先要区分出可识字(与小篆或楷书有对应字)与不可识字,然后进行异体字的整理。并且要能为每个不可识字设计可以调用的编码,以利于检索。

  汉字库的设计,针对不同的用户与使用目的,分级分层次是很必要的。各级之中首先要全,同时要考虑各级之间正体字与异体字、繁体与简体、古文字与今字的正确对应等。

  此外,各种常用图符也可考虑收录到各级字库中,如传世古籍中出现的圈点符号、古文字中的有句读作用的符号。少数民族和外域的汉字型变体字,也可考虑单置一类,以有利于文字的比较研究。


{A446C5FD-762C-4D27-BA67-C74FA0C725C5}_20200806223941.jpg

   免责声明:该文来源上传者上传或转载,也有作者本人供稿或转载,不代表字体视界、字体资讯、本公司的观点和立场,本公司并不对其真实性负责。内容展示传播目的仅为传递更多信息供广大网友阅读与学习,丰富互联网信息。【该文如有涉及内容、文章、图片、字体侵权,请及时与我们联系下线处理。(举报邮箱:font@17font.com ;举报者请提供:姓名、电话、如涉及版权请提供版权所属证明文件),我们会在收到举报邮件后尽快给予回复,经查属实会对内容进行下线处理。】
字库品牌: 文道字库
热门资讯 / 热门问答
推荐文章