中国常用汉字有多少个汉字?汉字编码有哪些?汉字起源的过程是什么?
来源:金融头条
•
2022-06-29 14:26:05
常用汉字有300个。
虽然汉字数量众多,甚至还有衍生字形,真要统计一个准确数字是一件困难的事情。但从商朝至今,使用最频繁、字义稳定不变的核心汉字不超过300个。这些核心汉字在任意一篇文本中,占用字数量的70%,余下29%则有2000个汉字。
而那孤独的1%则属于其他几万个汉字,其中大多数属于在文献中出现过一次或几次,或只在特定情况下才使用的“一次性”的汉字。
汉字的起源:
汉字的起源有6000余年的历史,是由零散的字符逐渐积累,到达一定体量后经过人为规范形成文字体系;演变过程可简单的归纳为声、形、象、数、理五个部分,依次顺序为甲骨文、金文、小篆、隶书、楷书、草书、行书。
汉字编码有哪些
汉字的编码体系主要有以下几种:
1、国标、区位“准国标”国标是将七千余个汉字以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行称为一个“区”,每个区有94个“位”。一个汉字在方阵中的坐标,称为该字的区位码;
2、GBK码,GB码的扩展字符编码,对多达两万多的简繁汉字进行了编码;
3、BIG5码,针对繁体汉字的汉字编码;
4、HZ码,HZ码是在Internet上广泛使用的一种汉字编码,它是以“纯国标”的中文与美标码混用为方案;
5、UCS和ISO,10646UCS是由ISO 10646定义的,是其他字符集标准的一个超集,保证与其他字符集是双向兼容的,它包含了所有已知语言的字符;
6、Unicode提供一种统一的字符标识方法,它是16位编码的,具备世界各地计算机与出版行业所用字符的全部代码。而且它的产生是以各个国家或国标字符编码为基础的。