编码字符集中子集的完整性

许寿椿

PDF(474 KB)
PDF(474 KB)
中文信息学报 ›› 1991, Vol. 5 ›› Issue (4) : 60-66.

编码字符集中子集的完整性

  • 许寿椿
作者信息 +
History +

摘要

本文提出编码字符集中的完整性问题。(一)中给出两类编码实例。一类严格遵从“一个字符只分配给一个码位”或“任何字符都不重复分配码位”( 简称一符一码)的节约原则。另一类以一符两码可多码的方式, 以码位的牺牲换取子集的完整性。(二)中解释了子集完整性概念和意义。说明了有意义的子集通常是现实中某子系统的反映。多文种编码字符集的许多子集往往与某自然语言系统相关联,这种子集的完整性, 也就与相应语言文字的系统性相关联。据此提出了完整性条件, 此较了完整性得失, 说明了完整性的某种相对性。(三)中指出不少字符集, 含ISO 10646 DP版及DIS版, 的一符一码原则损害了若干子集的完整性。在那里,拉丁文字圈中除英文以外的各国家、各民族的文字字符子集大多被肢解了, 只有字母表是英文字母表(含元素2X26=52个)子集者例外。斯拉夫文字圈、阿拉伯文字圈情况相似。文中指出汉语拼音字母子集, 无论在汉字编码的中国国家标准中还是国际标准10646中放严重肢解了。 本文是作者另文《字符集的序性》〔9〕的续编。本文的讨论仍除外汉文及藏文

引用本文

导出引用
许寿椿. 编码字符集中子集的完整性. 中文信息学报. 1991, 5(4): 60-66

参考文献

[1]Ruder Villsap, Basic for IBM PC, 1987
[2]GB2312-80信息交换用汉字编码字符集.基本集
[3]黄伟敏 文字信息处理有关标准简介, 载于:戴庆厦、许寿椿主编的《中国各民族文字与电脑信息处理》, 中央民族学院出版社, 出版中。
[4]黄伟敏 文字信息处理有关标准简介, 载于ACCC《中文信息处理技术进展》, 1990, 内部资料。
[5]国家语委, 简化字总表, 1986年重新发布。
[6]GB5007.1信息交换用汉字24X24点阵字符集
[7]汉语拼音方案, 见现代汉语词典附录, 商务版,1985
[8]中国社会科学院语言研究所, 现代汉语词典, 商务印书馆,1985
[9]许寿椿, 字符集的序性, 中文信息学报, 1991,No1
[10]嘎日迪等, 有关蒙文轻印刷系统的技术, 中文信息学报,1990, No2。
[11]孙文玲, 自动选型输入的维、汉、英兼容操作系统, 少数民族文字信息处理学会第四届全国学术交流会, 1988,延吉
[12]师忠孝, 维文自动选型输入方案, 少数民族语言文字信息处理学会第三次全国学术交流会,1986,乌鲁木齐
[13]电子部标准化所译ISO标准手册(9), 数据处理一软件, 中国标准出版社,1986
[14]ISO 2nd DP 10646:信息处理多八位编码字符集, 1990[15]黄伟敏, ISO/DP 10646《信息处理多八位编码字符集》简介, 计算机与信息处理标准化,1989, No3
[16]ISO/IEE DIS 10646 Information technology Universal codded character set
PDF(474 KB)

506

Accesses

0

Citation

Detail

段落导航
相关文章

/