国际标准ISO/DP 10646中, 把文字规定为用于书写语言的图形字符的完备集。本文作者认为, 这个完备集应该是有序完备集。词典中的词以及其它类型的字符串习惯上总按确定的顺序排列。本文讨论了英文、拉丁壮文、欧洲拉丁字母系文字、蒙文、阿拉伯文和维吾尔文、朝鲜文的序性。讨论着重于编码字符串的序性与传统词典顺序的一致性。不幸的是, 除英文外, 前述的许多文字缺少这种一致性。字符集的序性在许多编码标准中被忽视了。实际上, 除藏文外的文字, 编码字符串与传统词典序的一致性大多可以通过合理编码获得。
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]电子工业部标准化所译, ISO标准手册9:数据处理——软件, 标准出版社, 1986年。
[2]陈明源, 系统软件中的汉字字符数据类型及多字符集支持功能, 中文信息学报, Vol.3,No.2。
[3]广西壮族自治区少数民族语言文字工作委员会, 壮文规范条例汇编, 1987年。
[4]国家标准局, GB8045-87, 信息处理交换用蒙古文七位和八位编码图形宇符集, 1987。
[5]ISO/IEC, ISO Znd DP 10646, 1989。
[6]iso, iso 9036, 1987。
[7]国家标准局, GB12050, 信息处理交换用维吾尔文编码图形字符集, 1989。
[8]国家标准局, GB12052, 信息交换用朝鲜文字编码字符集, 1989。
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}