藏文编码字符集的扩充集在Linux上的实现

张兴亮,芮建武,谢谦,程伟,吴健

中文信息学报 ›› 2007, Vol. 21 ›› Issue (2) : 122-128.
综述

藏文编码字符集的扩充集在Linux上的实现

  • 张兴亮,芮建武,谢谦,程伟,吴健
作者信息 +

A Solution to Support Tibetan Coded Character Set Extension A/B in Linux System

  • ZHANG Xing-liang, RUI Jian-wu, XIE Qian, CHENG Wei, WU Jian
Author information +
History +

摘要

国内藏文软件开发普遍使用的是基于垂直预组合字符的实现方案,但是缺乏统一的编码标准。藏文编码字符集扩充集的推出,对于国内藏文软件的标准化、国际化具有重要意义。本文通过分析ISO/IEC 10646藏文编码字符集基本集、藏文编码字符集扩充集国家标准,区分它们描述字丁的差异,分析由编码方案所导致的实现上的关键问题。最后,针对藏文扩充集B的特殊性,提出并实现了基于Linux国际化架构下支持藏文扩充集标准的解决方案。

Abstract

There lacks corresponding coded character standards which regulate the commonly used BrdaRten characters in software development. The newly shipped National standards, “Information technology—Tibetan coded character set—Extension A” and “Information technology-Tibetan coded character set-Extension B”, are of great importance to the standardization and globalization of software development in China. In this paper, the encoding methods adopted by Tibetan character set defined in ISO/IEC 10646 and Tibetan coded character set extension A/B are compared; critical problems for implementations are analyzed. Finally, for the special characteristics of Tibetan coded character set—Extension B, based on Linux I18N architecture, a reasonable solution is proposed to thoroughly support the newly shipped National standards.

关键词

计算机应用 / 中文信息处理 / 藏文字丁 / 扩充集 / OpenType / 扩充QT方案

Key words

computer application / Chinese information processing / Tibetan character set / Tibetan coded character set extension A / Tibetan coded character set extension B / OpenType / extended QT solution

引用本文

导出引用
张兴亮,芮建武,谢谦,程伟,吴健. 藏文编码字符集的扩充集在Linux上的实现. 中文信息学报. 2007, 21(2): 122-128
ZHANG Xing-liang, RUI Jian-wu, XIE Qian, CHENG Wei, WU Jian. A Solution to Support Tibetan Coded Character Set Extension A/B in Linux System. Journal of Chinese Information Processing. 2007, 21(2): 122-128

参考文献


[1] 芮建武,吴健,孙玉芳. 基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报, 2005,19(5):50-66.
[2] 江荻,周季文.论藏文的序性及排序方法[J].中文信息学报,2000,14(1):56-64.
[3] 谢谦,吴健,孙玉芳. X Window核心系统的民文支持[J]. 中文信息学报,2005,19(4):97-104.
[4] XIE Qian, WU Jian, SUN Yu-fang. Non-BMP Character Support in Linux. 27th Unicode and Internatianal Conference, Berlin, Germany. April 2005.
[5] 江荻,康才畯. 藏文的拉丁字母转写方法——兼论藏文语料的计算机转写处理[J]. 民族语文, 2006.1.
[6] 陈玉忠,俞士汶.藏文信息处理技术的研究现状[J].中国藏学,2003.04
[7] 国家质量技术监督局.GB 16959-1997信息技术-信息交换用藏文编码字符集-基本集[M].中国标准出版社. 1998年5月.
[8] 国家质量技术监督局.GB 16960.1-1997信息技术-藏文编码字符集(基本集)24X48点阵字型-第1部分: 白体[M].北京:中国标准出版社. 1998年4月.
[9] 国家质量技术监督局.GB/T 17543-1998信息技术-藏文编码字符集(基本集)键盘字母数字区的布局[M].北京:中国标准出版社. 1999年6月.
[10] The Unicode Consortium. The Unicode Standard, Version 4.1.0, defined by: The Unicode Standard, Version 4.0 (Boston, MA, Addison-Wesley, 2003. ISBN 0-321-18578-1), as amended by Unicode 4.0.1 (http://www.unicode.org/versions/Unicode4.0.1) and by Unicode 4.1.0 (http://www.unicode.org/versions/Unicode4.1.0).
[11] 胡书津.简明藏文文法[M]. 云南民族出版社, 1995.
[12] 国家质量技术监督局.信息技术-藏文编码字符集-扩充集B(审定稿)[M]. 2005.8.
[13] Owen Taylor Pango: internationalized text handlinghttp://lwn.net/2001/features/OLS/pdf/pdf/pango.pdf[EB], 2001.
[14] 契嘎·德熙嘉措,黄鹤鸣.对藏文编码字符集扩展集A的数据库研究[A].Proceedings of the International Conference on Chinese Computing[C].Singapore,2005http://www.colips.org/conference/iccc2005/papers/ICCC-05-136.pdf.
[15] 姚延栋,吴健. QT国际化文本显示机制分析[A]. 中国少数民族语言信息技术与语言资料库建设学术研讨会[C],2004年4月,北京.
[16] 董治江,吴健,钟义信. 在ICU中实现少数民族文字处理[J]. 中文信息学报,2004,18(2):66-72.

基金

国家863计划资助项目(2003AA1Z2110,2002AA001033)

517

Accesses

0

Citation

Detail

段落导航
相关文章

/