基于ISO/IEC 10646标准的藏文编码转换的设计与实现

张青,黄鹤鸣,章登义

PDF(447 KB)
PDF(447 KB)
中文信息学报 ›› 2009, Vol. 23 ›› Issue (4) : 118-124.
综述

基于ISO/IEC 10646标准的藏文编码转换的设计与实现

  • 张青1,黄鹤鸣2,章登义3
作者信息 +

Design and Implementation of Tibetan Code Conversion Based on ISO/IEC 10646

  • ZHANG Qing1, HUANG Heming2, ZHANG Dengyi3
Author information +
History +

摘要

目前,国内少数民族地区的书报印刷行业大多使用北大方正、华光藏文排版系统。这些软件的编码各异,致使有限的藏文资源无法实现交换和共享,造成这种现象的原因是各种软件编码体系不一致。解决这个问题的根本途径是将各种不同体系的藏文编码转换为符合国际标准的编码。该文以华光Windows藏文字符编码为例,首先对每个藏文字符进行构字分析,然后采用分表分组技术构造出每个字符符合ISO/IEC 10646标准的编码序列,最后采用hash技术优化查询算法,实现非标准的藏文字符编码向标准编码序列转换。

Abstract

At present, many publishing systems, such as Bei Da Fang Zheng and Hua Guang are widely applied in the printing industry for issuing Tibetan publications in the domestic minority areas. Due to the different coding system in these systems, the valuable electronic resources for Tibetan languages cannot be exchanged and shared. This paper proposes a solution to convert Tibetan code of different system into the international standard. It further realizes such conversion system for Hua Guang windows encoding of Tibetan into the ISO/IEC 10646 encoding, with a designed sub-table&group strategy in hash.
Key wordscomputer application; Chinese information processing; Tibetan; character encoding standard; code conversion;encoding sort ; query

关键词

计算机应用 / 中文信息处理 / 藏文 / 字符集标准 / 编码转换 / 分表分组技术

Key words

computer application / Chinese information processing / Tibetan / character encoding standard / code conversion / encoding sort / query

引用本文

导出引用
张青,黄鹤鸣,章登义. 基于ISO/IEC 10646标准的藏文编码转换的设计与实现. 中文信息学报. 2009, 23(4): 118-124
ZHANG Qing, HUANG Heming, ZHANG Dengyi. Design and Implementation of Tibetan Code Conversion Based on ISO/IEC 10646. Journal of Chinese Information Processing. 2009, 23(4): 118-124

参考文献

[1] International Standard ISO/ IEC 10646-1 Second Edition : Information technology-Universal Multiple-Octet Coded Character Set (UCS)[R]. 2000.
[2] 欧珠. 在通用字符集中藏文编码模式的研究与应用[J].中文信息学报,2008,22(4):105-108.
[3] 芮建武,吴健,孙玉芳. 基于ISO/IEC 10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5): 59-66.
[4] 契嘎·德熙嘉措,当周才让. 基于信息处理的藏文字的结构[C]//民族语言文字信息技术研究——第十一届全国民族语言信息学术讨论会论文集,北京:西苑出版社. 2007: 164-173.
[5] 江荻,周季文. 论藏文的序性及排序方法[J]. 中文信息学报, 2000, 14(1): 56-64.
[6] 尚展垒,陈慧,宋于伟. 一种改进的查询优化技术——分裂大表[ J ]. 郑州轻工业学院学报(自然科学版) , 2002, (9): 62-63.
[7] 阿里甫·库尔班, 哈力木拉提·买买提.北大方正维吾尔文文本转换成Unicode标准的文本[J]. 新疆大学学报(自然科学版), 2006 ,8,23(3):343-347.
[8] 刘汇丹,芮建武,吴健. 藏文网页的编码识别与转换[C]//中文信息处理前沿进展—中国中文信息学会二十五周年学术会议论文集, 2006: 573-580.
[9] 刘涛,杨秀霞. 中国多民族文字信息处理中的Unicode编程[J]. 计算机工程与设计,2006,(11): 2021-2022.



基金

青海省重点科技攻关项目(2006-N-176)
PDF(447 KB)

732

Accesses

0

Citation

Detail

段落导航
相关文章

/