引用本文:
贾彦民,吴健,欧珠,孙玉芳. 藏文支持在OpenOffice.org办公套件中的实现[J]. 中文信息学报, 2006, 20(3): 51-56,79.
JIA Yan-min,WU Jian,Ngodrup,SUN Yu-fang. Tibetan Supporting in Office Suite "OpenOffice.org". , 2006, 20(3): 51-56,79.
藏文支持在OpenOffice.org办公套件中的实现
贾彦民1 ,吴健1 ,欧珠2 ,孙玉芳1
1.中国科学院软件研究所,开放系统与中文信息处理中心 2.西藏大学工学院
Tibetan Supporting in Office Suite "OpenOffice.org"
JIA Yan-min1 ,WU Jian1 ,Ngodrup2 ,SUN Yu-fang1
1.Open System & Chinese Information Processing Center , Institute of Software , Chinese Academy of Sciences 2.Engineering School , Tibet University
摘要 办公套件是人们日常应用最为广泛的信息处理软件之一,但真正意义的藏文办公套件至今都尚未问世,成为藏文信息技术发展的“瓶颈”。开源项目OpenOffice.org的不断发展和日益成熟,为藏文办公套件的研制开发提供了有利的契机。以OpenOffice.org为源代码基础,采用藏文编码字符集(扩充集A)国家标准,研制的藏文办公套件可支持藏文排版习惯和藏文本地环境,着重解决了藏文文本自动断行的问题,能够满足藏语文用户日常办公需要。
关键词 :
计算机应用 ,
中文信息处理 ,
藏文字符集 ,
办公套件 ,
藏文信息处理 ,
文本断行
Abstract :Office suite is one of the most widely used software of information processing. Presently, there is no office suite fully supporting Tibetan, which is a main bottleneck of the development of Tibetan information technology. The open source project "OpenOffice.org" has provided a good chance for developing Tibetan Office Suite. Based on the source code of OpenOffice.org and Tibetan newly-coded character sets (Extension A) ,we have developed a Tibetan office suite supporting Tibetan typeset style and Tibetan Locale, in which the problem of Tibetan text line breaking has been solved. This office suite can meet the requirements of office automation of Tibetan users.
Key words :
computer app lication
Chinese information processing
Tibetan character set
office suite
Tibetan information processing
text line breaking
收稿日期: 2005-01-26
基金资助: 国家863计划资助项目(2003AA1Z2110);中国科学院知识创新工程方向性项目资助(KGCX2-SW-504)
作者简介 : 贾彦民(1976—),男,博士生,主要研究领域为民族文字办公套件与多语言文字信息处理.
[1] 江获,周季文. 论藏文的序性及排序方法[J]. 中文信息学报, 2000, 14 (1) : 56 - 64. [2] 林河水,程伟,等. 一种ISO14651语义的藏文排序实现方法[J]. 中文信息学报, 2000, 18 (5) : 36 - 41. [3] 达哇彭措,尕藏草. 网络媒体中藏文版式规则[A]. 见:鲍怀翘、金星华、宗成庆主编,少数民族语言信息技术研究进展:中国少数民族语言信息技术与语言资源库建设学术研讨会论文集[C]. 中国北京, 2004年4月, 84 - 87. [4] 胡书津. 简明藏文文法[M]. 云南民族出版社, 1995. [5] 国家质量技术监督局, GB16959 - 1997信息技术—信息交换用藏文编码字符集—基本集[M]. 北京:中国标准出版社, 1998年5月. [6] 国家质量技术监督局, GB/T16960.1 - 1997信息技术—藏文编码字符集(基本集)24X48点阵字型—第1部分:白体[M]. 北京:中国标准出版社, 1998年4月. [7] 国家质量技术监督局, GB/T17543 - 1998信息技术—藏文编码字符集(基本集)键盘字母数字区的布局[M]. 北京:中国标准出版社, 1999年6月. [8] Joan Aliprand, Julie Allen, Joe Becker, Mark Davis, Michael Everson, Asmus Freytag, John Jenkins, Mike Ksar, Rick McGowan, Eric Muller, Lisa Moore, Michel Suignard, and Ken Whistler. The Unicode Standard Version 4.0 [M]. Addison-Wesley, Aug 2003. [9] Unicode Standard Annex #14 Line Breaking Properties. http://www.unicode.org/reports/tr14/. [10] Unicode Standard Annex #29 Text Boundaries. http://www.unicode.org/reports/tr29/. [11] Universal I18n Framework for Office Applications. http://l10n.openoffice.org/Universal_ i18n_framework.pdf. [12] Text Element Boundary Analysis. http://oss.software.ibm.com/icu/userguide/boundaryAnalysis.html.
[1]
才智杰,才让卓玛,. 藏文字形结构分布研究 [J]. 中文信息学报, 2016, 30(4): 98-105.
[2]
黄岚,杜友福. 一种基于维基百科的中文词语相关度学习算法 [J]. 中文信息学报, 2016, 30(3): 36-45.
[3]
才智杰, 才让卓玛,. 藏文字符的向量模型及构件特征分析 [J]. 中文信息学报, 2016, 30(2): 202-206.
[4]
郝秀兰,许方曲,蒋云良. 一种中文伪评论语料半自动获取方法 [J]. 中文信息学报, 2016, 30(1): 190-198.
[5]
赵维纳,李 琳,刘汇丹,普布顿珠, 吴 健. 藏语三音动词短语自动抽取研究 [J]. 中文信息学报, 2015, 29(3): 196-200.
[6]
刘汇丹,诺明花,马龙龙,吴 健,贺也平. Web藏文文本资源挖掘与利用研究 [J]. 中文信息学报, 2015, 29(1): 170-177.
[7]
吴佐衍,王 宇. 基于HNC理论的词语相似度计算 [J]. 中文信息学报, 2014, 28(2): 37-43.
[8]
彭炜明,宋继华,俞士汶. 中文信息处理的词法问题——以句本位语法图解树库构建为背景 [J]. 中文信息学报, 2014, 28(2): 1-7.
[9]
孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔·斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根·依布拉音,刘群,刘知远. 语言计算的重要国际前沿 [J]. 中文信息学报, 2014, 28(1): 1-8.
[10]
庞宁,杨尔弘. 多种语义特征在突发事件新闻中的共指消解研究 [J]. 中文信息学报, 2014, 28(1): 26-32.
[11]
诺明花,刘汇丹,马龙龙,吴 健,丁治明. 基于中心语块扩展的汉藏基本名词短语对的识别 [J]. 中文信息学报, 2013, 27(4): 63-70.
[12]
李业刚1,2,黄河燕1. 汉语组块分析研究综述 [J]. 中文信息学报, 2013, 27(3): 1-9.
[13]
米日姑·肉孜,吐尔根·依布拉音,麦热哈巴·艾力. 维吾尔文智能输入法研究 [J]. 中文信息学报, 2013, 27(2): 98-103.
[14]
赵维纳1,2, 于 新2,刘汇丹2,3,李 琳1,4,王 磊5,吴 健2. 现代藏语助动词结尾句子边界识别方法 [J]. 中文信息学报, 2013, 27(1): 115-120.
[15]
廖祥文1,许洪波2,孙 乐3,姚天昉4. 第三届中文倾向性分析评测(COAE2011)语料的构建与分析 [J]. 中文信息学报, 2013, 27(1): 56-64.