基于变长码的面向字符文本处理方法

赵旭晟

PDF(127 KB)
PDF(127 KB)
中文信息学报 ›› 1997, Vol. 11 ›› Issue (4) : 53-60.

基于变长码的面向字符文本处理方法

  • 赵旭晟
作者信息 +

Character oriented Text Process on Variable-length Code

  • Zhao Xusheng
Author information +
History +

摘要

传统的以字节为对象的文本处理方法在今天越来越显出它的弊端。本文提出的基于变长码的面向字符的文本处理方法, 在统一编码的基础上, 将逻辑字符与它的存储方式独立开来, 并以此为单位进行文本处理。这种方式可以有效地解决汉字等多字节字符集的编辑、显示、检索的不便, 还可使字符集的容量无限扩充。本文陈述了变长码的概念与面向字符的文本处理方法的基本思想, 并以汉字处理为例给出了几个层次的实现方法。

Abstract

The traditional way of text process causes more and problems today. In this paper , we will put forword a new mothod called COTP (character oriented Text Process) which is to unify the codes in the world and then separate the logical character from its storage format , and to process text with such characters as units. This method can bring convenience to both programmers and users in editing , displaying and searchng texts in Chinese and other languages. It can also make the dimensionof character set infinite. We will first explain the VLC and COTP. and then discribe how to take advantage of COTP in several different ways.

关键词

面向字符的文本处理 / 变长码 / 逻辑字符 / 编码 / 字符集

Key words

COTP / VLC / logical characte / Coding / Character Set

引用本文

导出引用
赵旭晟. 基于变长码的面向字符文本处理方法. 中文信息学报. 1997, 11(4): 53-60
Zhao Xusheng. Character oriented Text Process on Variable-length Code. Journal of Chinese Information Processing. 1997, 11(4): 53-60

参考文献

[1] 熊圆富《汉字信息处理的难题分析与展望》,《中文信息》1995年第6期
[2]苏东庄 《汉字信息检索发展回顾》,《七四八工程二十周年纪念文集》
[3]向维良 《汉字信息技术标准化的回顾》,《七四八工程二十周年纪念文集》
[4]拉西吉格木德 《蒙古文信息处理通用系统内部码体系结构详析》,《中文信息学报》1996年第1期
[5] 刘娅芳等《全文种字处理系统的编码和输入》,《中文信息》1996年第4期
PDF(127 KB)

Accesses

Citation

Detail

段落导航
相关文章

/