中文文本压缩的LZSSCH算法

华强

PDF(251 KB)
PDF(251 KB)
中文信息学报 ›› 1998, Vol. 12 ›› Issue (1) : 51-57.
综述

中文文本压缩的LZSSCH算法

  • 华强
作者信息 +

THE LZSSCHDATA COMPRESSION ALGORITHM FOR CHINESE TEXT FILES

  • Hua Qiang
Author information +
History +

摘要

本文结合中文的特点,从建模编码、自适应索引扩位和最大索引位长等方面对LZSS 算法进行了修改,得到的LZSSCH 算法对以中文为主的中西文混合文本文件的压缩比平均与LZSS 算法高出约8 % ,而其压缩和扩展速度以及可执行程序的大小均与LZSS算法相当。算法无须任何预处理,还可用于压缩其它非拼音文字文本文件。

Abstract

According to the characteristics of Chinese ,LZSS has been modified in it s modeling and coding ,in adaptive index bit s extension,and in the greatest index bit s to get LZSSCH. The average compression ratio of LZSSCH to Chinese tect is about 8 % higher than LZSS's.Both compressing and expanding speed ,the sizes of executable program are alike. Besides ,any preconditioning is unnecessary ,and this method can be used to compress other non -alphabetic writing text files too.

关键词

数据压缩 / 中文 / 文本 / LZSS算法

Key words

Data compression / Chinese / Text / LZSS

引用本文

导出引用
华强. 中文文本压缩的LZSSCH算法. 中文信息学报. 1998, 12(1): 51-57
Hua Qiang. THE LZSSCHDATA COMPRESSION ALGORITHM FOR CHINESE TEXT FILES. Journal of Chinese Information Processing. 1998, 12(1): 51-57

参考文献

[ 1 ]Ziv J ,Lempel A. A universal algorithm for sequential data compression. IEEE Trans. on Information Theory ,1977 ,23 (3)
[2 ] Terry A. Welsh. A Technique for High2Performance Data Compreesion. IEEE Comquter J une 1984
[3 ]徐秉铮,吴立忠,中文文本压缩的LZW算法,华南理工大学学报(自然科学版) 1989 ,17 (3)
[4 ]贺前华,黎秉铮,彭磊,中文文本压缩的自适应算法,中文信息学报,1993 ,7 (3)
[5 ]候阳,数据压缩的原理及应用,北京:学苑出版社,1994
[6 ]吴乐南,数据压缩的原理及应用,北京:电子工业出版社,1995
[7 ]王忠效,姜丹,关于Lempel - Ziv77 压缩算法及其实现的研究,计算机研究与发展,1996 ,33 (5)
[8 ]吴军,王作英,汉语信息熵和语言模型的复杂度,电子学报,1996 ,24 (10)
PDF(251 KB)

Accesses

Citation

Detail

段落导航
相关文章

/