本文结合中文的特点,从建模编码、自适应索引扩位和最大索引位长等方面对LZSS 算法进行了修改,得到的LZSSCH 算法对以中文为主的中西文混合文本文件的压缩比平均与LZSS 算法高出约8 % ,而其压缩和扩展速度以及可执行程序的大小均与LZSS算法相当。算法无须任何预处理,还可用于压缩其它非拼音文字文本文件。
Abstract
According to the characteristics of Chinese ,LZSS has been modified in it s modeling and coding ,in adaptive index bit s extension,and in the greatest index bit s to get LZSSCH. The average compression ratio of LZSSCH to Chinese tect is about 8 % higher than LZSS's.Both compressing and expanding speed ,the sizes of executable program are alike. Besides ,any preconditioning is unnecessary ,and this method can be used to compress other non -alphabetic writing text files too.
关键词
数据压缩 /
中文 /
文本 /
LZSS算法
{{custom_keyword}} /
Key words
Data compression /
Chinese /
Text /
LZSS
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[ 1 ]Ziv J ,Lempel A. A universal algorithm for sequential data compression. IEEE Trans. on Information Theory ,1977 ,23 (3)
[2 ] Terry A. Welsh. A Technique for High2Performance Data Compreesion. IEEE Comquter J une 1984
[3 ]徐秉铮,吴立忠,中文文本压缩的LZW算法,华南理工大学学报(自然科学版) 1989 ,17 (3)
[4 ]贺前华,黎秉铮,彭磊,中文文本压缩的自适应算法,中文信息学报,1993 ,7 (3)
[5 ]候阳,数据压缩的原理及应用,北京:学苑出版社,1994
[6 ]吴乐南,数据压缩的原理及应用,北京:电子工业出版社,1995
[7 ]王忠效,姜丹,关于Lempel - Ziv77 压缩算法及其实现的研究,计算机研究与发展,1996 ,33 (5)
[8 ]吴军,王作英,汉语信息熵和语言模型的复杂度,电子学报,1996 ,24 (10)
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}