汉字自适应散列分组查找算法

王忠效,范植华

PDF(321 KB)
PDF(321 KB)
中文信息学报 ›› 2001, Vol. 15 ›› Issue (2) : 17-23.

汉字自适应散列分组查找算法

  • 王忠效,范植华
作者信息 +

Adaptive Hashing of Chinese Characters

  • WANG Zhong-xiao,FAN Zhi-hua
Author information +
History +

摘要

在文献[1]的基础上,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序,算法的平均查找长度成倍缩短,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时间性能的要求。此外,提出了一个与文献[1]相比计算量更小、散列效果相当的散列函数。

Abstract

Based on a previous algorithm proposed in [1] ,this paper addressed an adaptive hashing algorithm of Chinese characters.By introducing an oblivious policy and sorting Chinese characters in accordance with their dynamic frequencies ,the algorithm made important improvements on the average search length of Chinese characters ,which could better guarantee the strict demand on time of any application driven by the dyanmic statistics of Chinese texts. In addition ,a simpler hash function was given which sorked almost the same as the one in [1].

关键词

汉字查找 / 散列查找 / 散列函数 / 自适应散列查找

Key words

search of Chinese characters / hashing / hash function / adaptive hashing

引用本文

导出引用
王忠效,范植华. 汉字自适应散列分组查找算法. 中文信息学报. 2001, 15(2): 17-23
WANG Zhong-xiao,FAN Zhi-hua. Adaptive Hashing of Chinese Characters. Journal of Chinese Information Processing. 2001, 15(2): 17-23

参考文献

[1] 王忠效,范植华. 汉字异或动态散列分组查找算法,中文信息学报, 1998 ,12 (4) :60 - 65
[2] 跨世纪的中国信息产业. 北京:人民邮电出版社,1999
[3] 王忠效,范植华. 动态字母表算术编码,软件学报(录用待刊)
[4] 王忠效,范植华. 汉语文本动态字母表0阶模型算术编码. 中文信息学报,2000 ,14 (1)
[5] 北京语言学院语言教学研究所. 现代汉语频率词典. 北京:北京语言学院出版社, 1986
[6] 沈美明,温冬婵. IBM-PC汇编语言程序设计. 北京:清华大学出版社,1993
PDF(321 KB)

779

Accesses

0

Citation

Detail

段落导航
相关文章

/