本文根据汉字内码特点,提出一个适合汉字信息处理用的汉字动态散列分组查找算法。该算法采用简单的异或散列函数将汉字进行分组,组内取链式结构顺序查找。由于散列均匀,其渐近时间复杂度为O (1) 。
Abstract
Based on the analysis of machine codes for Chinese characters ,this paper proposed a dynamic hashing algorithm for quick search of Chinese characters ,which adopt s simple xor operation to disperse all the probable Chinese characters into 256 groups equally and follows a linear search within each group. Experiment s show that the algorithm is of practical value and it s asymptotic time complexity is O (1) .
关键词
汉字查找 /
散列查找 /
散列函数 /
自适应散列查找
{{custom_keyword}} /
Key words
Search of Chinese characters /
Hashing /
Hash function /
Adaptive hashing
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1 ] 周建钦等,关于汉字的两个分组查找算法,中文信息学报,第9 卷2 期,1995
[2 ] 唐策善,黄刘生,数据结构,中国科学技术大学出版社,1992
[3 ] Peter ,K. P. Fast hashing of variable - length text st rings ,CACM ,June 1990
[4 ] 林亚平,异或哈希算法查找中文词组性能评价,中文信息学报,第9 卷1 期,1995
[5 ] 严蔚敏,吴伟民,数据结构,清华大学出版社,1992
[6 ] 北京语言学院语言教学研究所,现代汉语频率词典,北京语言学院出版社,1986
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}