在综合考虑数据库查询这一特殊性的基础上,根据查询语句中词汇对数据查询不同贡献程度分级建立分词词典;然后提出了分步- - 正向单扫描的分词方法(DSWS) ,并对该分词方法的时间复杂度进行了分析。
Abstract
We think over the specials of data ret rieving ,and build word segmentation dictionaries based on the lexicons of data ret rieve ; Then we propose the Different step - - Single scan Word Segmentation (DSWS) ,and analyze the time complexity of the segmentation algorithm. It is useful of this word segmentation based on language environment in disambiguation and word segmentation efficiency.
关键词
汉语分词 /
分词词典 /
数据库查询
{{custom_keyword}} /
Key words
Chinese Segmentation /
Word Segmentation dictionary /
Database Query
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]吴胜远,一种汉语分词方法,计算机研究与发展,1996 ,33 (4) :306 - - 311。
[2]马晏,基于评价的汉语自动分词系统的研究与实现,见:语言信息处理专论,清华大学出版社等, 1996 年4月。
[3]骆正清等,汉语分词研究综述, 见:中国青年计算机研究新进展’96 , 浙江大学出版社, 1996 , 10 :903 - -
908。
[4]孙茂松等,中文姓名的自动辨识,中文信息学报,1995 ,9 (2) :16 - - 27。
[5]关英春等,汉语文字自动统计系统CWSS ,中文信息学报,1986 (1)
[6]
[美]萨提. 巴期著,朱洪等译,计算机算法:设计和分析引论,复旦大学出版社,1985 年5 月:10 - - 57 。
[7]徐九韵,基于自然语言理解的数据库智能检索的方法研究与实现,
[硕士毕业论文] 。
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}