%0 Journal Article %A 唐 伟 %A 洪 宇 %A 冯艳卉 %A 姚建民 %A 朱巧明 %T 网页中商品“属性—值”关系的自动抽取方法研究 %D 2013 %R %J 中文信息学报 %P 21-30 %V 27 %N 1 %X 商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品“属性—值”关系。该方法包含四个关键技术 1)利用商品网页标题构建领域相关的属性词包;2)基于预设分隔符细化文本节点;3)结合领域商品属性词包获取种子“属性—值”关系;4)结合网页布局信息和字符信息来筛选与构建模板。该文的实验基于相机和手机两个领域展开,获得94.68%的准确率和90.57%的召回率。 %U http://jcip.cipsc.org.cn/CN/abstract/article_1678.shtml