%0 Journal Article %A 吾买尔江·买买提明 %A 古丽尼格尔·阿不都外力 %A
买合木提·买买提 %A 卡哈尔江·阿比的热西提 %A 吐尔根·依布拉音 %T 乌兹别克语词干提取算法的比较研究 %D 2020 %R %J 中文信息学报 %P 45-50 %V 34 %N 1 %X 黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大。现有的乌兹别克语词干提取任务仍依赖基于规则的方法,且实验效果不太理想。该文将乌兹别克语词干提取任务视为序列标注问题进行处理,以字符为最小单位进行切分,分别构建了基于条件随机场(CRF)和门控循环单元网络(Bi-GRU)的乌兹别克语词干提取模型。实验结果表明,基于序列标注的乌兹别克语词干提取模型与基于规则的方法相比不仅降低了人工成本,而且在性能方面有较为显著的提升。 %U http://jcip.cipsc.org.cn/CN/abstract/article_2891.shtml