基于形态分析的现代维吾尔语名词词干识别研究

艾孜尔古丽,阿力木·木拉提,玉素甫·艾白都拉

PDF(2255 KB)
PDF(2255 KB)
中文信息学报 ›› 2015, Vol. 29 ›› Issue (6) : 208-212.
综述

基于形态分析的现代维吾尔语名词词干识别研究

  • 艾孜尔古丽1,2,阿力木·木拉提1,2,玉素甫·艾白都拉1
作者信息 +

Morphological Analysis Based Noun Stem Identification for Modern Uyghur

  • Azragul1,2, Alim Murat1,2, Yusup Abaydula1
Author information +
History +

摘要

现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特征分析,总结词缀歧义及消解规则;该文提出研究总体思路,设计现代维吾尔语新词中名词识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等;最后将初中、高中物理维吾尔语教材作为验证对象,对名词词干进行统计与分析。

Abstract

Modern Uyghur noun stem identification is a fundamental issue in the field of natural language processing. The morphological analysis is first introduced, especially on its role in identifying the POS of words. Then this paper describes the POS scheme in Uyghur, as well as the morphological characteristics of Uyghur nouns, suffix ambiguity and the disambiguation rules. The algorithm of new nouns identification in modern Uyghur language is proposed, including feature selection (features within and between words) and parameter estimation. The experiment is carried on the corpus of Uyghur physical textbooks in junior and senior middle schools.
Key words modern Uyghur; morphological analysis; noun stems recognition
   
   
   

关键词

现代维吾尔语 / 形态分析 / 名词词干识别

Key words

modern Uyghur / morphological analysis / noun stems recognition

引用本文

导出引用
艾孜尔古丽,阿力木·木拉提,玉素甫·艾白都拉. 基于形态分析的现代维吾尔语名词词干识别研究. 中文信息学报. 2015, 29(6): 208-212
Azragul,Alim Murat, Yusup Abaydula. Morphological Analysis Based Noun Stem Identification for Modern Uyghur. Journal of Chinese Information Processing. 2015, 29(6): 208-212

参考文献

[1] 赵岩,王晓龙,刘秉权,等.融合聚类触发对特征的最大熵词性标注模型[J].计算机研究与发展,2006,43(2):268-274.
[2] 赵伟,赵法兴,王东海,等.一种基于改进的最大熵模型的汉语词性自动标注的新方法[J].计算机研究与发展,2006,43(增刊):174-178.
[3] 玉素甫·艾白都拉,张海军,艾孜尔古丽.信息处理用现代维吾尔语词干类标记集研究[J].信息技术与标准化,2011:45-48.
[4] 艾孜尔古丽,努尔艾合买提,玉素甫·艾白都拉.现代维吾尔语常用词统计关键技术研究[J].中文信息学报,2014,28(5):192-197.
[5] 艾孜尔古丽,艾山江·阿不力孜,玉素甫·艾白都拉.现代维吾尔文网络媒体用词研究[J].计算机应用与软件,2012,29(2):67-68,121.
[6] 艾孜尔古丽,齐向卫,玉素甫·艾白都拉.基于网站用词调查的现代维吾尔语词干提取和应用研究[J].计算机应用与软件,2012,29(3):32-34.
[7] 玉素甫,艾孜尔古丽.基于网站用词调查的现代维吾尔语词尾切分和应用研究[J].计算机应用与软件,2012,29(4):13-15.
[8] 玉素甫,艾孜尔古丽,祖力皮亚.基于网站用词调查的现代维吾尔语词长研究[J].计算机应用与软件,2012,29(5):32-34.
[9] 苏新春.汉语词汇计量研究[M].厦门大学出版社,2001.
[10] 苏新春,杨尔弘.2005年度汉语词汇大规模统计的分析与思考[J].厦门大学学报,2006,6:84-91.
[11] 赵小兵.基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D].中央民族大学博士学位论文,2007.

基金

新疆维吾尔自治区自然科学基金(2014211A045);新疆维吾尔自治区哲学社会科学研究规划基金(14CYY093);教育部人文社会科学一般项目(14YJC740001);新疆维吾尔自治区高校科研计划青年教师科研启动基金(20140706213103147);国家自然科学基金(61132009,61262066);国家社科基金(14AZD11)
PDF(2255 KB)

672

Accesses

0

Citation

Detail

段落导航
相关文章

/