TSRM藏文拼写检查算法

珠 杰, 李天瑞,刘胜久

PDF(5331 KB)
PDF(5331 KB)
中文信息学报 ›› 2014, Vol. 28 ›› Issue (3) : 92-98.
少数民族语言信息处理

TSRM藏文拼写检查算法

  • 珠 杰1,2, 李天瑞1,刘胜久1
作者信息 +

The Algorithm of Spelling Check Base on TSRM

  • ZHU Jie1,2, LI Tianrui1, LIU Shengjiu1
Author information +
History +

摘要

拼写检查作为文本处理中的重要内容,在字处理软件、文字识别、语音识别、搜索引擎等领域具有广泛的应用。该文以藏文语音特性建立的字组织法为依据,以藏文音节规则为模型,提出了藏文音节规则模型(TSRM)的藏文音节拼写检查算法,并通过2组实验验证了算法的有效性。在没有考虑梵音转写藏文的情况下,拼写错误检查的准确率可以达到99.8%。

Abstract

As an fundamental issue of text processing, spelling check is implemented in a wide range of fields, such as word processing, character recognition, voice recognition, search engine. According to the word formation rule of the Tibetan voice features, the paper proposes an algorithm for spelling check of Tibetan syllable via a simplified model of Tibetan syllable rules. Results of two experiments verify the effectiveness of the algorithm. Without considering the special case of Tibetan syllables, the accuracy of spelling errors check rate reaches 99.8%.

关键词

藏文音节 / 藏文规则 / 拼写检查

Key words

Tibetan syllable / rule of Tibetan / spelling check

引用本文

导出引用
珠 杰, 李天瑞,刘胜久. TSRM藏文拼写检查算法. 中文信息学报. 2014, 28(3): 92-98
ZHU Jie1,2, LI Tianrui1, LIU Shengjiu1. The Algorithm of Spelling Check Base on TSRM. Journal of Chinese Information Processing. 2014, 28(3): 92-98

参考文献

[1] Kukich K. Techniques for Automatically Correcting Words in Text[J]. ACM Computing Surveys, 1992, 24(4): 377-438.
[2] James L P. Computer Programs for Detecting and Correcting Spelling Errors[J]. Communication of the ACM, 1980, (12): 676-687.
[3] Joseph J P. Automatic Spelling Correction in Scientific and Scholarly Text[J]. Communication of the ACM, 1984, (4): 358-368.
[4] 多杰卓玛. N元模型在藏文文本局部查错中的应用研究[J]. 计算机工程与科学, 2009, 31(4): 117-119.
[5] 刘文香. 藏文文本词校对模型研究[J]. 西藏大学学报(自然科学版), 2009, 24(2): 70-74.
[6] 安见才让. 基于分段的藏字校对算法研究[J]. 中文信息学报, 2013, 27(2): 58-64.
[7] 珠杰,欧珠,格桑多吉等. 藏文音节规则库的建立与应用分析[J]. 中文信息学报, 2013, 27(2): 103-111.
[8] 珠杰,李天瑞,格桑多吉等. 藏文音节规则模型及应用[J]. 北京大学学报(自然科学版), 2013, 49(1): 68-74.

基金

国家自然基金项目(61262058,61165013),CCF 中文信息技术开放基金项目(CCF2012-02-01)
PDF(5331 KB)

849

Accesses

0

Citation

Detail

段落导航
相关文章

/