扩展词组数最小法的假名汉字转换

中岛晃

PDF(379 KB)
PDF(379 KB)
中文信息学报 ›› 1998, Vol. 12 ›› Issue (4) : 31-39.
综述

扩展词组数最小法的假名汉字转换

  • 中岛晃
作者信息 +
History +

摘要

本文描述了改进后的“词组最小法”、并提出了新算法。它被名为“扩展词组最小法”。重新定义了句子中词组的计算方法。为了实现此目标,从始读到句子假名的全部读入,将词库查询及语法检查的结果以“树”型数据加以保留。采用上述算法后,以假名文字为单位的变换率可达95. 8 %;以词组为单位的变换率可达88. 9 %。

Abstract

We tried to enhance a“minimumizing a sum of syllables in a sentence”and proposed a new algorithm ,named“ninimumizing a sum of syllables in a broad sense”. We redefined a way of counting syllables in a sentence. Realizing this ,we searched dictionary and checked grammatical rules and maintained into’t ree’form till the analysis for all’Yomi’were finished. In evaluating the conversion - accuracy using said conversion algorithm ,we got 95. 8 % achievement based on the count of Kana - character and got 88. 9 % achievement on the count of syllable.

关键词

词法分析 / 词组数最小法 / 假名汉字转换

Key words

morphological analysis / minimumiling a sum of syllables / Kana - to - Kanji conversion

引用本文

导出引用
中岛晃. 扩展词组数最小法的假名汉字转换. 中文信息学报. 1998, 12(4): 31-39

参考文献

1. 日经?? í ? 2 ?社《日本语处理》日经电子(1983) 。
2. 吉村,日高,吉田《使用词组数最小法的全涂写日文词素分析》信息处理学会论文,Vo1 ,24 ,No ,1 ,pp ,40 - 46(1983) 。
3. 牧野,木泽《全涂写式的分句逗书写和根据假名汉字转换———两个词组最长一致法的分句逗书写》信息处理学会论文,Vol ,20 ,No ,4 ,PP337 - 345 (1979) .
4. 斋藤裕美,河田勉《假名汉字转换算法》电子信息通讯协会,Vol ,80 ,No. 8 ,pp808 - 814 (1987)
5.长尾真监修《, 日语信息处理》p353 ,电子信息通讯协会(1984) 。
6. 日经?? í ? 2 ?社《探索下一世纪的文字处理器软件的转换方式》NIKKEI BYTE ,pp82 - 98 (1986) 。
7.佐藤雅彦《, 假名汉字转换系统》SKK,bit ,Vol ,23 ,No. 5 ,pp793 - 802 (1991) .
8. 吉村贤治等《关于日语的词素分析中的最长一致法和词组数最小法》信息处理协会NL 研究会报告,30 - 7(1982 ,3) 9. 田中穗积《自然语言分析的基础》p276 ,产业图书(1989) 。
10. 吉村贤治等《使用成本最小法的日文词素分析》信息处理学会NL 研究会资料,60 - 1 , (1987) 。
11. 久光,新田义彦《根据连接成本最小法的日文词素分析》信息处理学会第42 次全国大会演讲论文集,1c - 1(1991) 。
12. 石田晴久,木村泉,安田寿明编《文字处理机与日语处理》bit (1985) 。
13. 隈井裕之,中岛晃等《假名汉字转换用词组切分学习功能》1989 年电子信息通讯学会全国大会论文集D -26 (1989)
PDF(379 KB)

Accesses

Citation

Detail

段落导航
相关文章

/