“是”字句主语和宾语的自动界定

吴云芳,段慧明,俞士汶

PDF(115 KB)
PDF(115 KB)
中文信息学报 ›› 2002, Vol. 16 ›› Issue (2) : 40-46.

“是”字句主语和宾语的自动界定

  • 吴云芳1,2,段慧明2,俞士汶2
作者信息 +

Automatic Bracketing of the Subject and Object of “是” Sentence

  • WU Yun-fang1,2,DUAN Hui-ming2,YU Shi-wen2
Author information +
History +

摘要

“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现,总结、提取了“是”字句的自动标注规则,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明,对没有逗号的句子,标注正确率可达到99%以上;对有逗号的句子,标注正确率为89%。

Abstract

“是”sentence is a special and often used sentence in mandarin Chinese. This paper examines“是”sentences in the corpus ,and presents some rules for automatic bracketing the subject and object of them. The result is agreeable :the precision is over 99% in the sentences containing no comma and 89% in the sentences containing comma.

关键词

“是”字句 / 自动标注 / 浅层分析

Key words

“是”sentence / automatic bracketing / shallow parsing

引用本文

导出引用
吴云芳,段慧明,俞士汶. “是”字句主语和宾语的自动界定. 中文信息学报. 2002, 16(2): 40-46
WU Yun-fang,DUAN Hui-ming,YU Shi-wen. Automatic Bracketing of the Subject and Object of “是” Sentence. Journal of Chinese Information Processing. 2002, 16(2): 40-46

参考文献

[1] 王力. 中国现代语法. 北京:商务印书馆,2000
[2] 丁声树等. 现代汉语语法讲话. 北京:商务印书馆,1999
[3] 郑懿德、陈亚川. 吕叔湘著〈汉语语法分析问题〉助读. 北京:语文出版社,2000
[4] 吕叔湘. 现代汉语八百词. 北京:商务印书馆,1996
[5] 孙宏林,俞士汶. 浅层句法分析方法概述. 当代语言学. 2000 (2)
[6] 俞士汶. 现代汉语语法信息词典详解释. 北京:清华大学出版社. 1998

基金

国家自然科学基金项目(69973005);国家973项目(G1998030507-4);北大985项目
PDF(115 KB)

Accesses

Citation

Detail

段落导航
相关文章

/