制订《信息处理用现代汉语常用词词表》的原则与问题的讨论

梁南元,刘源,沈旭昆,谭强,杨铁鹰

PDF(793 KB)
PDF(793 KB)
中文信息学报 ›› 1991, Vol. 5 ›› Issue (3) : 28-39,27.

制订《信息处理用现代汉语常用词词表》的原则与问题的讨论

  • 梁南元,刘源,沈旭昆,谭强,杨铁鹰
作者信息 +
History +

摘要

本文讨论了《信息处理用现代汉语常用词表》(以下简称《常用词表》)的制订方法。提出按照《信息处理用现代汉语分词规范》, 以定量原则为主,定性原则为辅的原则进行选词, 《常用词表》首次提出选词函数的术语, 并创造性地使用两个不同选词函数共同选词, 使所选词条均匀分布性更好:以定量为原则的收词方法客观真实地反映了社会实际用词的规律, 尽可能地避免了传统主观方法建立词典时的不足;采用联想的定性方法做为定量标准的补充, 使《常用词表》中词条更加完整避免和减小了在词频统计中由于分类、选材、抽样、分词等引起的背景干扰。《常用词表》收词规范、收词频率高、覆盖率高, 为“现代”各个时期、各个专业所通用。经验证, 覆盖率在98.5%以上。

引用本文

导出引用
梁南元,刘源,沈旭昆,谭强,杨铁鹰. 制订《信息处理用现代汉语常用词词表》的原则与问题的讨论. 中文信息学报. 1991, 5(3): 28-39,27

参考文献

[1]制订组, 信息处理用现代汉语分词规范, 第一稿至第(报批稿)七稿, 1988年至1990年。
[2]制订组, 《信息处理用现代汉语分词规范》编制说明, 1990年9月。
[3]中国社科院语言研究所词典编辑室, 现代汉语词典, 1983年, 商务印书馆。
[4]编辑委员会, 辞海, 上海辞书出版社, 1982年。
[5]编辑委员会, 《辞海》增补本, 上海辞书出版社, 1982年。
[6]编写组, 汉英词典, 商务印书馆, 1979年。
[7]汉法词典。
[8]汉月词典。
[9]标准汉英词典。
[10]常用字构词词典。
[11]列车时刻表。
[12]行政区划表。
[13]国际著名人名录。
[14]现代汉语八百词。
[15]中国地名手册。
[16]世界地名手册。
[17]汉语拼音词汇。
[18]汉语小词典。
[19]成语词典。
[20]汉英小词典。
[21]常用词语三用词典。
[22]常用汉字音形教学手册。
[23]外国哲学社会科学人名录。
[24]当代国际人物词典。
[25]世界报刊通讯社、电台译名手册。
[26]现代汉语词表。
[27]研制组, 现代汉语词频、字频统计鉴定材料, 1986年5月。
[28]北航研制组, 梁南元执笔, 现代汉语自动分词系统PC-CWSS技术报告, 1990年6月。
[29]刘源、梁南元等, 现代汉语常用词词频词典, 宇航出版社, 1990年。
[30]王还、常宝儒等, 现代汉语频率词典, 北京语言学院出版社, 1986年。
[31]北航、新华社等, 新闻语料词频统计, 1990年。
[32]北航、国家信息中心, 三百万字经济法规词频统计, 1989年。
[33]词频统计, 人民大学等。
[34]柳维专, 我国汉字信息处理技术发展现状及今后的任务, 计算机世界, 1983年3月15日。
[35]张国防, 陶沙, 信息处理用中文词库系统的理论和实践 , ICCIP'87, 1987年。
[36]张拱贵, 常用词表编制中的若干问题, 辞书研究, 1989年第6期。
[37]张社英, 王德进, 关于建立《信息处理用现代汉语通用词表》的若干问题, ISSCIP'89, 1989年3月。
[38]郑林曦等, 普通治三千常用词表, 文字改革出版社, 1959年。
[39]现代汉语新词词典。
[40]郝恩美, 语词词典如何处理语素问题, 辞书研究, 1989年第1期。
[41]吕叔湘, 汉语语法分析问题, 商务印书馆, 1979年。
[42]国家语委会汉字处, 现代汉语常用字表, 语文出版社, 1988年。
[43]华北计算技术研究所, 《信息交换用汉宇编码字符集基本集》编制说明, 1980年。
[44]信息处理用现代汉语五千词表。
[45]许欣文等, 工程实用词语库的设计学实现。
[45]张社英, BH-CWD词表、BH-86软件系统及汉语的几个统计规律, 北京航空航天大学硕士论文, 1986年。
[47]谭强, 制订《信息处理用现代汉语常用词词表》的理论和方法, 北京航空航天大学硕士论文, 1991年。
PDF(793 KB)

Accesses

Citation

Detail

段落导航
相关文章

/