中文信息学报
       ISSN 1003-0077   CN 11-2325/N   CODEN ZXXHAU 设为首页        加入收藏
   RSS  Email Alert     
   
 
引用检索 快速检索 高级检索
 
2016年 30卷 6期
刊出日期:2016-12-15

综述
 
   
综述
1 借重于人工知识库的词和义项的向量表示: 以HowNet为例 Hot!
孙茂松;陈新雄
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题: 一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时期自然语言处理的研究重点之一。
2016 Vol. 30 (6): 1-6 [摘要] ( 1724 ) [HTML 1KB] [PDF 1362KB] ( 2093 )
7 语义角色映射为句法成分的词汇语义制约规律及特点
亢世勇;张 晨
该文以联接理论、事件结构理论为指导,进行词汇语义类、语义角色、句法成分对应关系的研究。选择人教社中小学语文课文语料,标注语义角色、句法成分及中心词的词汇语义类。在标注语料库的基础上,统计分析了词汇语义类与语义角色的对应关系,重点分析各语义类语义角色映射为句法成分的规律,并进一步总结了各词汇语义类的语义角色与句法成分的对应的特点。尽管词汇语义类、语义角色、句法成分之间存在错综复杂的关系,但还是有规律的,可以为计算机句法分析提供一些依据。
2016 Vol. 30 (6): 7-14 [摘要] ( 572 ) [HTML 1KB] [PDF 640KB] ( 883 )
15 细粒度与可视化的“比”字句分析模型及计算应用
朴敏浚;袁毓林
针对现有五元组比较句语义要素框架的缺陷,该文引进了提升语义分辨率的七元组语义要素分类模板。在此基础上建立了一个可视化的“比”字句结构分析模型,用以总结出比较对象之间的三种对应模式,并确立了判定“不对称比较”的形式标准。该文的可视化分析模型可以明确阐述“比”字句内部的多重述谓结构,有助于获取容易被忽略或认错的隐含成分及比较关系。而且,它立足于谓词逻辑的基础形式,所以与OWL本体语言相兼容。作为模型的应用实践,该文还建设了小规模知识本体(ontology),演示了“比”字句语义要素的自动识别过程。
2016 Vol. 30 (6): 15-25 [摘要] ( 470 ) [HTML 1KB] [PDF 2556KB] ( 1159 )
26 汉语未登录词的词义知识表示及语义预测
田元贺;刘 扬
在此前的汉语未登录词语义预测中,构词相关的知识一直被当做预测的手段,而没有被视为一种有价值的知识表示方式,该文在“语素概念”基础上,深入考察汉语的语义构词知识,给出未登录词的“多层面”的词义知识表示方案。针对该方案,该文采用贝叶斯网络方法,构建面向汉语未登录词的自动语义构词分析模型,该模型能有效预测未登录词的“多层面”的词义知识。这种词义知识表示简单、直观、易于拓展,实验表明对汉语未登录词的语义预测具有重要的价值,可以满足不同层次的应用需求。
2016 Vol. 30 (6): 26-34 [摘要] ( 842 ) [HTML 1KB] [PDF 1993KB] ( 1451 )
35 基于声调核参数及DNN建模的韵律边界检测研究
林 举;解焱陆;张劲松;张 微
韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。
2016 Vol. 30 (6): 35-39 [摘要] ( 672 ) [HTML 1KB] [PDF 1855KB] ( 928 )
40 面向深层语义表示的否定义表达规律探析
邱立坤;黄 焜;何保荣;亢世勇
否定义是深层语义表示中的一个重要组成部分。该文基于语料库的方法对现代汉语中的否定表达形式及其使用规律进行深入分析。首先,系统地收集否定表达形式,将之分为显性否定词、隐性否定词、否定结构三类,并讨论否定表达形式的非否定用法。其次,对否定表达形式的使用规律进行归纳与总结,涉及单动核结构、情态成分、述补结构、动词性并列结构、连谓结构、兼语结构等,重点分析多动核结构中否定对命题义的影响,并总结在深层语义标注框架下否定义的标注规则。最后,基于多领域句法树库考察否定表达形式的领域分布差异。
2016 Vol. 30 (6): 40-48 [摘要] ( 523 ) [HTML 1KB] [PDF 1466KB] ( 906 )
49 基于70年报刊语料的现代汉语历时稳态词抽取与考察
饶高琦;李宇明
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。
2016 Vol. 30 (6): 49-58 [摘要] ( 469 ) [HTML 1KB] [PDF 3049KB] ( 940 )
59 CRFs融合语义信息的英语功能名词短语识别
马建军;裴家欢;黄德根
名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题。研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题。基于名词短语在小句中的语法功能来确定名词短语的边界,选择商务领域语料,采用了细化词性标注集和条件随机域模型结合语义信息的方法,识别了名词短语的边界和句法功能。在预处理基于宾州树库细化了词性标注集,条件随机域模型中加入语义特征主要用来识别状语类的名词短语。实验结果表明,结合金标准词性实验的F值达到了89.04%,改进词性标注集有助于提高名词短语的识别,比使用宾州树库标注集提高了2.21%。将功能名词短语识别信息应用到NiuTrans统计机器翻译系统,英汉翻译质量略有提高。
2016 Vol. 30 (6): 59-66 [摘要] ( 492 ) [HTML 1KB] [PDF 848KB] ( 881 )
67 限定领域口语对话系统中的商品属性抽取
叶大枢;黄沛杰;邓振鹏;黄 强
按功能或问题域划分,商品属性抽取(product feature mining)在限定领域的对话系统中属于口语语言理解(spoken language understanding, SLU)的范畴。商品属性抽取任务只关注自然文本中描述商品属性的特定部分,它是细粒度观点抽取(fine-grained opinion mining)的一个重要的子任务。现有的商品属性抽取技术主要建立在商品的评论语料上,该文以手机导购对话系统为背景,将商品属性抽取应用到整个对话过程中,增强对话系统应答的针对性。使用基于CBOW (continuous bag of words)语言模型的word2vector(W2V)对词汇的语义层面建模,提出一个针对口语对话的指数型变长静态窗口特征表达框架,捕捉不同距离词语组合的重要特征,使用卷积神经网络(convolutional neural network, CNN)结合词汇的语义和上下文层面对口语对话语料中的商品属性进行抽取。词嵌入模型给出了当前词和所给定的属性类别是否存在相关性的证据,而所提出的特征表达框架则是为了解决一词多义的问题。实验结果表明,该方法取得了优于研究进展中方法的商品属性识别效果。
2016 Vol. 30 (6): 67-74 [摘要] ( 550 ) [HTML 1KB] [PDF 3087KB] ( 921 )
75 基于DNN的汉语框架识别研究
赵红燕;李 茹;张 晟;张力文
框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有效性和完备性无法保证。深度神经网络自动学习特征的能力,为我们提供了新思路。该文探索了利用深度神经网络自动学习目标词上下文特征,建立了一种新的通用的框架识别模型,在汉语框架网和《人民日报》2003年3月新闻语料上分别取得了79.64%和78.58%的准确率,实验证明该模型具有较好的泛化能力。
2016 Vol. 30 (6): 75-83 [摘要] ( 582 ) [HTML 1KB] [PDF 3700KB] ( 971 )
84 基于分布式表示和多特征融合的知识库三元组分类
安 波;韩先培;孙 乐;吴 健
三元组分类是知识库补全及关系抽取的重要技术。当前主流的三元组分类方法通常基于TransE来构建知识库实体和关系的分布式表示。然而, TransE方法仅仅适用于处理1对1类型的关系,无法很好的处理1对多、多对1及多对多类型的关系。针对上述问题,该文在分布式表示的基础上,提出了一种特征融合的方法—TCSF,通过综合利用三元组的距离、关系的先验概率及实体与关系上下文的拟合度进行三元组分类。在四种公开的数据集(WN11、WN18、FB13、FB15K)上的测试结果显示,TCSF在三元组分类上的效果超过现有的state-of-the-art模型。
2016 Vol. 30 (6): 84-89 [摘要] ( 883 ) [HTML 1KB] [PDF 618KB] ( 1032 )
90 基于认知属性库的原型范畴研究
李 斌;宋 丽;银思琪;曲维光;王 萌
原型范畴是认知科学研究中的重要理论,使用属性来区分范畴中心成员及边缘成员有着较强的解释力,但该理论一直缺乏基于频率信息的属性数据支撑。该文借助认知属性库的23万条数据,对原型理论研究中经常讨论的“鸟”、“水果”、“交通工具”等范畴的典型成员和非典型成员进行分析验证。认知属性库的数据显示,在汉语中,“鸟”的典型成员是“麻雀”、“燕子”等,和“鸟”具有较多的共同属性;而“企鹅”、“鸵鸟”则只共享了“鸟”很少的属性,且缺少关键的属性“飞”。大体上验证了原型理论的观点。同时,我们也发现“小鸟”的属性特别丰富,具有典型成员的特性。在进一步观察了“水果”和“交通工具”两个范畴后,我们探讨了范畴的跨类现象,进而从数学模型上区分了树结构的层次分类体系和图结构的范畴化体系。
2016 Vol. 30 (6): 90-99 [摘要] ( 486 ) [HTML 1KB] [PDF 2456KB] ( 861 )
100 中国英语学习者花园幽径句错位效应强度研究: 计算语言学视角
杜家利;于屏方
该文借助126名英语专业大二学生对100个花园幽径句和对照句的限时理解实验,讨论了中国英语学习者在解读花园幽径句过程中产生的错位效应,测算了效应强度,并与stanford parser的自动翻译进行了人机对比研究。花园幽径现象是一种有意识的受控行为。其编码和解码具有行进错位和认知过载现象,并能反映人类复杂的心理认知活动。实验证明: 在划分的引导词类错位、宾语辖域错位、嵌套错位和兼类错位四类中,错位效应呈现非对称性,其中兼类错位频数最高,错位效应强度也最大。在人机对照中,机器的程序解码错位和学习者认知解码错位不具有完全联动性和绝对共时性。
2016 Vol. 30 (6): 100-116 [摘要] ( 469 ) [HTML 1KB] [PDF 2586KB] ( 793 )
117 双语者加工汉语母语语义时对英语的ERP激活效应的研究
杨思琴;江铭虎
本研究采用ERP实验,以被试的反应时间、错误率和脑电成分N400为参考因素,探索高级双语者在加工第一语言时是否自动检索第二语言。结果显示,内隐的英语首发音条件引起的效应没有体现在反应时间上。在ERP实验结果中,被试在判断语义相关的词语时,大脑语言区域的N400在词语英译首发音一致与否的情况下差异不显著;而判断语义无关的词语时,N400在该条件下显著。实验结果分析表明,高级双语者在深度加工第一语言时,大脑可能无意识地检索第二语言。
2016 Vol. 30 (6): 117-125 [摘要] ( 407 ) [HTML 1KB] [PDF 3352KB] ( 952 )
126 基于语义角色标注的汉语句子相似度算法
田 堃;柯永红;穗志方
在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。
2016 Vol. 30 (6): 126-132 [摘要] ( 751 ) [HTML 1KB] [PDF 1710KB] ( 1048 )
133 网络用语词典的构建及问题分析
昝红英;许鸿飞;张坤丽;穗志方
随着互联网应用的快速发展,网络用语的使用越来越普遍,网络新词层出不穷。网络文本中大量的网络用语,对基于自然语言处理的情感分析、产品推荐、问答系统等应用带来了一定的挑战,而收集并构建网络用语词典及相关语料则是解决此类问题的突破点。该文以微博语料为出发点,综合多类网络资源,收集并整理了较为全面的网络用语词典及相关语料。同时,对网络用语词典构建中遇到的问题进行了分析和总结,并对其潜在应用进行了初步的探讨。
2016 Vol. 30 (6): 133-139 [摘要] ( 631 ) [HTML 1KB] [PDF 1823KB] ( 1067 )
140 谈话节目语料库的构建与会话结构分析
王 珊;刘 锐
口语语料库的建设是口语研究的基础工作,该文选择具有代表性的交谈式谈话节目《锵锵三人行》和对谈式谈话节目《鲁豫有约》作为语料,建立了一个小型的谈话节目语料库,并构建了包含五大类16小类的会话结构标注体系,对语料进行了会话结构的标注。统计得到打断结构309例,插入结构141例,重复结构111例,问答结构653/589例,阻碍—修正结构51/21例,反映了会话结构在数量上的不均衡分布,节目的形式、性质以及交际任务是会话结构分布的主要影响因素。会话结构组合具有模式性,该文使用Trigram方法对其组合情况进行了分析,发现语料中的高频组合是问答毗邻对,此外有大量的非毗邻性组合。会话结构组合模式不但反映出谈话节目的风格特点,还有助于分析会话中的功能性模块、会话策略的形成,进而更加深入地了解会话的运作机制。
2016 Vol. 30 (6): 140-146 [摘要] ( 434 ) [HTML 1KB] [PDF 930KB] ( 892 )
147 基于远监督的语义知识资源扩展研究
卢达威;王星友;袁毓林
语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。该文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。该文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根据词的句法格式将词典的词分类,将待扩展的新词通过分类器映射到原有词典的词中,以此把词典扩展问题转化为多类分类问题。依据的原理是词典词和待扩展新词在大规模语料中句法结构的相似性。该文通过远监督的方法构造训练数据,避免大量的人工标注。训练过程结合了浅层机器学习方法和深度神经网络,取得了有意义的成果。实验结果显示,深度神经网络能够习得句法结构信息,有效提升匹配的准确率。
2016 Vol. 30 (6): 147-155 [摘要] ( 531 ) [HTML 1KB] [PDF 1909KB] ( 803 )
156 基于伪文档的伪相关反馈方法
闫 蓉;高光来
传统的伪相关反馈(Pseudo Relevance Feedback, PRF)方法通常是以文档作为扩展源单元提取扩展词,提取粒度过大造成扩展源质量下降,使得检索结果鲁棒性差。该文研究利用主题分析技术,尝试将文本语义内容作为扩展源单元,缓解扩展源质量不高的问题。提出并实现了对文本集中各文档内容的伪文档描述,通过对其进行隐式多样化处理,实现了从更细微的文本内容角度出发提取扩展词。通过在真实NTCIR8中文语料的检索结果表明,该方法可以有效地提升伪相关反馈的检索性能。
2016 Vol. 30 (6): 156-163 [摘要] ( 582 ) [HTML 1KB] [PDF 2728KB] ( 810 )
164 基于框架语义的高考语文阅读理解答案句抽取
李国臣;刘姝林;杨陟卓;李 茹;张 虎;钱揖丽
高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹配和框架语义关系抽取答案候选句,在排序时引入流形排序模型,通过答案句之间的框架语义相关度将排序分数进行传播,最终选取分数较高的Top-4作为答案句。在北京近12年高考语文阅读理解问答题上的准确率与召回率分别达到了53.65%与79.06%。
2016 Vol. 30 (6): 164-172 [摘要] ( 487 ) [HTML 1KB] [PDF 4275KB] ( 1147 )
173 基于文本语义离散度的自动作文评分关键技术研究
王耀华;李舟军;何跃鹰;巢文涵;周建设
该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。
2016 Vol. 30 (6): 173-181 [摘要] ( 648 ) [HTML 1KB] [PDF 3584KB] ( 936 )
182 限定领域口语对话系统中超出领域话语的对话行为识别
黄沛杰;王俊东;柯子烜;林丕源
由于领域外话语具有内容短小、表达多样性、开放性及口语化等特点,限定领域口语对话系统中超出领域话语的对话行为识别是一个挑战。该文提出了一种结合外部无标签微博数据的随机森林对话行为识别方法。该文采用的微博数据无需根据应用领域特点专门收集和挑选,又与口语对话同样具有口语化和表达多样性的特点,其训练得到的词向量在超出领域话语出现超出词汇表字词时提供了有效的相似性扩展度量。随机森林模型具有较好的泛化能力,适合训练数据有限的分类任务。中文特定领域的口语对话语料库测试表明,该文提出的超出领域话语的对话行为识别方法取得了优于最大熵、卷积神经网络等短文本分类研究进展中的方法的效果。
2016 Vol. 30 (6): 182-189 [摘要] ( 532 ) [HTML 1KB] [PDF 3223KB] ( 977 )
190 汉维时间数字和量词的识别与翻译研究
阿依古丽·哈力克;艾山·吾买尔;吐尔根·伊布拉音;卡哈尔江·阿比的热西提;买合木提·买买提
统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,该文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻译模式,实现了基于模板的时间、数字、无歧义量词翻译方法及基于上下文的有歧义量词翻译方法。时间、数字、无歧义量词、有歧义量词的翻译F值达到了93.23%、90.15%、96.55%、87.58%,实验证明,该方法具有简单高效的优点。
2016 Vol. 30 (6): 190-200 [摘要] ( 576 ) [HTML 1KB] [PDF 2763KB] ( 842 )
201 融合被动和可能态模型的日汉统计机器翻译
王 楠;徐金安;明 芳;陈钰枫;张玉洁
日语中谓词语态有不同的词尾变形,其中被动态和可能态具有相同的词尾变化,在统计机器翻译中难以对其正确区分及翻译。因此,该文提出一种利用最大熵模型有效地对日语可能态和被动态进行分类,然后把日语的可能态和被动态特征有效地融合到对数线性模型中改进翻译模型的方法,以提高可能态和被动态翻译规则选择的准确性。实验结果表明,该方法可以有效提升日语可能态和被动态句子的翻译质量,在大规模日汉语料上,最高翻译BLEU值能够由41.50提高到42.01,并在人工评测中,翻译结果的整体可理解度得到了2.71%的提升。
2016 Vol. 30 (6): 201-207 [摘要] ( 488 ) [HTML 1KB] [PDF 1985KB] ( 770 )
208 基于条件随机场的评价对象缺省项识别
唐文武;过 弋;徐永斌;方 旭
在电商网站评论文本中,评价对象和评价属性的缺省识别对文本情感分析具有重要地作用。针对电商网站评论文本中评价对象和评价属性缺省问题,该文提出了一种基于条件随机场的评价对象缺省项识别方法。首先利用情感词典识别观点句,将缺省项识别问题转换成序列标注问题,综合词法特征和依存句法特征,使用条件随机场模型进行训练,并在测试集上对待识别的观点句进行序列标注,通过标注结果判定缺省项的位置。实验结果表明,该方法具有较高的准确率和召回率,验证了该方法的有效性。
2016 Vol. 30 (6): 208-214 [摘要] ( 612 ) [HTML 1KB] [PDF 1414KB] ( 872 )
215 基于多特征融合的混合神经网络模型讽刺语用判别
孙 晓;何家劲;任福继
在社交媒体中,存在大量的反讽和讽刺等语言现象,这些语言现象往往表征了一定的情感倾向性。然而这些特殊的语言现象所表达的语义倾向性,通常与其浅层字面含义相去甚远,因此加大了社交媒体中文本情感分析的难度。鉴于此,该文主要研究中文社交媒体中的讽刺语用识别任务,构建了一个覆盖反讽、讽刺两种语言现象的语料库。基于此挖掘反讽和讽刺的语言特点,该文通过对比一些有效领域特征,验证了在反讽和讽刺文本的识别中,其结构和语义等深层语义特征的重要性。同时,该文提出了一种有效的多特征融合的混合神经网络判别模型,融合了卷积神经网络与LSTM序列神经网络模型,通过深层模型学习深层语义特征和深层结构特征,该模型获得了较好的识别精度,优于传统的单一的神经网络模型和BOW(Bag-of-Words)模型。
2016 Vol. 30 (6): 215-223 [摘要] ( 821 ) [HTML 1KB] [PDF 4577KB] ( 1289 )
224 藏文复合句的依存句法分析
华却才让;赵海兴
为解决藏文复合句引起的依存句法分析性能下降的主要问题,该文提出了一种基于判别式的藏文复合句切分标注方法,先根据藏文固有的虚词语法结构和连词特征,将复合句子切分标注为句法分析的基本单元,然后将句法分析之后的各个部分依据主分句关系进行合并,生成复合句的完整分析结果。实验结果表明该方法在一定程度上降低了藏文复合句依存句法分析的复杂度,最终句法分析的准确率达到88.72%。
2016 Vol. 30 (6): 224-229 [摘要] ( 533 ) [HTML 1KB] [PDF 2652KB] ( 791 )
230 基于蒙古语名词语义网的同形词歧义消除研究
哈 斯; 布音其其格
蒙古文同形词歧义消除问题是蒙古文信息处理的难点之一。该文提出了基于蒙古语名词语义网的同形词歧义消除方法,设计实现了同形词歧义消除算法,最后给出了语料库中同形词歧义消除实验的设计过程及结果分析。
2016 Vol. 30 (6): 230-235 [摘要] ( 438 ) [HTML 1KB] [PDF 2150KB] ( 807 )
中文信息学报
·编辑部2023年春节放假通知
·2023年期刊订阅
更多....  
更多....  
更多....  
中国知网
万方数据
更多....  
 
版权所有 © 《中文信息学报》编辑部    
地址:北京市海淀区中关村南四街4号 邮编:100190 电话:010-62562916 E-mail:cips@iscas.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发