%0 Journal Article %A 李文浩 %A 刘文长 %A 孙茂松 %A 矣晓沅 %T 概率式关联可信中文知识图谱——“文脉” %D 2023 %R %J 中文信息学报 %P 67-73 %V 36 %N 12 %X 国内现有的中文知识图谱往往以维基百科、百度百科等群体智能贡献的知识库作为资源抽取得到,但这些知识图谱利用的主要是百科的实体名片信息和分类体系信息。然而,这些百科中也有大量的内部链接信息,其中蕴含了大量知识。故而该文中利用维基百科的内部链接构造边,并统计目标实体在源实体定义文本中出现的频度,利用其对应的TF-IDF值作为边权,构造了一个概率式中文知识图谱。该文还提出了一种可信链接筛选算法,对偶发链接进行了去除,使知识图谱更加可信。基于上述方法,该文挖掘出了一个概率式关联可信中文知识图谱,命名为“文脉”,将其在GitHub上进行了开源,以期能对知识指导的自然语言处理以及其他下游任务有所襄助。 %U http://jcip.cipsc.org.cn/CN/abstract/article_3442.shtml