多特征中文命名实体识别
作者:
作者单位:

1.中国电子科技网络信息安全有限公司;2.四川省科学技术信息研究所;3.四川大学计算机学院

作者简介:

通讯作者:

中图分类号:

TP391

基金项目:

国家自然科学基金(62137001, JG2020125)


Multi-feature Chinese named entity recognition
Author:
Affiliation:

1.China Electronic Technology Cyber Security Co,Ltd;2.Institute of Science and Technology Information of Sichuan;3.College of Computer Science,Sichuan University

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    命名实体识别任务是对文本中的实体进行定位,并将其分类至预定义的类别中.目前主流的中文命名实体识别的模型是基于字符的命名实体识别模型.该模型在使用句法特征之前,需先进行 分词,不能很好的引入句子的句法信息.另外,基于字符的模型没有利用词典中的先验词典信息,以及中文偏旁部首蕴含的象形信息.针对上述问题,论文提出了融合句法和多粒度语义信息的 多特征中文命名实体识别模型.实验证明论文模型相对目前主流模型有了较大的提高,同时论文还通过实验分析了各种特征对模型识别效果的影响.

    Abstract:

    The task of named entity recognition is to locate the entities in the text and classify them into predefined categories. The current mainstream Chinese named entity recognition models are characterbased named entity recognition models which word segmentation is required before using syntactic features, syntactic information of sentences cannot be well utilized as a result. In addition, the characterbased models cannot make use of the prior dictionary information and the pictographic information contained in Chinese radicals. To solve the above problems, this paper proposes a multifeature Chinese named entity recognition model combining syntax and multigranularity semantic information. The experiments demonstrate that the proposed model is better than the current mainstream Chinese named entity recognition models, the influence of various features on the Chinese entity recognition effect is analyzed through experiments as well.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 胥小波,王涛,康睿,周刚,李天宁. 多特征中文命名实体识别[J]. 四川大学学报: 自然科学版, 2022, 59: 022003.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-11-15
  • 最后修改日期:2021-12-07
  • 录用日期:2021-12-27
  • 在线发布日期: 2022-04-01
  • 出版日期: