基于因果岭回归的多数据源科研主题识别方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391

基金项目:

广东省科技厅公益研究与能力建设专项资金项目(2015A020219013)


The research topics identification with multiple data source based on causal regression
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了有效解决多数据源科研主题的识别问题,基于因果岭回归建立了一种新的多数据源科研主题识别方法。该方法首先给出了多数据源科研主题识别关键参数(如主题词的引用权重、状态密度)的评价指标,同时根据科研主题形态特征建立了特征函数,并基于因果岭回归给出了具体识别方法。最后,通过仿真实验深入研究了影响该识别方法的关键因素。结果显示,与朴素贝叶斯、KNN算法和MGe-LDA算法相比较,该方法在价值引用量、引用权重和前沿主题相似度等方面具有较大优势。

    Abstract:

    In order to effectively tackle the research topics identification with multiple data source, a new research topic identification method is presented based on causal regression. In this paper, the evaluation indicators are defined to identify the key parameters of research topics for multiple data source, such as the citation weight and status density of research topics, the feature function is established with morphological characteristics of research topics, and the research topics identification based on multiple data sources is modeled by causal regression. The experimental results show that the proposed method has great advantages in terms of value citation, citation weight and similarity with frontier topics, compared with Naive Bayes, KNN and Mge LDA algorithm.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 何增颖,陈建锐,钟足峰. 基于因果岭回归的多数据源科研主题识别方法[J]. 四川大学学报: 自然科学版, 2018, 55: 1204.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-11-24
  • 最后修改日期:2018-06-13
  • 录用日期:2018-06-14
  • 在线发布日期: 2018-11-29
  • 出版日期: