期刊导读

图书情报与数字图书馆论文_科技论文引用对象和

发布时间:2022-05-31     作者:网站采编
文章目录

1 相关研究

1.1 科技论文引用对象和引文功能的分类

1.2 基于序列标注模型的实体关系联合自动识别方法

2 科技论文引用对象和引文功能的联合自动识别方法模型

2.1 科技论文引文内容的获取

    1)科技论文全文本的采集及清洗。

    2)科技论文引文内容的获取。

2.2 科技论文引文内容的序列标注

    2.2.1 引用对象和引文功能的标注

        1)引用对象的标注

        2)引文功能的标注

    2.2.2 标签类型

2.3 基于BERT-BiGRU-CRF模型的引用对象和引文功能的联合自动识别

    2.3.1 BERT词向量层

    2.3.2 BiGRU层

    2.3.3 CRF层

2.4 引用对象和引文功能识别结果的三元组表示

3 实验与结果分析

3.1 数据采集与处理

3.2 实验过程

3.3 实验结果与分析

4 结 语

文章摘要:[目的/意义]国家强调重视科技成果的质量,科技成果的质量体现了科技成果的学术价值和贡献。科技论文是科技成果的重要载体之一。基于文本语义分析识别科技论文的引用对象和引文功能,对于科技论文的学术贡献和价值的评价具有重要的作用。[方法/过程]本文利用文本数据挖掘技术提出基于BERT-BiGRU-CRF的科技论文引用对象和引文功能的联合自动识别方法模型。首先从知网数据库获取科技论文全文本,利用正则匹配引用标记的方式获取科技论文引文内容;其次借鉴已有研究确定科技论文引用对象和引文功能标注方法,实现科技论文引文内容的人工标注;然后在预训练语言模型BERT的基础上结合BiGRU与CRF构建科技论文引文内容的序列标注模型,实现科技论文引用对象和引文功能的联合自动识别,将识别结果利用三元组进行表达;最后采用图情领域5本高质量期刊2021年上半年的科技论文文本数据进行实验。[结果/结论]实验结果表明,本文提出的方法模型在引用对象、引文功能和两者联合自动识别上的F1值分别为71.78%、68.33%、64.23%,均优于对比模型,初步验证了本文模型对于科技论文引用对象和引文功能自动识别的有效性。

文章关键词:

论文分类号:G353.1;G301