内容摘要:
关键词:
作者简介:
内容提要:[目的/意义]考察大数据背景下的文献计量学研究最新进展与学科融合趋势,为文献计量学与科学计量学的功能拓展及应用性研究提供启示与新思路。[方法/过程]结合大数据与数据科学的研究背景,归纳2017年第十六届ISSI大会的讨论主题以及其他相关文献的研究热点,预测文献计量学研究体系在大数据驱动下的三大发展趋势。[结果/结论]文献计量学研究体系的发展变革与学科融合将成为未来趋势,主要体现在三个方面:大数据背景下新的科学交流与文献生成模式催生出计量学体系的学科融合;文献计量与引文分析自身不断创新并焕发生机;科学文献计量学的应用性研究领域不断拓展。
关 键 词:大数据/ISSI大会/文献计量学/科学计量学/研究进展/学科融合
标题注释:本文为国家社会科学基金项目“我国‘五计学’融合与图书情报学的方法创新研究”的成果,项目编号:18BTQ080。
作者简介:任全娥,ORCID:0000-0002-8854-6133,博士,副研究馆员,中国社会科学院图书馆。北京 100732
1 大数据背景
大数据带来的机遇与挑战在于数据的获得、存储与计算不再是瓶颈或难题。由于各学科领域中的传统知识与新兴数据之间的矛盾日益突出,传统知识无法解释和有效利用新兴的大数据,进而促使传统理论与方法的革命性变化。大数据既包括传统的结构化数据,也包括网络环境下的非结构化数据和半结构化数据,与其说它是一种数据规模和数据类型的革命,不如说它更是一种数据处理与分析方法的理念革新,即对全面性与客观性原则的基本遵循。
数据科学与大数据是两个既有区别又有联系的概念,可以将数据科学理解为大数据时代一门新科学。从学科定位来看,数据科学是一门以统计学、机器学习和领域知识为理论基础的新兴交叉性学科;从知识体系看,数据科学主要以统计学、机器学习、数据可视化以及领域知识为理论基础,其主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发[1]。
可以预见,大数据与数据科学将成为图书情报学的一个新的研究切入点。同时,文献计量学作为图书情报学学科体系的重要组成部分,在大数据背景下将会与科学计量学不断融合,逐渐形成多种文献计量模式共生共存的多元一体化科学计量生态。
2 文献计量学研究进展
为了探讨文献计量学的最新研究进展,本文结合2017年第十六届国际科学计量学与信息计量学学会(International Conference on Scientometrics & Informetrics,ISSI)的会议文献内容以及国内外其他相关研究成果,考察归纳该学科领域的最新研究热点与讨论主题,以探索文献计量学与科学计量学的学科融合趋势。ISSI大会共设有六个分会场,涉及40多个会议主题,这些分会场主题具有一定程度的交叉重叠性。其中,引文分析与影响因子、替代计量学与学术社交数据、科研评价与科技政策等研究主题在分会场中出现频次最多,集中反映了科学计量学与信息计量学的国际研究热点。
综合分析发现,文献计量学领域的最新研究主题,大部分侧重于探索数字化与网络化环境下的知识交流特点与引文分析规律,并将集成后的科学交流数据与知识转移信息应用于科学评价与科技政策的改进与完善。在这些系列研究主题与创新研究方法中,很难区分哪些属于文献计量学,哪些属于科学计量学,而是更多倾向于融合创新传统文献计量学的理念与方法来解决科学计量、科学评价与科学管理中面临的实际问题。因此,从中不难看出文献计量学与科学计量学面向实际应用领域不断拓展,并进行学科融合的发展趋势。上述的ISSI会议文献,部分内容已在《2017年国外文献计量学研究的学科动态与研究热点》一文中简要介绍[2],这里为了进一步分析文献计量学与科学计量学的学科融合趋势,分别从文献引文分析、替代计量学及科学评价三个方面详尽阐述文献计量学最新研究进展。
2.1 文献计量与引文分析是科学计量学的主流研究方法
我们知道,科学计量与科学指标一般都直接或间接涉及文献计量与引文分析。有文献提出,科学学和科学计量学属于二阶主题及二阶学科,它以作为一阶主题的科学文献为研究对象,引文即参考文献是现代科学文本及其区别于非科学文本的主要特征,由此导致文献引文分析成为科学计量学的主流方法[3]。实际上,在大数据网络背景下,文献引文分析依然是科学计量学的主流研究方法。最近关于引文分析的研究,已经从表层的引文统计与结果分析转移到网络环境下的引文现象与引文规律的探索,并形成了新的研究热点。在第十六届ISSI会议上,研究人员的引文行为及引文指标认同等研究主题,已经引起科学计量学界的广泛关注和讨论。
为了探讨科研人员的引文行为特点,博亚克(K W.Boyack)研究团队从时间维度和文本语篇两个角度,考察了公共医学中心开放获取子集数据库(PubMed Central Open Access Subset)和爱思唯尔期刊数据库(Elsevier)两个大型数据库中记录的全文文献的文内引用(如提及)分布情况[4]。以这两个数据库中超过500万篇的文章作为样本,发现每篇参考文献的文内引用数并不随时间变化而变,而随参考文献的年龄而降低。研究结果还表明,文内引用主要集中在文章的开头和结尾部分,但同时也会随每篇参考文献的提及数量而变化。从参考文献的引用次数分布的峰值,推断出方法论文章比其他类型的文章更易高被引。有时候,人们更常引用那些与施引文献内容高度相关的参考文献,而不是非常重要但却内容关联性不高的参考文献。
既然文献引证本身就是研究人员科研过程中的一种交流行为和学术态度,表明引用者对引文作者的承认、推荐或者说服别人支持其研究发现,倾向于展示其对引文行为和引文指标的某种信息与看法。那么,这就引出一个有趣的问题:这些引文指标是否已经在研究人员自身中得到广泛的认可和使用,其分布情况如何?文献[5]以开放问卷的形式对引文指标在学者群体中的自我认同和采用情况进行了调查研究。由于个人网站经常被作为评价研究人员个人的一种补充信息来源,该项研究试图考察学者个人通过网站展示其引文、引文指标以及提供谷歌学术搜索引文链接的情况,将其称为引文个人展示(Citation Personal Display,CPD)。通过研究人员的引文个人展示(CPD)情况,可以反映出引文指标在学者自身群体中的接受和承认程度。该文基于研究人员的个人网站,研究了社会科学的三类学科(经济学、社会学和心理学)中的引文个人展示程度。根据2016年《美国新闻与世界报道》(US News&World Report)的学科排名,选择美国八所大学的科研人员作为研究对象。结果显示,社会科学研究人员的整体CPD水平不高,只有7.5%,其中,心理学研究人员的CPD最高,为8.3%,其次是经济学和社会学。这就意味着不同学科的CPD表现不同。此外,研究还发现,即使同一个学科,CPD在不同学校的表现也不同,经济学和心理学CPD存在统计学意义上的显著差异,而社会学在不同学校间的差异则不明显。

