内容摘要:据美国康奈尔大学官网12月 22日消息称,美国康奈尔大学的预印本服务器arXiv上存储了大量物理学、数学、计算科学、量化生物学、量化统计学、量化金融学等领域的文章。该校研究人员比较研究了1991年至2012年存储于arXiv中的75.7万篇文章后发现,许多文章中存在普遍的“文本重叠”现象。
关键词:重叠;文本;美国康奈尔大学;量化;研究人员;存储;中的材料;数学;定理;母语
作者简介:
据美国康奈尔大学官网12月22日消息称,美国康奈尔大学的预印本服务器arXiv上存储了大量物理学、数学、计算科学、量化生物学、量化统计学、量化金融学等领域的文章。近日。该校研究人员比较研究了1991年至2012年存储于arXiv中的75.7万篇文章后发现,许多文章中存在普遍的“文本重叠”现象。
研究人员发现,“文本重叠”现象具体表现为作者在文章中重复描述实验装置或实验过程;数学家们为了论证自己的观点,在文中不断重复众所周知的定理;重复利用作者已发表文章中的材料;博士生在自己的毕业论文中套用已发表论文中的材料;更严重的是有些作者除姓名以外,甚至原样照搬他人文中的致谢内容。“文本重叠”现象越严重,文章的引用率就越低。
研究人员称“文本重叠”现象的存在或许与文化有一定关系,例如一些东方文化认为轻易或擅自改动他人文中的原话是不尊重原作者的表现,因此一些母语非英语的作者,在使用他人文中材料的过程中,就采取“原样照搬”的做法。
“此次研究的首要目是发掘客观事实,对“文本重叠”现象的好坏不做任何评判,但依然有一些人会担心“文本重叠”现象会浪费网络空间和学术期刊的版面”,康奈尔大学物理与信息科学教授保罗?金斯帕尔戈(Paul Ginsparg)表示。
(杨敏/编译)







