那些未被引用的文章


诺贝尔奖获得者Oliver Smithies曾经在2014年德国林道的一次会议上讲起自己的一桩糗事,他谈到自己在1953年发表的一篇关于测量渗透压的文章可悲的从来没有被引用过。按他的原话来讲,没有人提起过这篇文章,也没有人用过这一方法。

事实上,Smithies这篇文章比他自己想象的还好点,该文章在发表的十年内被引用了9次。不过Smithies记错也是情有可原,毕竟这个数字还是少了一点。

在1990年science的一篇调查中,作者估计大约有一半的学术文章,在发表后的五年内没有任何引用。一般科学家对这个问题都比较紧张。毕竟引用数在很多时候是学术影响力的衡量标准,标志着研究者的工作不仅被人读了,也为后来的工作奠定了基础。没被引用的文章好像就是一堆无用物的堆积。

不过蒙特利尔大学的VincentLarivière表示,没有被引用的文章并不没用,而且实际上这些工作的比例也没有那么高。为了更好的了解这一问题,nature杂志做了一个调查试图搞清究竟有多少文章没有被引用。因为引用数据库并不完整,所以我们不太可能得到一个准确的数据。不过通过对包含12000以上杂志的web of science数据库的调查,可以清楚的发现零引用的文章远没有想象中那么多。在这个数据库中,有少于10%的文章是从没被引用过的。真实的数字可能会更低一些。

未被引用的迷雾

之前人们一直担忧学术界会被大量没有引用的研究充斥。上个世纪science发表了两篇相关文章,一篇发表在1990年,另一篇在1991年。在1990年的报告中,作者指出1981年到1985年间发表的文章,有55%在发表五年内没有引用。不过这些报道可能有点误导人。作者不仅计算了研究文章,还统计了信件,勘误,会议摘要以及其他通常不会被引用的材料。如果把这些材料去掉,然后把时间延长一些,未被引用的概率会降低很多。

在2008年,Larivière通过对web of science的调查发现未被引用文章的比例比想象的低很多,并且它的比例也在逐渐下降。新的数字表明未被引用文章的比例在发表后五年到十年间会稳步下降,虽然在不同学科中,比例会有所不同。比如2006年发表的生物医学文章中,只有4%直到今天也没有被引用。在化学领域这个比例是8%而在物理领域是11%(当我们去掉自引的话,在某些领域仍然是50%左右)。2006年工程领域的文章未被引用的概率是24%,比自然科学领域要高得多。这可能由于很多工程领域文章是为了解决特定问题,而不是为了让大家继续推进研究。

把所有文章放在一起,包括从1900年到2015年web of science记录的3900万篇文章,大约21%到今天没有任何引用。不意外的是这些文章多数发表在更冷门的杂志上。

不完善的统计

这些数字只能给我们一个大概的印象,更精确的统计几乎是不可能完成的任务。比如有一篇文章声称大约10%的诺贝尔奖获得者的工作没有任何引用。在2012年,查理斯大学的生物学家PetrHeneberg试图搞清这一点,他调查了13名诺贝尔奖获得者发表的文章,发现在web of science数据库中,这些文章未被引用的概率约为1.6%。通过在googlescholar上的进一步检索,他发现很多文章其实被引用了,但由于一些引用数据的错误,没有在数据库中被统计清楚。通过大约20个小时的手动检查,他发现实际没有被引用的概率只有大约0.3%。

这也是为什么我们很难知道真正的未被引用文章的概略--这种手动检查实在是太费时间了。不同学科这种偏差也有所区别。比如对于人类学,web of science显示大约有65%的在2006年发表的文章没有被引用。这可能有点道理,因为人类学研究很多时候不依赖文献的积累,不过更多时候,可能是由于很多人类学期刊和书籍没有被数据库包括。

同样的问题也会为我们比较不同国家的数据带来困难。Web of science显示中国,印度和俄国的研究者发表的文章,相对于美欧研究者更容易被忽略。不过这个数据库也没有收录这些国家的本土期刊,如果把这些期刊算进来,也会减少差距。

Larivière表示,尽管数据统计上有各种各样的问题,但数据显示的趋势应该是没有太大偏差的。随着互联网的发展,检索和引用文章变得越来越简单,也促进了科学的交流。不过另外一个趋势也值得注意,Larivière在他2009年的一项研究中发现,未被引用的文章比例降低可能是由于科学家的参考文献列表越来越长的关系。莱顿大学的LudoWaltman提到很多文章跟没被引用也差不多。Web of science数据库中有一次或两次引用的文章数目都高于没有引用的文章。

也不是没什么用

有些人认为没被引用就是没什么意义,毕竟如果这些研究真的有用,后来怎么没有人提到过。

真实情况也不尽然如此。没有被引用的文章也通过各种方式影响着学术界。路易斯安那州立大学的植物学家MichaelMacRoberts提到了自己在1995年发表的一篇关于在德州发现的某种苔藓的工作。尽管这篇文章没有被引用过,但它包含的信息被收入到物种志和在线的数据库中。使用数据库的研究者都得益于像这篇文章一样的数千个工作。

另外没有被引用的文章也会有读者。2010年来自纽约的研究者Mental Hygiene在plos one上发表了一篇研究,利用软件来分析基于唾液的艾滋病诊断的偏差。这篇文章从来没有被引用过,但被阅读过1500次并且被下载过500次。参与的研究者表示,这篇文章的目的主要是为了促进公众健康工作,而不是为了推动一个学科领域。

另外有些文章没有被引用,是由于它们证明了一些无效的研究方向。卡迪夫大学的NiklaasBuurma在2003年曾经发表了文章探讨溶剂对于化学反应速率的影响,以及在实验中控制溶剂的接触面积有什么用处--事实证明没什么用处。NiklaasBuurma表示我们证明了这类实验没有太大价值,这篇文章没被引用还挺让人骄傲。

Oliver Smithies在林道会议中谈到,尽管自己1953年的文章没有被引用。它后面的工作帮助他取得了博士学位并成为羽翼丰满的科学家。这篇文章代表了一个诺贝尔奖获得者的学徒期。Smithies说他很享受这个工作,并且学习了如何做好科学。其实他真有一篇没有被引用的文章。这文章发表于1976年,描述了一个位于15号染色体的免疫相关基因。这篇文章也不是没有用处。哈佛医学院的RajuKucherlapati是那篇文章的作者之一,他提道“这篇文章是我们之间长期合作的开始。这一系列关于小鼠遗传学的工作奠定了Smithies获得2007年诺奖工作的基础”,“对于我个人而言,这篇文章的意义在于我开始认识了Smithies”。

reference:https://www.nature.com/articles/d41586-017-08404-0

本文经授权转载自科学网邵斌老师博文:那些未被引用的文章

分享到