Nature撤稿一个月,Let It Go?


一、导读

不知大家是否留意过,近年来很多发表的论文末尾大多都有下面一段简短的表述:

这句看似简单的话语,你从中能得到哪些信息?它的潜台词是什么?可能看完今天的这篇文章,你会有不一样的答案。

二、量子计算泡沫之戳破

2021年3月8日, Nature杂志宣布将一篇发表于2018年的论文撤回(图1)。这篇论文声称的重大突破是:“宣称在极低温半导体纳米线的电流中观测到零偏压电导峰”,而这个所谓“观测到”的零偏峰(zero-bias peak)是马约拉纳费米子存在的直接实验证据。这项看似非常基础的研究一时激起了不小的关注,因为其重要发现可以解决量子计算机的基本模块“量子比特”的不稳定性,有助于实现具有应用价值的量子计算,为下一代信息技术的发展注入强大动力。当然,关于这项研究的意义本文不做过多的探讨,因为其研究领域相当基础,涉及基本粒子等基础物理领域。

图1 撤稿须知

今天,我们需要探讨的是,一篇撤稿不久,但余温尚存的成果,在学术界激起的一次有重要启发意义的讨论。

此次撤稿事件的基本情况是:被撤稿论文所在机构代尔夫特理工大学的研究小组的前成员(即我们俗称的“大师兄”级别),来自美国匹兹堡大学的Sergey Frolov(下文简称Sergey)和澳大利亚新南威尔士大学的Vincent Mourik(下文简称Vincent)在被撤稿论文发表一年之后的2019年末,收到来自被撤稿论文的某作者发来的实验数据,在通过对得到的部分“原始数据”的数据集进行重新绘制并分析后,发现与论文中声称的重要突破不符合,随即联系了Nature杂志的编辑部。随后,Nature杂志于2020年4月29日发表了Editorial Expression of Concern众所周知,撤稿几乎没跑了。但最终的撤稿决定是在近一年后的上个月才发布,可见其中经历了很复杂的评审与讨论,但是,无论怎样,最终是以撤稿谢幕。

图2 被撤稿论文

当然,在此次撤稿决定发布前,还有一件容易被忽视的“补救”,2021年1月,被撤稿论文的作者们在著名预印本数据库arXiv上传了如下的论文:

此外,作者们还在Zenodo上传了被撤稿论文的源数据:

事件到此似乎基本结束,很多关于此次撤稿的报道中都以作者这种勇于承认科学不严谨,并且及时补救的态度表示赞扬。

然而,真实的情况究竟是什么?

三、撤稿背后的故事

最近,关于这次撤稿事件又引起了不小的关注,起因是前不久,两位“大师兄”举行了几次线上小范围研讨会,一方面是探讨马约拉纳费米子研究的未来,一方面是讲述撤稿发起背后的故事。

结合本次讨论会的内容以及笔者对他们的提问与答复,征得两位学者的同意,部分内容将在本文中分享,希望从中能学到关于做研究的一些有益见解。

撤稿事件完整时间线:

图3 撤稿事件时间线(根据Sergey的原版时间线翻译)

 SergeyVincent 提出的核心质疑:

目前的关键争议是到底属于数据操控和删除,还是信号的校正失误

证据1

且看下图:

图4 原始论文图2a-c(文字为Sergey标记)

随后,Sergey将其进行切割后发现:

注解如下“And I mean literally take it apart. We already know two pieces were cut from the raw data, so let's keep cutting. We cut at every major discontinuous jump in the data.”作者当时的答复是The authors later told us it was done for aesthetics.”(美学!!)

证据2

图5 原始论文图2e及其疑点

红色点完美地排列成1,即使是权威的理论也不可能如此接近1。

以上证据为之前发布的相关质疑,而在刚刚举行的这次研讨会上,原始数据和论文数据的完整对比如下:

图6 原始数据和论文呈现数据对比(图源:Sergey等的研讨会提供)

因此,Sergey等人认为,论文确实不存在data fabrication,falsification(伪造数据),但应该涉嫌data manipulationcrucial data omissionunsupported claims(数据操纵、关键数据遗漏、结论无支撑)

关于“数据摘取”,做材料的人应该最熟悉的就是SEM大范围形貌区域里,挑选看起来挺美的局部形貌,正如Vincent的这张照片所示:

图7 带有偏见的数据摘取(图源:Vincent等的研讨会提供) 

回到本文开头,关于论文末尾那句“Data availability”声明,Vincent和Sergey的答案是:

Please share full data instead!

诚如Sergey所言,当审稿人要求作者提供数据的时候,往往是很短的时间下,某些数据就补全了,听起来是不是蛮有趣?而那些提供的数据究竟是不是full data呢?

四、Let It Go?

笔者向Sergey提问,初级研究者,例如学生,如何在研究中辨别错误的数据分析以及如何得到有价值信息?

Sergey的回复里,用了一句很有深意的话:

Respect everyone, trust no one!

他接着说到,当从事自己的研究时,切记“Follow you got”。即,当你分析数据时,有丝毫的内心迟疑,要一而再,再而三的反复分析,重新分析,和别人讲起你的迟疑。

Vincent则从拿到数据后的内心来解读,当你的数据里有一部分符合你的心理预期,你千万不能忽略其他看起来“不合群”的数据。

最后,Sergey动情的表示,之所以举办这样一个线上讨论会,之所以对这件事持续关注,主要的一个原因是为了学生,希望教会下一代的研究者。因此不能简单的让撤稿“Let It Go”。此外,他还表示,接下来将撰写一些文章来讲述这个话题。

而关于“挑选数据”,他提供的这幅图应该诠释了一切:

图8 图源:@spinespresso

就在4月15日,Science发表了来自Sergey作为通讯作者的一篇文章:

这篇论文的全部原始数据已经上传至Zenodo,包括仪器原始测试数据信息:

本文最后,笔者想起前不久Sergey关于此次撤稿事件的一句感慨:

THIS IS SCIENCE. Please study it, ask if unclear.

本文由 Free-Writon供稿。

本内容为作者独立观点,不代表材料人网立场。

未经允许不得转载,授权事宜请联系kefu@cailiaoren.com。

欢迎大家到材料人宣传科技成果并对文献进行深入解读,投稿邮箱: tougao@cailiaoren.com.

投稿以及内容合作可加编辑微信:cailiaorenVIP。

分享到