给我一篇假论文,我能骗倒半个地球
发布时间:2015/3/10 17:51:37
 

作者:李慧翔2013-11-07 19:23:49来源:南方周末

 恭喜,你的论文已被我们录用。”201374日,非洲生物学家Ocorrafoo Cobange先生收到了这样一个好消息,在投稿两个月后,他终于收到了《自然生物制药》杂志的发稿通知。多年来,Cobange先生在坐落于厄立特里亚首都阿斯马拉的Wassee医学研究所工作,研究一种青苔提取物所具有的抗癌性能。

《自然生物制药》杂志号称是经过同行审议,提供高素质论文的学术杂志,其审稿人是来自各国大学的制药学教授。能在这样一本具有相当学术地位的杂志上刊发论文,想必Cobange先生的心里,已经乐开了花。

但显然,并没有人为这个好消息欢呼,因为根本不存在生物学家Cobange这么一个人,所谓在厄立特里亚的医学研究所也是子虚乌有。事实上,这篇钓鱼论文的真正作者是哈佛大学的生物学家John Bohannon。在过去的10个月里,Bohannon用假名、假单位和假论文——用他自己的话说是任何评审者,只要拥有高中水平以上化学知识,并能读懂基本的数据图表,就应该能立刻看到论文的问题,它的实验缺陷得一塌糊涂,所有结果都毫无意义”——投给了全球304个开放出版期刊(Open Access)。

然而,超过一半的期刊接受了这篇文章。在304家期刊中,有157家表示接受,录用率近52%。一些刊物提出修改意见,但大多限于论文格式与语法问题。只有36家杂志的审稿意见提及稿件的内容,有16份评稿意见认为论文很糟糕,但还是决定录用。

这篇骗倒半个地球的论文,究竟写了些什么呢?Bohannon做了精心准备。首先,他专门写了一篇粗看起来可信的普通论文,但其中有严重的错误,让合格的评审者很容易就能发现、认定它不适合发表。论文的基本格式是:设三个变量——某分子X,来自地衣物种Y,能抑制癌细胞Z

接下来,通过作者设计的小程序,把各类分子、地衣物种以及癌细胞组合在一起,随机填写到上面的变量位置,于是就生成了数百篇论文,除此之外这些论文其余的部分都一样。

最后,为了避免对方对作者流利的英语水平产生怀疑,Bohannon还特意把全文用谷歌翻译翻成法语再翻回英语,然后校正了那些明显的错译,得到一篇语法正确但明显不是英语母语的人写出来的文章。论文作者的名字和其所属单位都是虚构的,用非洲地名人名拼出来的。

一旦刊物答应刊登论文,Bohannon就发信称实验出现重大错误导致结论不正确,要求退稿。但居然还有刊物回信说:尊重您的撤稿决定,但如果您打算发表这篇论文,请告知我,随时愿意为您效劳。总体而言,中招的学术期刊主要来自印度和美国,此外有神户大学这样著名学校出版的,以及学术协会的,甚至包括知名出版机构ElsevierSAGE旗下刊物。

其实,Bohannon已经算是相当有良心的钓鱼,毕竟文章还是手写的。接下来我们要见识的,是两套计算机程序,不少人利用它们自动生成的论文,已经把学术界搅得天翻地覆。

几年前,美国麻省理工大学(MIT)计算机专业的三位研究生编写了论文自动生成软件SCIgen。它能够从固定的词库中,随机抽取专业术语,以符合文法的方式生成论文。因为学术论文中大量充斥着一些专业性很强的用词和固定的句式,这种软件生成的文章乍看上去相当符合规范。再配上自动生成的漂亮图表和详细的引用文献,一篇就内容而言不知所云的文章第一眼往往能唬住不少人。

SCIgen的首次亮相是在2005年,一篇由机器生成的论文被第九届系统论、控制论与信息论多学科国际会议收录,得知真相后,IEEE(美国电气和电子工程师协会)颜面大失,迅速删除了论文。然而,德国学生又发现了这个神器,分别于20082009年向在中国武汉举办的两个IEEE国际会议投稿,结果机器虚拟的Schlangemann教授被当成了知名学者,还被邀请作为会议的主持人。

SCIgen已经至少在世界各地的学术会议和期刊上成功发表了十几篇论文后,康奈尔大学数学系博士后Nate Eldredge又根据SCIgen进行了改编,做出了Mathgen——计算机论文自动生成器。

201283日,一位来自南部北达科他大学霍普分校“Marcie Rathke”教授向一份广受赞誉的期刊——《理论数学进展》(Advances in Pure Mathematics)投递了一篇论文。仅仅10天之后,这篇论文就被接受了,编辑还一本正经地写了5点修改意见。没错,这篇论文正是用Mathgen自动生成的。虽然论文摘要每句话都看起来牛哄哄的样子,但实际上没有任何意义。

其实,论文钓鱼并非什么新鲜事物,自从索卡尔事件起,类似的事件就屡见不鲜。但钓鱼者的初衷,都包含着净化学术风气的目的——索卡尔给《社会文本》投伪科学文章是为了考验对方的学术水准和编辑责任心;SCIgen的作者是因为看不惯那些学术水平低下,无质量把关,只知收取昂贵注册费用替作者攒论文发表数量的野鸡会议Bohannon是为了测试开放期刊的节操,以及揭示同行评议甚少存在的黑幕。

只要靠收取高额出版费牟利的杂志还存在,只要那些淡泊学术只图名利的野鸡会议还存在,就还会有人上钩,哪怕Bohannon在论文中已经藏下了图文不符、对照组不符的直钩,咬钩的鱼儿依然兴趣盎然。