学:学生,教:教师,李:李晓榕。
李:科研道德规范的关键何在?根基是什么?我认为有几条重要原则,包括实事求是、尊重原创、论功行赏(合理记功,give due credit)以及不多占资源等。学术不端是指蓄意违反这些原则的行为,包括伪造、篡改数据或剽窃、虚构、夸大研究结果,以及其他形式的明知故犯。常见例子有:造假、剽窃、独自发表合作成果以及一稿多投等。首当其冲的是伪造、篡改和剽窃这“三大重罪”。作奸犯科者身败名裂、恶名远扬,自不待言。最典型和恶劣的学术不端是伪造、篡改数据或结果。咱们先谈这一点。
何谓弄虚作假
李:性质极为恶劣的造假是伪造数据。国内外都有打假人员和软件。多年前美国的巴尔的摩(David Baltimore)事件相当轰动。他是诺贝尔奖获得者、洛克菲勒大学校长。他们在《细胞》杂志上发表了一篇论文,其中由一位合作者提供的实验数据是伪造的。一个博士后发现后提出质疑,后来的遭遇令人悲哀。事发之后,巴尔的摩企图压制事件的处理,以致最终在该校大多数教授的压力下不得不辞职。几年前有个轰动的舍恩(Jan Sch?n)造假案,其造假“胆识”之大、规模之巨、数量之多、影响之深是“史乏前例”。舍恩是贝尔实验室的青年研究人员,在《科学》、《自然》等杂志上发表批量文章,成为一颗急速飞升的耀眼新星,他取得了一个又一个激动人心的重要突破。其实他不仅伪造实验数据、伪造实验,甚至还伪造实验设备——他在文章中所描述的一些装置根本不存在!究其根源,还是在好大喜功的科研氛围中,心为物欲所役,扬名立万心切。更近的大丑闻还有臭名远扬的韩国“克隆之父”黄禹锡的克隆丑闻,黄因此被判刑18个月,“民族英雄”变成“科学败类”。美国知名生理学教授珀尔曼(Eric Poehlman)大量虚构伪造,向美国联邦政府的科研机构申请经费,他因此犯法而被判入狱一年零一天。
教:国内有上交的汉芯事件。
李:布罗德(William Broad)和韦德(Nicholas Wade)合著的《Betrayers of the Truth》(《真理的叛徒》)有一章指责古今一些大科学家的学术失范行为。著名统计学家C.R.劳(Rao)在《统计与真理》一书中言之凿凿,很信这些指责。这有严重的不良后果:如果那么多大科学家有这么严重的科研道德问题,凡人又该如何?但我觉得这有哗众取宠、追求轰动之嫌。我读后并不认为证据确凿,反而是疑点重重。要不是这种结论具有轰动效应,为什么草率地下结论?这本身就有科研道德问题。贾德森(Horace Judson)的《The Great Betrayal: Fraud in Science》(《大背叛:科学中的欺诈》)要好一些,但我仍有不少保留。科研道德规范与时俱进,不能完全以今天的标准去苛求前人。同理,今天视为正当的某些行为也许为前人所不耻。我觉得,一个重要评判标准是:当事人是否刻意掩饰其“失范或有争议”的行为。做了不该做而不知其不该做的事,那是无知,不是缺德;如果加以掩饰,这说明知道那是不该做的,那就是缺德;如果知其不该做而不加掩饰,那是厚颜无耻。
学:删除野值是不是不道德呢?
李:这要看情况。以诺贝尔奖得主、著名物理学家密立根(Robert Milikan)测定单电子电荷的著名实验为例。《真理的叛徒》和《统计与真理》都说,他在这个发现中大量伪造结果。物理学家、科学史学家霍尔顿(Gerald Holton)以及富兰克林(Allan Franklin)研究密立根,包括他当年的实验笔记本。的确,他只用了140次实验中58次的结果。但是据研究,密立根确实认为只有这58次实验是成功的,其他的都失败了。所以,这不是蓄意欺骗或篡改数据。至于他为什么认定只成功了58次,与科研道德无关。其实,密立根花了十年时间检验他很不喜欢的爱因斯坦光量子假说,虽然精确测量结果与他的期望完全相反,但他尊重事实,不阿其所好。这是我不全信《真理的叛徒》的一个例子。有个故事,爱因斯坦收到爱丁顿勋爵的电报,说他的观测实验结果支持广义相对论。当时在场的一个学生问,如果实验结果不支持相对论怎么办?爱因斯坦回答说:我会为可爱的勋爵遗憾——理论还是对的。(Then I would feel sorry for the dear Lord. The theory is correct anyway.)这只表示爱因斯坦对相对论的极度自信,即便我们认为这种自信是病态的,也不能说他不道德。如果密立根是为了得到好结果而故意从140次实验中选出58次的结果,那就是篡改数据。不清楚时,决不能想当然地剔除野值或异常数据,应该拿出全部或者典型的。有初一就有十五,顺手牵羊未被惩罚,就可能蓄意行窃。诚实的研究者尽可能不受偏见的影响,道德有问题的则曲解数据,使之支持自己喜好的观点。在数据结果中选用有利于己的来报告,是不道德的。遗憾的是,这类犯规行为并不孤立。令人吃惊的是,《纽约时报》报道,对2000多名美国心理学家的匿名调查表明,其中竟有约1%的人承认伪造过数据。还有很多其他数据处理上的不道德行为,比如故意选用对自己期望的结果特别有利的统计方法来处理数据。要清楚道德规范到底是怎么回事,清楚后做到问心无愧,确实觉得没做错什么。至于模糊的地方,真正做到问心无愧就行了。所以,
总原则:问心无愧。
还有一种情况。有一次我与人合作,合作者所做的一部分仿真结果与我的理论预期有本质的不同,合作者急于发表论文,想隐而不报那部分仿真结果,我不允许,花了一段时间后终于搞清,根源是:在含有极小概率的严重事件的场景中,正确的仿真结果与正确的理论预期可能大相径庭:如果该严重事件在仿真中未发生,其结果与理论预期差别很大,而一旦发生,差别也会很大;仿真量不够大时,这种差别不可能消除。
学:有时要跟人对比,明显发现他错了,而那个人的文章已经发表很久,多次被引用,这个时候是剔除他的错误数据不比,还是明确指出他的错误?
李:除非铁证如山,不要一口咬定他错了,指责他的错误,特别是他的品德,因为你不了解他的实际情况。在证据不足时指责他人的诚信有失公允,要预设无辜(give him the benefit of doubt)。不要疑人窃斧,疑心生暗鬼,除非证据确凿,不该轻易怀疑别人的品德。只要宣布自己所得结果,指出不一致就行了,对错自有公论,时间会做出最终裁决。另一方面,如果某人行为严重不轨铁证如山,特别是周围的惯犯,见蛇不打三分罪,打蛇不死罪三分。不过,要注意保护自己,穿个马甲儿打蛇。检举揭发在国内很少见,即使知道,最多私下说说,不会正式告发,唯恐被蛇咬。其实,城门失火,殃及池鱼。如果学术不端盛行,哪还有正直学者的天地?见蛇不打,蛇蝎泛滥,终受其害。
教:见蛇不打三分错,这要求太高了,有几个人能像方舟子那样豁出来?我们大多数人是见蛇就躲。
李:我并不提倡你们去当方舟子,以“打蛇”为业,但见蛇要打。我不建议你们四处寻蛇以灭之。要讲究打蛇策略,注意保护自己,避免无谓的牺牲。而且,必须有绝对把握这确实是一条蛇,是蓄意的、严重的学术不端。能够如此肯定,绝大多数是身边周围的。如果大多数人都能保持周围环境的清洁,大环境也就好了。
教:做生物做材料的介绍完实验后,要提供数据,包括《科学》和《自然》上的文章。那是面向实验的,没有多少推理过程。别人发表的结果,我用同样的实验平台,老是重复不了,那么就可以写文章质疑这个实验可能是错的,甚至有可能在造假。我也有类似的体会,比如读一篇文章,我用的参数与他的完全一样,就是调不出他的结果来。这时我是不是也应该有勇气去怀疑他?
李:这时应该怀疑其结果,而不是人品。英国科学家巴比奇(Charle Babbage)说得好,品德就像是妇女的贞洁,一旦受到怀疑就等于被毁灭。除非很有把握,也不要公开质疑其结果。公开发表影响大,要慎重。只有一再遇到这种情况后,才可以怀疑其人品,也就是量变到质变。
教:在生物学科,文章发表之后,要求把程序上传到期刊的网站上,以便他人验证结果。在我们的学科里,没有这个。
李:这说明对他们来说,数据结果可靠特别重要。我们的仿真结果只是辅助性的,没那么重要。这是一个重大区别。据我所知,医学和生物学科伪造、篡改数据的案例最多,因为在这些学科数据最有发言权。反之,数学界的造假,几乎闻所未闻,因为数据无足轻重。
教:还有些人防着别人验证。很多关键性参数他们不写,或者试验方法是用留一法或交叉验证法,参数不一样,实验方法不一样,结果也不一样,根本没法重复。
李:在不少情况下,作者确实有问题,但也有例外。比如有位我挺熟悉的著名学者,有些人抱怨说,没法复现他的结果,他总是闪烁其词,隐瞒必要的细节或条件。我觉得他学风不错,恐怕是因为他要保护成果的商业利益,这跟学术出版是有矛盾的。他的一些成果确实在不少机场用上了,如果公开,就难卖了。