学术道德是科学素养的重要组成部分。“十论学术道德”系列文章对代写、剽窃抄袭、数据造假、虚假署名、图表侵权、发表偏倚、滥引、一稿多投、重复发表、香肠论文这十大学术不端现象进行剖析,总结建设风清气正的学术环境需注意的要点。
本文简述数据造假的现象和防治措施。
论文数据造假是弄虚作假在学术领域的体现。各行各业都有假货存在,科研领域也不例外。
科研数据造假的动机通常是为了骗取科研经费或发表论文。造假手段包括捏造和篡改数据。这种造假属于具有主观恶意的学术不端行为,在违反学术道德的十恶排行榜上高居第三,其恶劣性质和危害仅次于代写和剽窃抄袭。需要注意的是,由于水平或疏忽等非恶意原因导致的数据错误和观点分歧不属于数据造假。诚实性出错是允许的,但是不允许造假。
近二十年来,国内外著名期刊发生了很多影响较大的科研数据造假丑闻或数据真实性质疑事件,涉及生物、医学、物理、心理学等众多领域,造成大批论文撤稿和当事人被处罚甚至判刑的后果,而且造假趋势愈演愈烈。科研数据造假已经发展成为社会各方极为关注的热点问题。这里的数据指的是表格、插图、照片等任何数据。科研数据及结论造假的具体形式包括以下三种。
在明知不正确的情况下故意使用不当的研究方法。
例如,故意错误选择试验样本或错误设置试验条件,故意用错模型或公式。这种造假具有欺骗性,与诚实性错误经常难以区分,即分不清到底是尝试新做法或技术性选错方法,还是明知故犯。甄别这种造假的办法是看所用方法的假设、理由和输入条件是否有完整的介绍。如果有完整介绍,则基本可以排除恶意造假。如果没有完整介绍,那么这种数据可能是为了制造某种效应而骗人的。一般来讲,严肃认真地使用一个错误的方法做出的数据都不是造假,只是诚实性错误。造假的最大特征就是隐瞒掩盖信息,让读者无法了解方法的全貌,或者无法复制验证结果,以便瞒天过海。
故意掩盖或歪曲数据的含义并得出错误结论。
例如,隐瞒、回避或歪曲重要事实,以偏概全,选择性虚构逻辑。这种造假也具有欺骗性,与诚实性错误难以区分,即分不清是水平差、观点有分歧还是误导性地明知故犯。甄别这种造假的办法是看结论是否具有误导性的利益目的,以及是否在狡辩和混淆视听。需要注意的是,对这类问题进行打假,必须注意避免乱扣帽子或破坏学术自由。学术发展需要宽松的环境。如果人人自危,束手束脚,担心被指控造假,对于开创新事物和百花齐放地发表新观点(包括不成熟的观点)都是非常有害的。
故意伪造或篡改数据。
这种造假是最没有争议的,也是最常见的。这种造假一般是由于同行无法复制结果而被揭穿。它具体包括:从无到有地编造添加数据;将真实数据中不符合自己预期结论的数据删掉;将“不好看”的数据删掉;将自己无法解释的有效数据隐瞒。错误的数据肯定要删掉,没有争议。这里唯一的诚实性错误争议就是什么叫有效数据。由于科学技术水平的局限,很多数据现在无法解释,但将来可能能够解释。如果方法和数据没有错误,那么这种无法解释的数据理应保留在论文中予以披露,以维持数据和结论的完整性。但是,科研人员通常不希望发表自己无法解释的数据,因为担心无法回答同行评审人的疑问。科研人员是否有权利拒绝披露和评论自己不能解释的数据,这是一个颇有争议并涉及同行评审宽容性的话题。总之,添加假数据和删减有效数据能够被简单明确地裁定为造假,但是隐瞒无法解释的数据是否都能被裁定为造假是有争议的。为了避免被指控造假,最安全的做法是披露全部数据而不隐瞒任何。
科研数据造假的处罚措施包括学术规范处罚(例如公开道歉、期刊通报批评)、行政处罚(例如降薪、开除)和民事处罚(例如罚款)。有些严重的数据造假会被以其他相关罪名(例如骗取科研经费)起诉而获刑。有关部门还在考虑设立科研人员学术诚信档案制度,使得造假成为一个永久记录的污点,让造假者职业发展受阻。不少期刊在增加数据编辑审核制度,并考虑改革同行评审过程,使得论文及其数据能够在网上公开接受全球任何人的评议,对被举报涉嫌造假的论文数据进行专门审查等。
这些措施的目的就是为了告诉大家,数据造假这道红线是不能触碰的!