偏差的定义很广泛,基本上是指当行为违反了规范或偏离了真实因而引起的错误。因此,偏差在社会的各个领域定义是大不相同的。本文主要阐述的是学术研究中数据收集,分析和解释过程中的偏差。偏差的产生有些是无意的,因为每一项研究都有较多混杂的变量与限制条件,有的即便是实验设计的很好也无法完全避免。这种情况下如果偏差仍然存在,作者要在论文中加以说明。但下面所述的偏差则是故意的。有的科研人员可能因为这样那样的原因在研究过程中有意制造对自己有利的偏差,这是一种不道德的行为,更是不被允许的。
(1)选样偏差
一项研究选样是一个非常关键的步骤。在选样过程中有可能产生许多偏差。例如在进行医学试验时,有些病人比其他病人更容易被选入实验。又或是试验与某些资助单位有利益上的联系,因此在选样上没有做到真正的随机取样。这样的样本无法代表母群,这种结果称为选择性偏差(Selection bias),会对实验结果产生非常大的影响。
(2)数据分析的偏差
在数据分析中偏差发生的主因包括伪造,滥用与操控数据等。伪造和滥用大家比较熟悉这里就不多说了。操控数据多指不管原先假定条件,以成对比较进行多重检定。例如在一项研究中,目的在于找出一组病人之生物标记与另一组病人有之显著不同,但是试验结果并无显著不同。有些研究人员则将数据设法分成数组分别比较,直到有两组数据有显著不同。这种方法称为操控数据。
(3)数据解释的偏差
有些研究人员对于研究结果先有定论,不能接受与预期效果不一致的结果,因此在对实验结果解释的时候,避重就轻。比如讨论统计上具有显著性,而忽略其结果在医学上无意义又或是将特定数据的结果解释为所有通则。
由此可见,在学术研究过程中,除了科研人员自身研究能力之外还存在一些客观的偏差“诱因”。比如科研基金竞争激烈;个人职业期望;科研商业化与企业有利益纠葛等等。这些因素对学术研究都可能产生极其恶劣的影响。科研人员应要尽可能查觉所有偏差的可能来源而且尽力地消除偏差,遇到这类问题及时解决。编辑,同行评审都要负责探查可能存在的偏差,考虑这些偏差对研究结论是否有重大的影响,不合格的坚决不予发表,真正做到恪守学术诚信和职业道德。
[1] Ana-Maria Simundic, Bias in research, “Biochemia Medica”, vol. 23, no. 1, pp. 12-15, 2013.
[2] Christopher J. Pannucci, MD and Edwin G. Wilkins, MD MS, Identifying and Avoiding Bias in Research, “Plastic and Reconstructive Surgery – PLAST RECONSTR SURG”, vol. 126, no. 2, pp. 619-625, 2010.