统计作为研究方法,是许多科研结果能成立的关键,统计中的计算好掌握,然而统计方法的概念却有许多陷阱,一不小心就会踏入泥沼而不可自拔。
当今学术界出版数量重于研究质量的坏风气逼着科研学者没时间注意自己的脚步,虽然无法扭转大环境,但统计方法的概念却是学者能够把握的。
比利时鲁汶大学的欧本教授(Orban de Xivry)与伦敦大学学院的马金 (Makin)在一篇研究中详细探讨了科研学者常犯的10个统计学错误及如何避免犯错,本文将介绍这10个统计常犯错误。
只要把握设计研究方法、开始研究执行及动笔撰写论文的三个黄金起始点,甚至思考学术问题时养成检视的习惯,就能通过这一阶段的修炼了。
Absence of an adequate control condition/group
研究所针对的现象是否成立?成立的话规模如何?在缺乏对照组,或对照组规模不相当的研究中根本无法凸显实验组中操作的变向是否正确。
Interpreting comparisons between two effects
without directly comparing them
某现象可能在实验组中达显著,在对照组中未达显著,切记!这并不足以证明什么,不能把未经统计方法计算的任何数据当统计资料。
要证明在实验组中的某现象大于对照组的某现象,只能直接用统计方法来计算,例如ANOVA就是比较两个群组中的现象的统计方法。
Inflating the units of analysis
有时学者会为了达到信心度大的实验样本数而采取过小的单位,但是适当的样本单位才能促成正确的分析!
进行群组比较的时候,应该要在每一个样本都能比较某现象,而不是在同一样本上比较某现象。
当一个变量出现一个或数个离群值时,就容易影响积矩相关系数,造成伪相关。其实散布图一看就很明显了。
样本数过小容易使结果偏离常态分布,除非能提出先验效应值,或是能够复制试验结果,才能例外地接受小样本数。
循环分析就是从已经过整理分析的数据中再进行一次分析。最常见的做法就是分析过后去除离群值,再分析一次。
要避免循环分析必须先制定分析标准後进行分析,或永远使用新的一组数据。
Flexibility of analysis: p-hacking
操纵p值,也就是伪造数据。很不幸地,不少医学尤其是药物研究都传过这样的不端。
其实,同时呈现原始实验结果与测试性试验结果、预期性资料与非预期性资料就可以了。
Failing to correct for multiple comparisons
多重比较后应进行修正。学界对多重比较后应进行的修正有许多公开的讨论及标准,应该摊开所有变量,找寻适当地多种比较修正方法。
Over-interpreting non-significant results
科研学者应公开效应值与p值,让其他研究人员权衡研究是否有继续发展的价值。
比如大样本数呈现非显著结果就是告诉其他研究人员大概不用再讨论下去了,但若是中样本数呈现非显著结果,或许还有其他实验的空间。
Correlation and Causation
这是运用统计方法时最常见的错误。科研学者必须把握的是,因果关系必须经过操弄变量来证明,最好能够加入第三个变量来证明因果关系。