引言
科研论文写作过程中最关键的要素之一就是科学数据的有效整理和清晰表述。
科学数据是指将研究对象抽象化和概念化后所形成的、用于科学研究活动的相关事实记录。科学数据的形式包括统计数据、实验结果、观测结果、访谈记录、图像和声音等,是证实科研发现或支撑学术观点的证据,也是进行理论推理的基础。[1]
科学数据的整理
基于不同的研究设计,数据来源可包括实验、调查问卷、文献资料等。任何一项研究的具体实施在广义上都属于数据收集过程。
数据清洗包括筛选、去重、填充缺失值、处理异常值等步骤,以消除异常值和噪声。
数据的类型可以分为连续性的变量(如身高、体重、化验值等)和分类变量[如性别(男、女)、药物反应(阴性、阳性)、疗效(治愈、显效、好转、无效)[2]。
常见的数据分析方法包括描述性统计、推断性统计、回归分析等。常用的统计分析软件包括SPSS、R语言和Excel。有时科研人员可需要求助于专业的统计人员,从而在研究设计(如受试者招募人数)和数据分析方面做到更加游刃有余。
应避免使用模糊不清或可能存在歧义的表达方式,而应使用本领域内准确的术语来描述数据。国内的作者们可随时使用“术语在线”网站
(https://www.termonline.cn/index),了解国内规范使用的科技名词。同时,科研人员也可参阅目标期刊的同类型文章,并注意同一主题下术语的演变。例如,新冠病毒最初被称为2019-nCoV,后统一命名为SARS-CoV-2。
简洁明了的句子和段落有利于读者更轻松地理解研究结果。例如,“it was observed in the course of the experiments that”可以直接写成“we observed”;而像it is of interest to note that这样的套话完全可以删除,以免影响读者对数据的阅读。
例如,宜表述为“增加了50%”,而不宜写成“增加了一些”。
一图胜万言。科研人员可以利用图表、地图、动态图等方式呈现数据,从而为原本干巴巴的数据注入灵魂。传统的SPSS、R语言和Excel都可生成简洁明了的统计图(如扇形图、条形图、折线图)。新近的生信分析则可在线通过各类数据集获得基因组测序图、转录组测序图和差异表达图等。此外,随着AI技术的快速迭代,已有大量的在线资源可以快速生成更加具有视觉冲击力的图形化数据[3]。
总之,科学数据的整理和表述至关重要。科研人员既要掌握最基本的数据整理和表述能力,也要与时俱进,不断学习和应用最前沿的数据处理方法和技术。
参考文献
[1] 赵秋红,李元睿,邓修权,等. 科学基金资助机构视角下的科学数据管理研究[J]. 中国科学院院刊, 2021, 36(12): 1456-1462. DOI:10.16418/j.issn.1000-3045.20211116001.
[2] 医小咖. 如何规范而专业地展示研究结果与数据?这么详细的示例+解读不要错过![OL]. [2023-07-14]. https://zhuanlan.zhihu.com/p/31148038.
[3]https://blog.csdn.net/weixin_39661129/article/details/111389260.