现在h指数有愈加流行的趋势,大家认为相较于影响因子,h指数能从总体上更客观地评价研究者的水平。影响因子更多地是对期刊的评价,而h指数则兼顾了研究者的被引次数和文章数量。文双春老师被推荐至头条的博文用了个刺激人的题目《h指数准确预测科学家伙能否成大器》。但其实,姑且不论预测一个家伙能否成大器是很难的一件事儿,如果从h指数计算的本质来看,它仍然有不靠谱性。
一个缺陷是,基于不同的检索数据库如Web of Science、Scopus、Google Scholar,算出来的某个研究者的h指数常常不一样,这跟数据库的收录范围有关。这时候,我们选择用哪个?估计很多人愿意用比较高的那个。这三个里头,更多时候或许Google Scholar给出的h指数最高,我发现它有时会将非论文的材料算作引用(如果这个材料提到了你的文章)。实情是,这些检索数据库并不能体现你文章的所有引用,比如WoS,更侧重于SCI收录期刊的引用,直到最近才稳定的将一些中文期刊的引用算进去。另外,不同学科领域被这些检索数据库收录的程度不同,比如分类学期刊被收录为SCI的比例小,而分子生物学和医学则高很多。因此,不同领域科学家的h指数其实并没有太多可比性。
但我觉得一个更加值得关注的缺陷是:h指数没有区分作者的实际贡献。
来看一个简单的例子。A和B是紧密的合作者,两者共同发表论文,共同署名了20篇引用次数超过20的文章。这时候两者的h指数都是20,表面上看好像科研水平相当。但是,在这20篇文章中,A是15篇文章的第一作者,而B只是5篇文章的第一作者。很明显,A作者应该有更大的贡献。所以,h指数倾向于对大的研究团队有利,多个合作者会共享比较高的h指数(大合作的实验学科就比常单兵或小集团作战的理论学科h指数高),这种情况下混淆了不同作者的实际贡献。
要真正衡量研究者的实际贡献,应该对h指数做适当的改进。比如,只统计某位研究者作为第一作者或通讯作者时的h指数。对于上面的例子,A的h指数就应该是15;而B是5。这个简单的改进也是很粗糙的,因为有时候难以界定研究者在非第一作者文章中的实际贡献。
为了让评价更细致客观,可以考虑在计算h指数时对不同顺序的作者有个权重。比如,第一作者权重为1,第二作者权重为0.7,第三作者为0.4。如果第一作者同时是通讯作者,那么权重为1;如果通讯作者非第一作者,其权重计为0.8。还是上面的例子,假定A是15篇文章的第一作者,是另5篇的第二作者;B是5篇文章的第一作者,另15篇的第二作者。这时候计算两者的h指数:A为(15*1 + 5*0.7)=18.5;B为(5*1 + 15*0.7)=15.5。我们可以发现,用现有的计算h指数的方法,A和B用h指数所代表的科研贡献都被高估了,并且现有的方法掩盖了A和B实际贡献的大小。
不知道科学计量学领域是否已经有人用这个思路修正h指数,我在Scientometrics期刊用“author+order”做关键词进行检索,没有发现相关的论文发表。如果还没有关于作者顺序对h指数影响的研究发表,我建议相关领域的同志们考虑下这个问题并且设计一定的算法。当然要考虑到其他一些问题,比如作者排名的权重问题(即如何更客观地衡量在文章中的实际贡献)。同时,也不得不考虑到修正算法的简洁性,太复杂不利于推广使用,h指数和影响因子之所以能流行,就是因为其简单性。当然,对于发表论文时作者不按实际贡献排名(比如可能按名字字母顺序)的领域,就要想其他能反应实际贡献的修正算法。