不好的选题
第一个是我刚才说过的改别人模型的假设这种情况一定要杜绝。我拿到这种文章就觉得纯粹是在浪费时间和精力因为解这样的模型通常很累而且最后发现错了。 第二种是生搬硬套别人的理论模型没有把经验事实给搞清楚。先把你要讨论的事实给搞清楚然后用已有的理论去解释你的问题和事实。关于中国过去土地制度的变化从秦始皇到现在的土地制度我们经常收到讨论这类问题的文章往往是生搬硬套科斯的产权理论等。做这样的文章你不去不扎扎实实阅读一些历史书籍不去看一些数据而是生套别人的理论可以说是毫无意义。所谓研究就必须要做出自己的东西。格雷夫在研究马格里布犹太商人的合同执行问题2他挖掘很多中世纪的合同去研究真正的做了一些历史研究而不是生搬硬套现有的理论。 第三个是关于稻草理论为什么叫稻草理论呢?二十世纪初对欧洲的知名知识分子做了一项调查在过去一千年人类什么样的发明对人类的进步起了关键性的作用有一个人给出的答案是稻草为什么是稻草呢?他说如果没有稻草你就养不了马养不了马就没有办法去打仗于是欧洲的文明就拓展不开来。所以没有稻草就没有今天的欧洲所以稻草是最重要的发明。你说他有没有道理呢?道理是有一点但是被无限放大了。这样的理论就可以说是稻草理论其实并没有那么显著但是被夸大了。 还有一个常见的问题就是研究决定因素我最怕看到这类文章。花了好大的劲最后做了一篇例如工资是由什么决定的。这种文章最好别做你在回归方程里放十个变量我可以说你的变量不够你应该放二十个那二十个可能还不够你得放上一百个变量。这个都是由很多的因素决定一个,你能把所有的因素都能穷尽吗?有些人说我做了一个实验,刚开始时二十个,后来发现有些因素不显著,我把它给去掉了。然后重新放,发现又有一些不显著,又给去掉了,最后这些因素是最显著的,所以我留下来了。这不是做研究的方法,我们一定是研究一个机制,控制其他变量把一个机制说清楚就可以了,比如你可以问工会对工资有没有影响,你只要把这个因素搞清楚就可以了,而不是说非要去研究工资有哪些因素决定。这样的问题不是一个好问题,不容易在好的期刊上发表。 2.论文写作技巧 现在我想讲一下论文写作技巧方面的问题,我想从两方面来谈这个问题,一个是理论研究,一个是经验研究。如何做理论呢?有很多人说我做理论啊,就是写出一个模型来,模型推导出什么结果就是什么结果,这种情况是没有把经济学给搞懂。做经济学的文章,你一定要有一个符合直觉的故事,先把你的故事用自然语言表述出来,如果你的故事没有办法用自然语言表述出来,那你肯定是什么地方出现问题了。首先用自然语言把这个故事讲出来,一定是你已经知道你要的结论,然后去编一个故事,不是你写一堆假设,然后推导出一个模型来,推导出什么结论我就接受什么结论,这是完全错误的。 哪怕是数学家也不是怎么做的。你试想阿罗当年在写阿罗不可能定理的时候,他难道事先没有把这个结论想好吗?难道是从他的四个假设出发最后推导出他的不可能结论的吗?肯定不是这样的,他肯定是有个直觉告诉他这是不可能的,然后再回过头来,找最小的假设的集合。结果发现,必须有这四个假设,才能推出所需要的结论。其实其中有些假设基本上很难符合事实,你比如其中有一个两两不相关原则。我刚到美国的时候,美国总统大选有三个候选人,老布什、克林顿和罗斯·佩罗,Ross Perot?。根据两两不相关原则,意味着老布什和克林顿两个人的排序不受老布什与佩罗排序的影响,也不受克林顿和佩罗的影响,这在现实中是不对的,但是他必须要这个假设才能得到他的结论。他是倒过来想的,其实数学家也是这样想问题的,你比如说数学里有很多猜想,比如哥德巴赫猜想,是先有这样的猜想然后才证明出来的。我以前也不知道,我跟我的第一个导师做研究,写理论模型老写不出来。后来我碰到一个学数学的同学,我就问他我想得出一个结论,怎么能得出来?这位学数学的同学一句话,使我茅塞顿开,他说在数学上想要什么样的结论都能得到,看你的假设是什么。数学上有一大堆数学的公理,你不能超出这些数学的公理的假设。经济学稍好一点儿,经济现象太复杂了,你可以做一些假设。但是你一定是先有结论,后写模型,把这个故事讲圆了,而且这个故事要讲的精巧一点。然后你要找到适当的经济学模型,用严谨的数学语言把故事用表达出来。这里有两个关键词,第一个是用适当的经济学模型,最好使用现有的经济学模型,就能把它给讲出来,模型又比较精巧,然后你还能用数学语言讲出来。什么叫恰当的经济学模型呢?如果你是做制度经济学或者新政治经济学研究的,那应该知道最近几年一个火的不得了的人,他叫达龙.阿西莫格鲁Daron Acemgolu,他几乎所有的文章都很精巧,他有一篇文章Why Did the West Extend the Franchise?3 ,就是说西方民主化过程是怎么走过来的,西方的民主化过程并不是短期内完成的,英国大概花了220年的时间,一直到1928年妇女才拥有跟男人同等的选举权4。他讲了一个什么故事呢?他就讲穷人跟富人之间的斗争,穷人斗的厉害,要自己的利益,富人就放一点。我们完全可以用马克思的阶级斗争来解释,但是你要用马克思的阶级斗争来解释,别人就不认,至少从现代经济学的眼光来看,这不是一个理论或者是不能接受的理论。所以他编了一个故事,他编的是一个Commitment承诺)的故事,当穷人向富人要福利的时候,富人说我给你,但是决定权还在我这里。但是穷人一想,你答应给我,到头来你又不给我,怎么办啊?这里面其实是一个承诺问题,怎么实现这个承诺呢?富人说干脆让你们穷人决定,这不就是民主吗。你自己决定该怎么干就怎么干,我不管了。这个故事就是一个经济学的模型,这也是Edward Prescott得诺贝尔奖的模型。但我觉得根本没有必要这个模型,马克思的阶级斗争理论完全可以解释,而且可能解释的更充分。但是你最好写一个经济学的模型,讲一个经济学的故事,别人可能更容易相信。 那好,大家会问这样一个问题,你既然可以用自然语言表述出来了,那为何还要用数学模型来表达呢?我觉得唯一的原因是自然语言有漏洞,自然语言没办法表达清楚,特别是汉语。比如我坐在这里讲,语法上错误连篇,汉语就决定了你可以不讲很严谨的语法,但英语你要是不讲语法别人就听不明白。英语比汉语更严谨一些,但是我觉得汉语写诗要比英语好的多。据说法语更加严谨,但是再严谨的自然语言它都存在漏洞。你有时候听一个人用自然语言讲得天花乱坠,但是要真写到模型上来,可能写不出来,会有很多的磕磕绊绊。举一个最简单的例子,我刚说了中国资本回报率很高,但是我们又输出资本,你怎么去解释这个问题呢?你用自然语言可以说出来一个比较简单的故事,你可以给出一个解释。我们有些企业从银行贷不到款,有些企业从银行贷到很多款,所以这里头总是有企业得不到贷款,所以一些贷款就会流到其他地方去。这样听起来似乎是有道理的,但是你要写一个模型你试试,它不是那么容易的。这样的模型,你通常要用到ORG模型Organization Generation,而且你一定要加入银行它有一些问题,你必须用经济学理论模型思考的时候,你才能发现一些你想不到的东西这是非常重要的。 经济学模型的作用一是检验理论的逻辑再者是发现新的东西。但是不是模型就一定是真理呢,特别是做应用型研究的时候不要把模型当做真理它只不过是跟一种自然语言替代的描述方式。我老跟学生说数学就是另外一种语言。数学家可以很简单的用英语、法语他写的这些数学论文大家都能看懂不需要多少文字。所以数学它是一套严谨的语言。这里说到经济学我个人感觉还是解释为主而不是去做预测我们只不过是讲一个故事就像历史学家也在讲很多故事经济学家用数据和模型来讲这个故事都是描述历史。我们描述短期的历史历史学家描述长期的历史。 怎么知道一个理论模型是好是坏呢,首先要看这个假设是不是合理。我刚才说了经济学家可以卖一点狗皮膏药做出一些假设但是你的假设如果太生硬特别是理论文章马上就会被砍掉。我老说这是短路了。你做了一个假设然后做了一大堆复杂的推导结果发现只是这个假设在起作用当然这种模型肯定是不行的。 第二个要看你的模型应用是否得当就是你是否用了正确的经济学模型逻辑是否清晰有些模型写的很复杂估计自己都没整明白一定要写的清晰要有血有肉。模型是否精巧你不能写的像大白话你比如我之前说的阿西莫格鲁加入Commetment显得更精巧一点。结论是否符合直觉如果结论不符合直觉你的模型显然是有问题。你做出来结果发现跟我们的直觉的不一样要不就是你的假设错了要不就是你的逻辑有问题。是否能从现实中得到一般化的结论这也是检验理论的一个重要标志。最后一个标准时结论是否经得起数据的检验当然这个要求有点高其实很多经济学模型就是表达一个idea不一定非得要用数据来检验而且往往是这套数据检验不成立我用另外一套数据。数据很多世界是多样化的。 经验研究 经验研究好的数据是第一要务我刚才说的这几个数据库都是公开的数据。省级的数据现在基本上都被大家用烂了除非你有好的idea我建议大家少用省级数据。花一点时间收集县的数据、城市的数据这些其实是可以收集到的。我知道有一个人在北京图书馆呆了一个夏天把县的数据全部给整出来了。我现在有一个博士生他现在在收集城市的数据他要研究官员的升迁问题。收集这些官员的来龙去脉天天在网上查资料做研究一定是要自己花点功夫和时间做出一些出人意料的东西。像我这个学生他有了这么多城市、这么多官员的升迁的数据以后我估计吃十年是没有问题的。经验研究也要讲一个故事。有人说我拿数据扔到模型里头,我一回归出来什么结果就是什么结果,这就是垃圾进垃圾出啊。一定要有故事,最好要有理论模型。当然理论模型不是说你要构建一个理论,而是说提出一个分析框架,哪些变量是解释变量,哪些变量应该作为控制变量,没有理论模型,这些东西你还真整不清楚。写完理论模型你的思路会整一遍,你才知道放什么变量。另外,要从多个方面验证自己的结论。好多人做经验研究,两个回归就结束了,然后就是结论。我们检验理论预测,我们往往是检验一个理论预测,但是数据支持理论不一定就说理论是对的。因为你无法排除,其他理论也能得到你观察到的数据,就所谓的Alternative Explanation,非唯一解?。所以你要不停的问自己,是不是存在其他理论解释你的经验发现。你就是想象有一个审稿人,他在挑你的错误。现在国内好一些的杂志都在推行审稿人制度,我通常也要给一些杂志写审稿报告,拿到文章第一直觉就是把这这篇文章给杀掉,杀掉以后后面就很省事了。《经济研究》每年的投稿量要上万,他一年能发表几篇文章啊,他不砍掉你才怪呢。所以要想发表一定是一个非常好的问题,方法经得起推敲。你可能还要检测一下反面的结论,我们的理论模型往往是一个正面的结论,是不是还会有一个方面的结论呢?我们做过一个这样的例子,村庄选举增加村干部为村庄办事的积极性,这是正面的结论,但是他没法解决小孩上中学的问题,那你有数据说明村干部确实为村民多修了桥,多增加了灌溉设施,但是按理说他不应该对小孩上中学有影响,所以你是不是应该再做一个回归,看是否对孩子上中学有帮助,如果没有帮助最好了,如果有帮助,那估计是存在问题的。因为他本来不应该有帮助,但是你做出来的结果是有帮助的,这种情况有可能是你的数据出了问题。 做经验研究,一定要注意内生性问题。现在要求也越来越高,国内也是这样,如果你不能解决内生性问题,你要在好的杂志上发表是很困难的。一个是伪相关,两个变量之间完全来自于偶然因素表现出相关关系,一个经典的例子就是街上流行红裙子股票就涨,这两个毫无关系的。时间趋势,有的完全是时间趋势,特别是你做省级的数据,最好控制时间趋势,不光控制所谓的年度哑变量,你应该控制各个省的自己的一个时间趋势,省的哑变量乘上时间,这样就可以控制时间,我这里说的时间是日历时间。还有遗漏变量的问题,遗漏变量就是有些变量没有控制,最简单的情况就是你在不控制收入的情况下,需求可能是价格的增函数。控制了收入以后你会发现需求是价格的减函数。昨天还有一个朋友来,说到他的一项研究。他这个问题其实还不是遗漏变量的问题,其实是反向因果关系的问题,他说农户之间土地租赁合同时间越长的话,租户对土地的投资就越多,从理论上来说一点问题都没有,产权的稳定性对投资的影响,产权越稳定,当事人越愿意对土地进行投资。但是你如果用数据检验,就会出问题,你比如说我是一个租户,我为什么要麻烦的签一个长期的合同呢?有可能是因为我就是想在土地上进行长期投资,所以才找来一个土地所有者说我们来签订一个长期合同来保证我的权益,我恨不得签十年。这样的话你如果拿一个长期的合同作为一个投资的解释变量就错了,实际上是因为我想要长期投资,所以我才签了一份长期合同,这就是一个反向因果关系。所以我们做经验研究的时候,要把这些问题给想透。 总之,做经验研究的时候,永远记着有一个审稿人坐在你对面,问各种各样的问题,然后你应该想方设法的用你的计量结果来回答他,就是审稿人可能这样问,我有没有一个办法可以解决他这个问题。你不要做一个鸵鸟,认为细小的地方审稿人看不出来,这样你就错了,审稿人就是看这些具体的,如果他是一个有经验的研究者,他就看你有可能忽略掉的问题,然后他就把你枪毙掉。 3.优秀论文的写作 最后我讲一下写作。我刚回国的时候,林老师跟我说他1987年回国的时候,那时候没人跟他讨论,写国际期刊上发表的文章闻所未闻。所以他找一篇范文,按照八股文,依葫芦画瓢。这个也很重要,这里头确实是有些八股在里头。有几个关键是要说清楚的,第一个是要说清楚文章在文献中的定位,开篇就要说。我刚才说的利.班南Lee Benham,他要求年轻人说,你的摘要头二十个字念出来。英文单词头二十个可以说不少东西,如果你头二十个字说完了,别人不知道你的文章要说什么,那你就是失败了。所以写摘要,一定要开门见山,把你想要写的写清楚,不要啰嗦。前言很重要,Referee审稿人)一般都先看文章前言,然后看结论,如果他觉得你这个没意思,就给你砍掉了。所以一定要在前言里面写清楚,文章在文献中的定位是什么,你的贡献在哪里。第二个要在前言里面把自己的故事说清楚,往往很多人都不写,遇到不耐烦的Referee审稿人)他就给你砍掉了。一定要记得在前言里面把你的故事讲一遍,如果你是做计量研究,把你的方法大体上主要的说一遍,把结论说一遍,有些人会说这样就会重复了,重复了不重要。不要躲避,要直面自己假设和数据局限,承认它们但认真的为自己辩护,没有一个数据是干净的,你也不要以为说审稿人期待你有很干净的数据。另外一个就是要在前言里面说清楚你用的什么数据,我们有些人写文章连数据来源都不说,这种文章肯定被枪毙。如果你不注明数据是哪里来的,怎么证明你的数据的可靠性呢?前言里面就要说,不要等到后面再说。要意识到自己的局限性并认真为自己辩护。(排版乱了,有兴趣网上有PDF原文)条理要清晰?不要只写给自己看。特别是理论文章?你一有跳跃别人就看不明白?哪怕你以后要删除?你第一稿也需要一步一步来?你是写给读者看的?你要想象那个读者他可能不懂你的东西。如果你的很高深的东西?能写给不是你这个领域的人都能看懂?那你就了不起了。这是大师级的啊?实施起来当然是很难的。所以要时刻想象你是在写给读者看的?不是写给自己的看的。 最后一个是要尊重规范?文字要符合语法?这个是最基本的要求?但是我们很多人达不到。中文又很容易写的乱七八糟?中文的语法本身就是很松散的?有时候句子写的无穷长?读完之后你都不知道他在说什么。书写要精炼?要短句子。所以我跟我的博士生要求他们用英文写作?我是觉得如果你的英文写作上去了?你的中文就上去了。我们写不了复杂的英文?老美他写了复杂的英文他自己都看不懂。所以张炳森说他跟老外合作?老外说自己写了自己都看不懂就让他写。要学会用精炼的语言表达一个复杂的意思?这个其实也不容易。 千万不要有打字错误?有很多人?写完之后看都不看就发出去了?摘要有错别字?这篇文章就被砍掉了。我写文章?写到最后至少要通读两遍。现在都电脑打字?打过去错字连篇的?所以这个还是重要的。引用也一样?出现在文章中的文献一定要在参考文献中出现?反之亦然?这个也要多次检查。引用和参考文献的体例要符合刊物的要求。我编辑这个刊物?最头疼的就是这些作者到最后都不给你弄好?这是个态度问题?态度有可能决定你的成败。我看过Referee的Report?很多人都说这篇文章写的不规范?因为引用的文章在参考文献中看不到?这就是一个污点?可能就是枪毙你文章的一个重要依据。你连这个都做不到?怎么能相信你的结论呢。图表也是一样的?按照刊物的标准制作?不要用彩色?我们现在还没有办法印制彩色的图表。这样一点一滴的说起来似乎很累?但你要是一开始注意做完你就不会觉得累?反倒是写的时候乱七八糟?回过头来再改的时候?那才会觉得累。