很快就收到HH的回信,说他不是审稿人。他说文章的想法很好,全局收敛的证明也没有大问题。他愿意帮我分析一下算法的有效性。
再解释一下系统辨识的两个基本概念,无偏性和有效性。用普通语言解释,数学上可能不严密。这两个概念描述辨识模型的统计性质,即假设辨识实验和模型辨识重复多次以后,所得多个模型的统计特征。无偏性是指模型参数的均值等于实际的模型参数;有效性是指模型参数的方差(可以理解为误差)最小。在常用的假设条件下,如果用一个辨识方法得到的模型同时是无偏的和有效的,那就是最好的辨识方法,或者说是最精确的模型。除了最小二乘法,因为有解析解,分析起来方便,对没有解析解的辨识方法,证明其无偏性和有效性很困难,因为数学不够用。为避免这一困难,理论家们假设辨识数据(试验时间)趋向无穷大,然后分析模型的渐近无偏性(也叫一致性)和渐近有效性。
我的文章提出了一个Box-Jenkins 模型的简单新算法,证明了模型的一致性(渐近全局收敛),有意思的是仿真结果显示出模型的有效性。因为Matlab的算法能够得到全局最优解时,两个算法精度一样。
我的结果大大激发了HH的好奇心,他马上开始推导模型参数协方差的表达式。起初他是想证明我的方法不是(渐近)有效的,因为Stoica和 Söderström(1981)证明Steiglitz–McBride方法(我算法的第三步)是渐近全局收敛的(一致的),但不是有效的。
大约有半年多时间,我可以感到HH 在下功夫分析模型的方差。下面是他邮件的一些片段:
“豫才,哦没什么事,我只是告诉你我还在分析你模型的方差。不很容易,我已经积累了17页的手写稿纸,但还没有整出个头绪。分析的结果跟仿真结果不符。好像用高阶ARX滤波会导致方差增加。。。”
“我的一个同事不相信Steiglitz–McBride方法全局收敛,你怎么看?”
“哦推导有错,再等等。。。”
这期间我的心跟着他的工作十五个吊桶打水。
“豫才,我快做完了。我基本上可以说,你的方法是渐进有效的!这会很轰动的。现在看来,是高阶ARX模型滤波(算法第二步)导致了模型的有效性。等我再检查一遍把稿子发给你,以保证万无一失。”
听到这个消息,我感觉一个小孩在茫茫戈壁滩上(别忘了我是新疆人)捡到了一大块金子!
等我接到HH的稿件,大吃一惊,20多页打印纸,就为了证明渐近有效性!在我细读稿件时,我可以感觉到HH为了这项工作,把吃奶的劲儿都使出来了(不信等文章发表后你自己看。)
太感动了!
(上个月陪LennartLjung 游西湖时,他还提到了这篇文章,说HH把稿子发给了他。他对渐近有效的结果感到吃惊,但他相信HH的分析能力,结果应该没错。HH是Ljung的学生。)
我很快把各自的文稿合二为一,发给了HH. 他建议我把证明全局收敛的部分写得再严格一点。我改了一下,发给HH. 他还不满意,说等有时间他自己修改。这一次他让我等了不短的时间。可能是这一部分不是他的原创,不太上心?六月初,终于等来了他的证明,是比我的严格多了。
文中我还指出同样的方法可以解决很多其他预测误差方法模型的辨识,包括ARMAX模型、OE模型、GLS模型和ARARMAX模型。就是说这个新算法对多种预测误差模型,能得到全局收敛,并是渐近有效的结果。当然这只对开环数据适用。
终于把文章投出去了。
同学,我们这样搞科研,好玩吧!