So-net無料ブログ作成

Anderson Hsiao estimatorとArellano Bond GMM estimatorについて。とちょっと感想。 [計量経済学]

最近こんな事勉強してこんな事思ってますよっていう日記です。
パネルデータの話をちょっと前にしたのですが、当然パネルデータメソッドも完璧ではないので色々と使って行くうちに問題が出てきました。
1980年代くらいからそれらが次第に解決されて行った訳ですが、そんな中に生まれたAnderson Hsiao estimatorとArellano Bond GMM estimatorという二つの天才的な推定方法についててきとーに解説しつつ最後になんか感想付けました。
説明の正確さはどーなんでしょ?w
最後に参考にした書籍と論文を乗っけておくので正確に知りたい人とか、宿題の答え探しでここにたどり着いた人なんかはそっちを参考にすると良いかと思います。


パネルデータは去年の投資比率が今年の投資比率にどのような影響を与えるのか?といった様なautoregressiveモデルを分析することができない。(つまり去年のyを今年のyに回帰させる様なモデル)

今年と去年の差を取ることによってUnobserved specific effect(つまりは企業の効率とか)であるaを消し去るFirst Differenceというパネルデータの推定方法に置いては

gmm1.png

知りたい値であるβは上の様な式になる。このβの右にくっついているよけいな式が0になれば、FDはバイアスの掛かっていない最適な推定方法だと言える。去年と今年のデータの差分の分散は0でない事は明白なので、分子にある供分散について考える。

gmm2.png

よってCov、供分散が0でなく、誤差項の分散の負の値である事が解る。よって負のバイアスが掛かっていると言えるのでFDは最適な推定方法という事は出来ない。


一方データとその平均との差分を取ることによってaを消すFixed Effectは、

gmm3.png

というβを持っているので、このβの横にあるよけいな物が0であれば最適と言える。例のごとく分散varは0にはならないので、Covについて考える。

gmm4.png

よって、このCovはゼロではなく、負の値となる。つまり、FEの推定値は負のバイアスを持っている事になる。(Random Effectは面倒なのでスキップw)

結局この二つが何を意味しているかというと、yの差分とuの差分はFDでもFEでも、どーにかこーにか相関してしまっている為にβにバイアスが掛かってしまう。じゃぁここで何が言えるのかというと、逆にそこの相関さえどーにかしてしまえばベータは推定可能だって言う事。

そこで出てくるのがInstrumental Variableっていう天才的な方法。下の一番目の様なモデルを推定しているとする。しかし、xとuが相関している為にβが推定することができない。そこで、xとは相関しているのだけれども(relevance)、uとは相関していない(endogeneity)という変数Z(Instrumental Variable; IV)を持って来てxと回帰分析させる。例えば賃金(y)を決定するモデルが在るとして、xに教育という変数を入れるとする。するとuには能力という物がはいっていると想定される。(だって賃金は能力に比率すると思いません?)そして困った事に、能力が高ければ(頭が良ければ)教育を受ける年数も質も向上すると考えられる。つまり、xとuが相関してしまっているのだ。
なので、ここで両親の教育年数という変数をZ(IV)として持ってくる。親の教育が良ければ子供にも教育を施すだろう、しかし子供は親の教育が高いからといって高い賃金を会社に要求する事は出来ない。


gmm5.png


で、ここでxとzで回帰分析をする。(2番目の式)
そしてx_predictedを作成する。回帰分析でθが推定されるので、Zにデータ入れてθ掛けて切片θゼロを足せば理論上の値であるx_predictedを求めることができる。
このx_predictedは二つの特徴を持っている。1つはxの予測値であるという事。もう一つは予測はuと全く関係のない変数を用いて行われたのでuとは相関を持たないという事。つまり、このx_predictedを一番目の式のxに代入してしまえば、uと相関している問題が解決されてしまうのでβを推定する事が可能になる訳です。

いやぁ天才w
これ作った奴はマジ天才。こんな単純な物の組み合わせで問題を解決してしまうなんて。。。

で、本題に戻りましょうw
このIV methodを使えば、今パネルデータのβにくっついているバイアスを消せちゃう訳です。なぜならそれはYit-1(さっきの式で言うx)とuの相関から来ているから。
で、問題なのは一体どの変数をIVとして使えば良いのだろう?という事。
答えは非常に単純でYit-2を使いましょうというもの。外部的な要素が過去の個のデータと相関する事は殆どなく、その一方でYit-1とYit-2はβという形で相関している。(はず。ここは推定が終わってみないと解らない。) よって一昨年のデータは去年のデータに対するIVになることができる。
この方法を作ったのがAndersonとHsiaoという人達なので、Anderson Hsiao estimatorと呼ばれる。

しかし、このAHではIVを一つしか使っておらず、幾らか問題があった為にもっとIVを導入しようという欲深い連中が現れ、Arellano Bond GMM estimatorというのが生まれた。
発想はとてもシンプルで、
Yit-1とYit-2が相関しててIVとして使えるならYit-3もYit-4もIVとして使えるじゃん。じゃあ使っちゃおーぜ。
というもの。
ただ発想とは打って変わって推定方法がとても複雑になった。
データを取る年数を増やすごとにIVの数が指数関数的に伸びて行くのでOLSの推定方式では数学的に答えが出せなくなってしまい、一般化したモーメント法(Generalized Method of Moment; GMM)でその解を出す必要が出て来た。

まずMoment Conditionを設定する。IV(Yit-2,Yit-3,Yit-4….)はuと相関していないという前提が在るので、それらを式にしてMoment Conditionとする。

gmm6.png



tが進むごとに使えるIVの数が増えて行くので、conditionの数も指数関数的に増えて行く。GMMの目的はこれらの条件を全て満たす様なβを求める事だ。
条件式は以下の形にまとめてしまう。Zは全てのIVを纏めた線形代数。

gmm7.png

で、この制約条件をなるべくイコールゼロに近づける様に最小化問題を解く。Wは何ぞや?という話は少し置いといて、FOCを作って最小化問題を解いてそれをβについて解くと2番目の式になる。(ここのつなぎはかなり無理あるなw)
WはOptimal Weighting Matrixと呼ばれる物で、共分散の逆数で、このβを最もefficient(正確に)にしてくれる物です。えーはっきり言って、ただのパラメータと思ってもらって結構ですw
このWさえ解ってしまえばZとYはデータとして持っているので、βを求める事が可能。

gmm8.png


しかしここに問題が一つ。Wはβを知らないと推定出来ないんですねぇ。そしてβはWを知らないと推定出来ない。
しかーし、もしここで誤差項uがhomoskedasticでautocoorelationが無いと想定出来るのであればweighting matrixは以下の手順で求めることができる。俗にOne-step approachと呼ばれるもの。理由?どっかの天才が思いつきました(爆


gmm9.png

しかーしもしhomoskedasticでないかautocorrelationが確認されたら、この方法は原則的には使うことができない。最初の式が有効ではないからだ。よってまたWとβのジレンマにはまることになる。
そこでWについて適当なスタートポイント(一般的なのはW=I)を設定する。そしてそれを使ってβを推定し、そのβ(式ではγになってるけどw)を使ってuの差分を推定する。


gmm10.png

で、差分をoptimal weight matrixの推定に使い、それでβをさっきと同じ様に推定する。これによってアナリティカルには推定出来なかったβが推定出来てしまうのですよ。この方法を俗にTwo-step approachと呼ぶ。

実はこのOne stepとTwo stepの間にはどっちを使うべきなのか?という論争があって、その決着は理論的にはまだ付いてない。今の所殆どの応用計量の論文がよりefficientな推定値が出るという事でOne stepを使っている。
実はOne step approachは理論的にはheteroskedasticityの場合には使えないのだけれども、実際にモンテカルロ方式なんかでシミュレーションしてみるとheteroskedasiticityの場合でもTwo-stepよりも正確だったりしちゃう。

なんか、こう、この流れってすごいなぁと思うんですよね。なんでかって言うと、まずパネルデータが思案されて、それを時系列分析に使おうとしてそしたら問題が出て、そこで諦めずにAnderson Hsiaoっていう新しい分析方法を見つけ出して、さらに精度を追求してArellano Bond GMMに至るというこの流れ。問題が起きてはそれを何とか頭をひねることによって解決するこの流れが素晴らしいと思う訳です。
GMMやAHを普段の考え方に導入するなんて事は無理な訳だけれども、答えが出なかったら考え方を変えてみるという発想が好きです。このくらい色々と粘って考えてみたいものですね。




※参考にしたもの

先日ついに第4版が発売された、A Guide to Modern Econometricsです。
5章でGMMについて、10章にAnderson Hsiao と Arellano Bond GMMについて乗ってます。
3章とはさほど差がないので、個の二つの章を参照するにあたっては第3版でも問題が無いと思います。

A Guide to Modern Econometrics

A Guide to Modern Econometrics

  • 作者: Marno Verbeek
  • 出版社/メーカー: Wiley
  • 発売日: 2012/02/14
  • メディア: ペーパーバック



Dynamic Panel Data Models: a guide to micro data method and practice
http://www.cemmap.ac.uk/wps/cwp0209.pdf
ボンド自身が書いたArellano Bond GMMの解説です。
最初はなんじゃこれ?って状態だったんですけど、上の教科書と合わせて読んで行くうちに割と理解出来る様になりました。1回具体例が入っているのがいい感じだと思います。そして無料というのも中々美味しい条件ですね。
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は1年以上新しい記事の更新がないブログに表示されております。