So-net無料ブログ作成

レポートの作業の様子と愚痴。 [計量経済学]

大学院に入ってからグループワークをやたらやるんですよ。

単純に宿題の量が多くて、答えの導入にディスカッションが必要だからグループワークになる訳なんだけれども、本当にグループワークって相手次第なんすね。今回改めて恐ろしさを味わいました。(まだ終わってはいないのだけれども。。。)

いやですね、計量経済学のタームペーパーを期末試験で書いてた訳なんだけれども、いつもグループワークを一緒にするドイツ人のニルスが美人に取られてしまったので、フィンランド人とグループを組まされた訳です。

彼とはそれまでのレポートをこなす時に2、3回喋ったことがあって、まぁ人の話をあんまり聞かない奴なんだよなという印象を持ってたのだけれど、まさかバカだとは思ってなかったんすよ。

もうこいつにはフリーライダーにバカに人の話聞かないわ散々でしたよ。。。というのとどんな感じでプロジェクトが進んで行ったのか?が今日のお話です

1.始動編
計量経済学の最後の授業でニルスを美人に取られ、第二候補だった中国人もノルウェー人のオタク男に取られ、さぁどうしたもんかと思っていたらフィンランド人のラルフ君がやって来て一緒にやろうと誘って来た。

正直人の話をあまり聞かない奴だなと思っていたので周りを見渡すも、俺と彼以外には完全にグループが出来ていたので仕方が無く了承。ここから地獄が始まる。。。

最初のミーティングで大まかなスケジュールを決める事に。イースターにやる気満々だった俺をまずしょっぱなの一言でぶち壊してくれた。

「俺明日からフィンランンドに帰るわ」

いや、おい、
まぁいいか、他の事を先にイースターで済ませてしまえば良いか、それで彼が帰って来てから本格的にやればおっけーさ。

「で、いつ帰ってくるの?」

「まだ決まって無いけど2、3週間くらいかな?(つまりイースター終了から1週間位。)
だからスカイプとメールで進めて行こうよ。」

いつ帰るか解らないって言う言葉に引っかかりつつも、まぁ良いかと了承。ただ、スカイプで通話しながらやると効率が酷く低いのは知っていたのでメールを主に使う事に。そして、フィンランド行きのバスが出る直前までに読まないといけない論文を読んで理解を確認する事に。

次の朝に会って論文の解釈を聞く。
手短に論文の内容を書くと、不確実性が投資に与える影響を会社のデータを使って分析しようという論文。
まず最初に概要と何を分析するのかが書いてあり、
次にデータの構造の問題(詳細は省略)からただ計量分析を用いるだけでは結果が正しいかが解らないという問題が指摘されており、
次にシミュレーションを用いてデータを生成してそのデータの計量分析結果がシミュレーションの使った条件をはっきり特定出来ているかを確認し、
最後に実際にイギリスのデータを利用して分析を試みる、
という流れだった。

結論だけ述べれば、レポートはシミュレーションで合格サインの出たモデルを用いて実際のデータを分析するだけで良いので、最後の分析のパートをメインに理解するべきだった。

しかし彼は何をはき違えたか、ひたすらシミュレーションデータのパートについて話す。
シミュレーションデータの構造について色々と意見を述べそれを20分近く辛抱強く聞いていた俺はこう思った。

こいつ多分このデータがシミュレーションから生成されてるって理解してねぇw

という事で早速このデータがシミュレーションである事を説明し、俺らが読まないといけないパートは最初と最後ですよという事を強く強調した。
そんなこんなで2回目のパートも終了し、論文の最後のパートにある分析結果の再現をそれぞれ始める事にした。

まぁ時間もあるから大丈夫でしょうと考えていた俺は他の授業に時間を費やして、イースターに入ると同時に自分で分析結果の再現を始めた。

しかし中々上手くいかない。

2日ほど悩むに悩んでいた所で、著者のページにデータと他の統計ソフトのプログラムコードが有るのを見つけ、その解析を初め、何とか近い結果の物を導きだした。

で、そのコードとかデータとか諸々を送った所こんな返事が。

「え、取り敢えず今の論文よく意味が分からないからもっと解りやすい情報を探してるよ!」

いやいやいやいやいやいやいやいやお前

そんなあるのか無いのか解らないもの探す前に目の前にある論文を少しでも理解する努力しろよw

と思いつつ忍耐強い俺は「解ったからデータの再現やって、結果が近いかどうかをコメントして。」とメール

しかし何日経ってもメールが帰ってこない。

しびれを切らした所で取り敢えず教授に結果が近いかどうかをメールで聞いた所、
なんとコードをくれたw

結局同じ日に彼からも「inconclusive(よくわかんね)」というメールが来るも、教授のメールをそのまんま転送して問題解決。




2. 恐怖のSIC data
コードを手に入れたは良い物の、それは分析するモデルを手に入れたという意味であって、データを手にした事にはならない。

実際に俺(ら)が分析したのはアメリカに置ける製造業のデータで、このデータ構造は参考にしている論文の物とは全く違う。
よってどうにかしてもとのデータと同じ構造になる様に作り替えなければいけない。
(すごい単純な例で言えば、もとのデータでは”利益”というデータがあったけれども、新しいデータには”売り上げ”と”費用”が入っていて”利益”はそれらの差分から求めなければならない。)


じつはこのデータにはとんでもない罠が仕掛けられていた。

この分析のキモは「不確実性が如何に投資に影響を与えるのか?」という物

もとのデータでは1年に置ける株価の変動率が標準偏差で割られた物が使われていた。(その1年では株価の変化がどのくらい大きかったのか?って事ね)

で、この不確実性って大体「何かが、1年の間にどのくらい変動したのか?」っていうデータで計られるのね。

それって日、週、若しくは月ごとのデータが計算に必要なんですよ。

けれども持っているデータは年ごとのデータ。

つまり、この不確実性のデータは全うな方法じゃぁまず手に入らないんです。

こんなの統計の初歩中の初歩で解るのに、何故か解ってくれない。

事あるごとに

「この方法はどうだい?(ドヤっ」

と月データが必要な物を持ってくる。そして辛抱強く10分くらい説明を聞き、

その度に「いや、月データ無いじゃん」

と突っ込む。

しかしながらどーにも解らないみたいなので、毎回計算モデルの推定にどの変数を使うつもりなのかを聞く。そして最後に彼は「あ、駄目だねと納得する。

これがを3回位繰り返した所で、

生産効率の変化(TFP)がもとのデータで使われている不確実性のデータと相関がある事が示された論文を著者のサイトから見つけ、さらにその変動値であるTFP shockがなんとラッキーな事に今のモデルからも推定が可能である事を見つける。(時系列回帰のAR(1)モデルでTFP と1年前のTFPを回帰分析してその誤差項をTPF shockとして扱う方法)

よっしゃあああああああああああああああと思い

GMMで分析して誤差項を求め、

不確実性の投資への影響を求める分析をした所一通り同じ結果がでた。

が、程なくしてSargan-Hansen test(GMMの根底条件が保持されているかを試す統計検定)が根底条件が駄目だという事を指し示しているのを見つける。

そして一晩寝て、朝起きて、どーにかTFPショックを推定出来ないかと悩んでいた所に妙計が降ってくる。

Dynamic Panel Dataを計算するにはGMMでなくともAnderson Hsiao Modelという方法もある。

しかしながら、この方法には一つ問題があった。

それは誤差項(u_t)ではなく誤差項(u_t - u_t-1)の差分が求まってしまうのだ。

そしてこの差分に魅力はあまり無い。これが問題で一度は使う事を諦めたのだけれども、ここで発想が降って来た。

もし、Anderson Hsiao Modelの推定が正しいのであれば、誤差項の差分(u_t - u_t-1)も正しく推定されてるという事だ。
じゃぁ合ってるかどうか解らないGMMを推定して、この誤差の差分を取ってみて、Anderson Hsiao と比べてみれば良いじゃん!

やばいwこれは天才的な発想をしてしまったんじゃないだろうか?



















とね、思ってたんすよ。この時は。
結局GMMの誤差は正しく推定されている、と思った俺(達)は分析を済ませて結果を理解しようかという段階まで至る。
で、ここでベットに潜りながらまた考えを巡らせ始めた。
あれ、えっと、
Sargan Hansen test(根底条件のチェック)が通らなかったんだよね?
根底条件はInstrumental Variableが有効であるという事だよね?
Anderson Hsiao modelもおなじ根底条件使ってるんじゃなかったっけ?
あれ?
なんでこんな単純な事に気がつかなかったんだろ?

ん?

え?

じゃぁAnderson Hsiaoの根底条件が正しいと言うのが立証出来なきゃ今持ってる推定結果は全部ゴミじゃん。


で、ベットから這い出ておそるおそる推定してみる。

ゴフ

黒だw

という事でまた降り出しに戻ってしまう。

その流れを説明して二つの選択肢が残されてる事を伝え、スカイプの導入をここから決意する。

1つはGMMに違うIV(根底条件)を投入して結果の改善を試みる。
もう1つはTFPショックの推定を業種ごとに全部やる。ただ、この方法だと230回近く分析しないといけないことになる。

前者はゴールにたどり着けるか解らない道で、
後者は無駄に230回も山を登っておりないとゴールにたどり着けない道。

そしてもとの論文の理論はこう言っていた。もし人間が決断を迫られるとき、それも投資の一部であり、その決断の価値が不確実で極端である場合、人間に取っては取り敢えず待ってみて何かが改善するのを見ようとする。と。

取り敢えずどっちが良いかを彼に聞いてみる事にしてメールを送った。
そして次の日帰って来たメールはアイデアがあるからスカイプこいというものだった、選択肢については一切触れられていなかった。

即スカイプで話し始めてアイデアを聞いた。そう、このときはまだ期待してたの。
そこで彼が話し始めたアイデアは月データが必要な物でいっぱいだった。
辛抱強い俺は5分程話を聞いて話を遮って、どんなモデルを使おうが、月データが無ければ推定出来ないのだから無理だ!という話をもう自分の母親でも理解出来るだろうと思うくらいに細かく説明した。

やっと彼は理解した。

やっとだ。

そして俺も理解した。

こいつはまず間違いなく自分で出したアイデアを自分でスクリーニングしてない。

だからこんなゴミみたいなアイデアをぽろぽろ産み出せるのだ。

おまけに俺のアイデアにまったく興味ない。全然チェックしたりしてない。

この辺で最悪残りは全部自分でやらないといけない事を覚悟する。





3. 尋問と拷問
GMMの結果のチェックくらいやってくれよと思っていたのだけれども、
結局ミスをしたのは自分だからと責任を感じ、
全ての産業に対して一つ一つ分析を行う事を決意。

何とかプログラミングの知識を活用してコマンドを作成し、TFPショックを推定する。

そして不確実性の影響を推定。

結果はなんと正の値だった。どー言う事かというと

不確実性が高いと投資する傾向にある。とい意味だ。

いや。逆じゃねーの?(汗

ただ、統計的に優位な結果ではあるし、他の変数は元のデータの分析結果と変わらないし何か理由があるのだろうと取り敢えず次に進む事に。


で、分析は完全に知識差が出る部分なので終止相手のアホなアイデアを否定しては次へと進むという手法をとる。
締め切りが近いのを良い事に13時間スカイプとかで序盤はくそアイデアを否定し続けて相手の精神を弱らせて、あとはひたすら作業的な事をして最後の方であらかじめメモしておいた意見を述べて押し通す。やってる事が尋問と変わらなかった気がするw
そしてこれを最後の1週間毎日行うのであったw

結論を作る際にも彼はまたゴミみたいな理論や分析を持ち出して来た。
一つの変数が変だと言って分析を始め、
散々「モデル構築の際の理論はあるんだよね?分析をどうやって行って行けば結果が得られるかのめどが立っているんだよね?」と確認したのに、
3時間くらい後でただデータを拷問にかけた様な結果を持って来た。(様々なデータがあるので組み合わせはそれこそ何百とあって、その中で無理矢理相関のあるモデルを作る事が可能。そう言った手法を拷問 tortureと言ったりします。英語でねw)

そこで遂頭の中の何かが切れてしまった。
誰かを頼れないという気持ちと、
目の前の問題の大きさと、
そして何よりここでつまずいてしまう事への恐怖に、
何かが耐えられなかった。

お前の持って来た分析結果はただデータを拷問にかけただけのゴミでしかなく、お前はただ単に俺の時間を無駄にしているだけだ。
そう告げてしまった。

そして次の日も彼は笑いながらまたゴミみたいな分析を持ってくるのだった。



最後の方は俺も相当に疲れていたのと、相手が(恐らくこちらの戦略に気がついて)作業をやたらまわしてくる様になったので、割とツメが甘くなって来ていた。

文章構成に関しては彼の方が英語が上手いという理由で任せる事にして、最後に俺が提出前に通しで見て提出するという事になった。

まぁ当然彼が大したチェックもする分けないだろうとタカを括っていたので、彼がOKと言った所で俺が全部提出前に修正してしまえば良いのだ。
大体の内容は一緒に作ったので問題ない。。。はずだった。

英語の文法等には問題は無い物の、核心を外れた解説や間違った理論。消されていた部分も大量にあった。許された時間は締め切りまでの3時間しか無く、その間にそれらの全てを直し何とか時間ギリギリに提出したのであった。





まぁ具体的に彼の何が駄目だったのかを一般化て行くと。

1、バカであるという事。
基本的に意見が明後日の方法を向いている。
恐らく読んで理解する事が出来ていない。

2、人の話を聞かないという事。
こちらの説明を何度遮られたか解らない。
ある時は説明の導入部分で遮られ、ある時は結論の直前で遮られる。
そして彼は完全に明後日の方向を向いて話を始める。
こっちは何かを説明する時に、導入 展開 結論 となる様に喋っていて、
それら全てが説明なのにそれを遮られてしまう。
おまけに、結論を先に行って「解らないからもっと説明してくれ」と言われて説明された場合にも同じ事をされる。

3、時間は守らない。
10分と言ったら1時間。
2時と言ったら5時。
時間通りだった事は結局1回も無かった。

帰ってくるという話だったのに、いつの間にかに帰ってこないということになってた。
そして話を聞いてみるとそれは元からそう言う予定だったそうな。
この話を聞いた時に殺意が芽生えた。

4、自分の意見を自分で確かめない。
彼は自分でチェックしていない意見で人の時間を損なわせる事を全く持って気にかけない。
糞な物を糞のまま出す。

5、人の意見を確かめない。
こっちは自分で確かめて問題が無かったから相手にも確かめてもらいたいのに、それが望めない。
確かめると言って確かめたふりしてるだけの事が殆ど。
そして相手はこっちを利用して意見を確かめる。
これだったら正直自分でやってるのと同じだった。

6、自分で出来る事を相手にやらせる。
相手は相手の方が頭がいいと基本思っているらしく、
どうやらこっちを雑用に使ってもやたらとコマンドを送ってはこれを分析しろ(自分でやらずに)とか言ってくる。



なんか出せばきりがないのでこの辺で。後はプレゼンだけだ。ふぅ。
こうはならない様に僕は僕でがんばるっす。
ただ

もう一生バカとグループワークなんてしねぇ
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は1年以上新しい記事の更新がないブログに表示されております。