正誤表
正誤表は以下からダウンロードしてください.
- errata.pdf(最新版:2026年3月29日更新)
- errata-old-02.pdf(2024年6月3日更新)
- errata-old-01.pdf(2023年7月1日更新)
その他の補足
正誤表には含めていませんが,補足として共有するものを以下にまとめます.ご指摘くださいました岩澤政宗先生(同志社大学)にお礼申し上げます。
125頁
\(\beta_{\text{educ}}\)の95%信頼区間を「8.60%〜10.02%」のように百分率で表記しています.回帰係数の推定値の信頼区間に100を掛けた値であることを明示するために単位を「%」と表記しています,信頼区間の下限・上限そのものが百分率の解釈を持つわけではないことに注意してください.たとえば,「教育年数(educ)の係数の推定値は9.3%で,その信頼区間は8.60%〜10.02%」という主張と,「教育年数(educ)の係数の推定値は0.093で,その信頼区間は0.086〜0.1002」という主張とは全く同じことです。
139頁
「ATEは各グループの\(Y\)の平均値の差(式(6.3))から推定できそうです」という記述の直後に,「このとき,式(6.3)は\((Y_i, D_i)\)の相関関係を表していることに注意してください」と述べています.
実は,式(6.3)の値は\(Y\)と\(D\)の標本相関係数と直接つながっています.これを確認してみましょう.
4章で学んだように,\(Y\)と\(D\)の標本相関係数は
\[r_{YD} = \frac{\sum_{i=1}^n (Y_i - \bar{Y})(D_i - \bar{D})}{\sqrt{\sum_{i=1}^n (Y_i - \bar{Y})^2 \sum_{i=1}^n (D_i - \bar{D})^2}}\]
と定義されます.ポイントは,この式の分子が式(6.3)に比例することです.
なぜでしょうか.トリートメントグループ(\(D_i = 1\))の人数を\(n_1\),コントロールグループ(\(D_i = 0\))の人数を\(n_0 = n - n_1\)とします.また,\(\bar{Y}_1, \bar{Y}_0\)をそれぞれ各グループの\(Y\)の平均とします.
ステップ1:\(\bar{D}\)を求める. \(D\)は0か1しかとらないので,
\[\bar{D} = \frac{1}{n}\sum_{i=1}^n D_i = \frac{n_1}{n}\]
です.つまり,\(\bar{D}\)はトリートメントグループの割合です.
ステップ2:\(D_i - \bar{D}\)を求める. トリートメントグループ(\(D_i = 1\))の個人については
\[D_i - \bar{D} = 1 - \frac{n_1}{n} = \frac{n_0}{n}\]
コントロールグループ(\(D_i = 0\))の個人については
\[D_i - \bar{D} = 0 - \frac{n_1}{n} = -\frac{n_1}{n}\]
です.
ステップ3:分子を2つのグループに分けて計算する. 分子の和を,トリートメントグループとコントロールグループに分けて書くと,
\[\sum_{i=1}^n (Y_i - \bar{Y})(D_i - \bar{D}) = \frac{n_0}{n}\sum_{i:D_i=1} (Y_i - \bar{Y}) + \left(-\frac{n_1}{n}\right)\sum_{i:D_i=0} (Y_i - \bar{Y})\]
です.
ステップ4:各グループの和を平均で書き換える. \(\sum_{i:D_i=1}(Y_i - \bar{Y}) = n_1(\bar{Y}_1 - \bar{Y})\),\(\sum_{i:D_i=0}(Y_i - \bar{Y}) = n_0(\bar{Y}_0 - \bar{Y})\)なので,
\[= \frac{n_0}{n} \cdot n_1(\bar{Y}_1 - \bar{Y}) - \frac{n_1}{n} \cdot n_0(\bar{Y}_0 - \bar{Y}) = \frac{n_1 n_0}{n}\left[(\bar{Y}_1 - \bar{Y}) - (\bar{Y}_0 - \bar{Y})\right] = \frac{n_1 n_0}{n}(\bar{Y}_1 - \bar{Y}_0)\]
右辺の\(\bar{Y}_1 - \bar{Y}_0\)はまさに式(6.3)です.\(n_1 n_0 / n\)は正の定数なので,相関係数\(r_{YD}\)が正(負,ゼロ)であることと,式(6.3)が正(負,ゼロ)であることは同値です.
つまり,式(6.3)で各グループの平均値の差を計算するということは,\(Y\)と\(D\)の相関関係を調べているのと本質的に同じことです.相関関係は因果関係を意味するとは限りませんので,式(6.3)がATEに一致するかどうかは,トリートメント\(D\)の割り当てがランダムかどうかに依存します.本文中のシミュレーションでも,\(D\)と\(Y\)の両方に影響する交絡変数\(Z\)が存在する場合に,式(6.3)がATEの真値から乖離することが確認されています.
248頁
「\(\gamma_1 = 0\)なので,\(V(\hat{\beta}_1)\)は無限に大きくなり」という記述について,\(\gamma_1 = 0\)のとき\(V(\hat{\beta}_1)\)は厳密には定義されません.\(\gamma_1\)が0に近い小さな値の場合に\(V(\hat{\beta}_1)\)が非常に大きくなる,と理解してください.
261頁・284頁
パネルデータを「同一の個人を複数期間に渡って観測して得られたデータ」と定義しています.この定義だと厳密には時系列データ(個体数\(N=1\))も含まれることになりますが,本書では複数の個体を観測する場合を想定しています.