Yuchi MATSUOKA
松岡 佑知

Kano/Hamada lab. M1
Graduate School of Engineering Science, Osaka University
1-3 Machikaneyama-cho, Toyonaka, Osaka 560-8531
yuchi_m [ at ] icloud.com

GitHub

Linkedin

Seminar

M1基礎ゼミ 6/20 資料

writen by Yuchi MATSUOKA

Last modified  20, June, 2016


モーメント推定量の漸近正規性

モーメント法

$X_1,...,X_n$を分布$P_{\theta}$からのサンプルとする($\theta \in \Theta$). モーメント法による$\theta$の推定量は以下の連立方程式の解である.

\begin{eqnarray} &&\frac{1}{n}\sum_{i=1}^{n}f_j(X_i) = E_{\theta}f_j(X), \ \ \j=1,...,k, \\ &&\mbox{for given functions } f_1,...,f_k. \end{eqnarray}

パラメータ$\theta$が$k$次元ベクトルのとき,通常$f_j(x) = x^j$が用いられる.

モーメント推定量は”最良な”推定量とは限らないが,ある仮定のもとで収束レート$\sqrt{n}$の漸近正規性を持つことがデルタ法により示せる.$f=(f_1,...,f_k)$と書くことにし,$e: \Theta \mapsto \mathbb{R}^k$を \begin{eqnarray} e(\theta) = P_{\theta}f \end{eqnarray} とする.ただし,$P_{\theta}$はベクトル値の期待値である.するとモーメント推定量$\hat{\theta}_n$は以下の連立方程式の解である.

\begin{eqnarray} \mathbb{P}nf \equiv \frac{1}{n}\sum{i=1}^{n}f(X_i) = e(\theta) \equiv P_{\theta}f. \end{eqnarray}

モーメント推定量が存在するためには$\mathbb{P}_nf$が関数$e$のrangeに含まれていなければならない.さらに$e$が単射であることを仮定する.このとき,モーメント推定量は$\hat{\theta}_n= e^{-1}(\mathbb{P}_nf)$で一意に定まり, \begin{eqnarray} \sqrt{n}(\hat{\theta}n-\theta_0) = \sqrt{n}(e^{-1}(\mathbb{P}_nf) - e^{-1}(P{\theta_0}f)) \end{eqnarray} と書ける.

$\mathbb{P}nf$が漸近正規的かつ$e^{-1}$が点$P{\theta_0}f$で微分可能であるとすれば,デルタ法

$\phi:\mathbb{R}^k \mapsto \mathbb{R}^m$で$\phi$は$\theta$で微分可能とする.$T_n$は$\phi$の定義域内で値をとる確率変数であり,$T_n \in \mathbb{R}^k$である.もし$r_n(T_n -\theta) \rightsquigarrow T(as\ r_n \to \infty)$ならば,$r_n(\phi(T_n) - \phi(\theta)) \rightsquigarrow \phi'_{\theta}(T)$が成り立つ.更に,$r_n(\phi(T_n)-\phi(\theta)) - \phi'_{\theta}(r_n(T_n -\theta))$は$0$に確率収束する.

により,右辺が正規分布に収束することが示せる.ここで,定理の中の$\phi'_{\theta} : h \mapsto \phi'_{\theta}(h)$は \begin{equation} \phi'_\theta(h) = \begin{pmatrix} \frac{\partial \phi_1}{\partial x_1}(\theta) \cdots \frac{\partial \phi_1}{\partial x_k}(\theta) \\ \vdots \ddots \vdots \\ \frac{\partial \phi_m}{\partial x_1}(\theta) \cdots \frac{\partial \phi_m}{\partial x_k}(\theta) \end{pmatrix} \begin{pmatrix} h_1 \\ \vdots \\ h_k \end{pmatrix} \end{equation}

であり,もし$\phi'_\theta$が$\theta$上連続ならば,$\phi$は連続微分可能であるというのであった. また,ベクトル$h$を定数倍する場合,以下が成り立つこともみた. \begin{eqnarray} \phi'_{\theta}(rh) &=& \begin{pmatrix} \frac{\partial \phi_1}{\partial x_1}(\theta) \cdots \frac{\partial \phi_1}{\partial x_k}(\theta) \\ \vdots \ddots \vdots \\ \frac{\partial \phi_m}{\partial x_1}(\theta) \cdots \frac{\partial \phi_m}{\partial x_k}(\theta) \end{pmatrix} \begin{pmatrix} rh_1 \\ \vdots \\ rh_k \end{pmatrix} \ &=& r\phi'_{\theta}(h). \end{eqnarray}

Remark.

逆関数定理より,$e(\theta_0)$における$e^{-1}$の導関数は$\theta_0$における$e$の導関数の逆像$e_{\theta_0}^{'-1}$である(もちろんこれが成り立つためにはいくつか条件がいる).モーメント法において,$e^{-1}$が常に陽にかけるとは限らないので,$e$の微分可能性から$e^{-1}$の微分可能性を確かめた方が便利な場合もある.

以上の話を定理としてまとめ,証明する.

定理

開集合$\Theta \subset \mathbb{R}^{k}$上で$e(\theta) = P_{\theta}f$は単射かつ,$\theta_0$において連続微分可能($e_{\theta_0}'$が存在して,$\theta_0$で連続なこと)であり,$e_{\theta_0}'$が特異でない(フルランクである)とする.さらに$P_{\theta_0}||f||^2 <\infty$を仮定する.このとき,モーメント推定量$\hat{\theta}_n$は$n\rightarrow \infty$で確率1で存在して, \begin{eqnarray} \sqrt{n}(\hat{\theta}n - \theta_0) \rightsquigarrow N(0,e{\theta_0}^{'-1} P_{\theta_0} f f^T (e_{\theta_0}^{'-1})^T) \end{eqnarray} が成り立つ.

注: $P_{\theta_0} f f^T$は$f_1(X),...f_k(X)$の共分散行列とする.

証明

まず,$\theta_0$において連続微分可能より,その近傍でも微分可能であることが分かる.さらに$\theta \mapsto e_{\theta}'$の$\theta_0$における連続性と$e_{\theta_0}'$が特異でないことより$\theta_0$の近傍でも$e_{\theta}'$は特異でない.よって逆関数定理より,$e: U \mapsto V$は微分可能な全単射写像であり,逆像$e^{-1}: V\mapsto U$も微分可能であるような,$\theta_0$の開近傍$U$と$P_{\theta_0}f$の開近傍$V$が存在する.

大数の法則より,$n\rightarrow \infty$で確率1で$\mathbb{P}_nf \in V$となることから,モーメント推定量$\hat{\theta}_n = e^{-1}(\mathbb{P}_n f)$は極限において確率1で存在する.

中心極限定理により,$\sqrt{n}(\mathbb{P}n f - P{\theta_0}f) \rightsquigarrow N(0, P_{\theta_0} f f^T)$が成り立つ.よって,デルタ法を用いると \begin{eqnarray} \sqrt{n}(\hat{\theta}n - \theta_0) = \sqrt{n}(e^{-1}(\mathbb{P}_nf) - e^{-1}(P{\theta_0}f)) \rightsquigarrow e_{\theta_0}^{'-1}(N(0, P_{\theta_0} f f^T)) \end{eqnarray} である. よって定理の主張 \begin{eqnarray} \sqrt{n}(\hat{\theta}n - \theta_0) \rightsquigarrow N(0,e{\theta_0}^{'-1} P_{\theta_0} f f^T (e_{\theta_0}^{'-1})^T) \end{eqnarray} が示せた.

以下で逆関数定理が使えることを確認するため2つ補題を示す.詳しくは述べないが,1つ目の補題は第25章で述べられるセミパラメトリックモデルで現れるような無限次元パラメータの場合に容易に拡張できる.

補題

$\Theta \subset \mathbb{R}^k$は任意とし,$e: \Theta \mapsto \mathbb{R}^k$は単射かつ$\theta_0$で微分可能であり,$e_{\theta_0}'$は特異でないとする.このとき,$e$の値域上で定義された$e$の逆写像$e^{-1}$は$e(\theta_0)$で連続であるとすれば,$e(\theta_0)$で微分可能である.

証明

示したいことを確認しておく.$\eta = e(\theta_0)$,$\Delta h = e^{-1} (\eta + h) - e^{-1}(\eta)$とかくことにする. $e^{-1}$が$e(\theta_0)$で微分可能であることを示すには, \begin{eqnarray} \Delta h = e_{\theta_0}'^{-1}(h) + o(||h||).\ \ (h \rightarrow 0). \end{eqnarray}

を示せばよい.以下,上式を示していく.$e^{-1}$は$\eta$で連続より,$h \rightarrow 0$のとき,$\Delta h \rightarrow 0$である.よって

\begin{eqnarray} \eta + h = e e^{-1} (\eta + h) = e(\Delta h+ \theta_0) = e(\theta_0) + e_{\theta_0}' (\Delta h) + o(||\Delta h||). \ \ (\mbox{as } h \rightarrow 0.) \end{eqnarray} 最後の等号では$e$が$\theta_0$で微分可能であることから$\theta_0$回りのテーラー展開を用いた.$e(\theta_0) = \eta$であったので上の方程式を変形して, \begin{eqnarray} e_{\theta_0}' (\Delta h) = h + o(||\Delta h ||). \ \ (h\rightarrow 0) \end{eqnarray} が得られる.これと,$e_{\theta_0}'$の逆写像の連続性より \begin{eqnarray} \Delta h = e_{\theta_0}'^{-1}(h) + o(||\Delta h||).\ \ (h \rightarrow 0). \end{eqnarray} 特に, \begin{eqnarray} ||\Delta h ||(1+o(1)) \leq ||e_{\theta_0}'^{-1}(h) || =O(||h||) \end{eqnarray} であるから, \begin{eqnarray} \Delta h &=& e_{\theta_0}'^{-1}(h) + o(||\Delta h||(1+o(1)))\ &=& e_{\theta_0}'^{-1}(h) + o(O(||h||))\ &=& e_{\theta_0}'^{-1}(h) + o(||h||).\ \ (h \rightarrow 0) \end{eqnarray} が成立し,これより, \begin{eqnarray} \Delta h = e_{\theta_0}'^{-1}(h) + o(||h||).\ \ (h \rightarrow 0). \end{eqnarray} であり,目標の式が得られた.

補題

$e : \Theta \mapsto \mathbb{R}^k$は$\theta_0$の近傍で定義されており微分可能であるとする.さらに$\theta_0$では連続微分可能であり,非特異な導関数を持つとする.このとき,$e$は$\theta_0$の任意の十分小さな開近傍$U$を開集合$V$への写像し,$e^{-1}:V \mapsto U$はwell-definedであり,連続である.

証明

$e$が$\theta_0$で連続微分可能という仮定から \begin{eqnarray} e_{\theta}' \rightarrow e_{\theta_0}' =:A^{-1}, \ \ (\theta \rightarrow \theta_0). \end{eqnarray} よって$\theta_0$の近傍$U$を十分小さくとれば,任意の$\theta \in U$で$||I - A e_{\theta}'|| \leq \frac{1}{2}$となるようにできる.$V = e(U)$から任意に$\eta_1 = e(\theta_1)(\theta_1 \in U)$をとり固定する.次に$\overline{\mbox{ball}}(\theta_1,\epsilon)\subset U$となるような$\epsilon >0$に対して$\eta$を,$||\eta - \eta_1||<\frac{1}{2}||A||^{-1}\epsilon=:\delta$となるようにとり固定する.ある点$\theta \in \overline{\mbox{ball}}(\theta_1,\epsilon)$について,$\eta = e(\theta)$である.このように定義すればすべての$\eta \in \mbox{ball}(\eta_1, \delta)$はそのオリジナルが$\overline{\mbox{ball}}(\theta_1,\epsilon)$に存在する.$e$が単射であればオリジナルは一意である.よって$V$は開集合であり,$e^{-1}$は$\eta_1$で連続である.

$\phi(\theta) = \theta + A(\eta- e(\theta))$と定義する.その$\theta$における微分$\phi_{\theta}' = I - A e_{\theta}'$のノルムは$||\phi_{\theta}'||\leq \frac{1}{2}$より$\phi$は$U$上の縮小写像である.さらに$||\theta - \theta_1||\leq \epsilon$とすれば, \begin{eqnarray} || \phi(\theta) - \theta_1|| &\leq & ||\phi(\theta) - \phi(\theta_1)||+||\phi(\theta_1) - \theta_1|| \ &\leq &\frac{1}{2}||\theta - \theta_1|| + ||A|| ||\eta - \eta_1|| < \epsilon \end{eqnarray} となる.従って,$\phi$は$\overline{\mbox{ball}}(\theta_1,\epsilon)$を$\overline{\mbox{ball}}(\theta_1,\epsilon)$自身に写像することが分かる.

さらに,$\phi$は縮小写像より,不動点定理から$\phi(\theta) = \theta$となるような点$\theta \in \overline{\mbox{ball}}(\theta_1,\epsilon)$を少なくとも一つもつ.不動点$\theta$は,$\phi$の定義から \begin{eqnarray} \theta = \theta + A(\eta - e(\theta)) \end{eqnarray} より,$e(\theta)=\eta$を満たす. このような点$\theta$は一意であることを示す.別の$e(\tilde{\theta}) = \eta$となるような$\phi$の不動点$\tilde{\theta}$があったとする.このとき, \begin{eqnarray} ||\tilde{\theta} - \theta|| = ||\phi(\tilde{\theta}) - \phi(\theta)|| \leq \frac{1}{2}||\tilde{\theta} - \theta||. \end{eqnarray} よって$\tilde{\theta} = \theta$である.よって不動点は一意であることが示せた.

よって$e$は$U$上で単射である.

Sources

  • A. W. Van Der Vaart, Asymptotic Statistics, Cambridge University Press