読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

[論文メモ]『窓打ち切り再発データのためのパラメトリック推定』Zhu et al. (2014)

底本

Yada ZHU, Emmanuel YASHCHIN, and J. R. M. HOSKING, (2014)
Parametric Estimation for Window Censored Recurrence Data,Technometrics, pp.55-64.
http://www.tandfonline.com/doi/abs/10.1080/00401706.2013.804442?journalCode=utch20#.VIpeo6SsUZI

状況

窓打ち切り再発データ(Window Censored Recurrence Data; WCRD)とは, 観測期間 の幅 ( w ) が制限されているような再生過程のデータ. 観測期間の左端点, 右端点では, recurrence の間隔がわからない.

f:id:abrahamcow:20150105181850p:plain

Zhu らは, 製品の故障イベントの再生過程で, 故障時に修理(repair)または交換(replace)を行う状況を 考えている.
修理(repair)の場合は, 故障間隔が事前の故障間隔に依存する. 交換(replace)の場合はリニューアルされる. 過去の故障回数は共変量としてモデルに含める.

記法(notation)

  • 時刻  T_0 に設置された製品が, 時刻  T_1,T_2,...,T_k に故障.
  • 故障時に修理(repair)または交換(replace)を行う.
  • k 番目の故障時に交換を行う. K は確率変数.
  • 故障間隔 T_k − T_{k−1}: は分布 F_K に従う.

また,

  • w:窓の幅
  • N(w) :窓内で観測された故障の回数

と表記する.

f:id:abrahamcow:20150106005116p:plain

仮定(assumption)

これは非常に弱い仮定だと思う.
これがなければたいていの場合, データ分析はできない.

「平均交換間隔は有限の値に収束する」とは,

 \displaystyle \sum_{k=1}^{\infty} \mu _k \Pr \{K > k\} < \infty,

ここで,

 \displaystyle  \mu _k = \int ^{\infty}_0 s f_k (s) \, ds,

ということである.

メンテナンスの方針

以下のように表記する.

  •  p_k = \Pr\{K=k\}
  • r_k = \Pr\{K = k | K \ge k\}

実践的には  r_kk の増加関数である.
(過去の故障回数が交換に影響を与えるので)

この記法のもとで,

  •  \displaystyle r_k=p_k/􏰇(1−\sum^{k−1}_{j=1}p_j)
  •  \displaystyle p_k =r_k\prod^{k−1}_{j=1}(1−r_j)

を得る.

K の確率関数に以下を仮定する.

\displaystyle p_k =\Pr\{K=k\}= \frac{a^{k-1}}{\sum^{􏰆m−1}_{j=0}a^j}
(  a>0,  k=1,\ldots ,m)

mk の上界.

上界が定まっているのは, 一見ちょっと不自然な気がするが, 上界は経験的にわかっているものとする.

"For example" として Pelletier, G., Mailhot, A., and Villeneuve, J. (2003). ”Modeling Water Pipe Breaks—Three Case Studies.” が挙げられている.

http://ascelibrary.org/doi/abs/10.1061/(ASCE)0733-9496(2003)129:2(115)

例えば m=2 のとき,

\displaystyle p_1 =\Pr\{K=1\}= \frac{1}{1+a}

\displaystyle p_2 =\Pr\{K=2\}= \frac{a}{1+a}

なので, ぼくはこの確率関数をベルヌーイ試行を拡張したもの, というイメージで捉えている.

尤度の構成

記号:

  • Iを再起間の間隔が, 窓の始点を含むか否かを表す確率変数とする.
  • \mathfrak{R}:交換(replacement)のある故障
  •  t_{j_{\mathfrak{R}}}:最初の交換が起こる故障が発生する時刻.
  • d: WCRD のデータセット.
  • \boldsymbol{\theta}: 未知パラメータのベクトル.

 \displaystyle q_k=\frac{\Pr\{K \ge k \}}{E[K]}=\frac{\sum^m_{j=k}p_j}{\sum^m_{j=k}jp_j}


尤度:
\begin{align*}
&L( \boldsymbol{\theta};d,w) \\
&=\left\{
\begin{array}{ll}
\sum^{m-n}_{i=1} \frac{q_i}{\sum^{m}_{j=1} q_j \mu _j}\prod^{n+1}_{j=1} L_{j, i+j-1}&\mbox{交換のないとき}\\
\sum^{m-j_{\mathfrak{R}}+1}_{i=1} \frac{q_i}{\sum^{m}_{j=1} q_j \mu _j}\prod^{j_{\mathfrak{R}}}_{j=1}L_{j, i+j-1}\prod^{n+1}_{j_{\mathfrak{R}}+1}L_{j,k_j}&\mbox{交換があるとき}
\end{array}
\right.
\end{align*}


尤度は以下をすべてかけあわせたものになる.

最初の故障:
\begin{align}
L_{1,k}&=\left\{
\begin{array}{ll}
\{1-F_k(t_1)\}(1-r_k) & \mbox{修理}\\
\{1-F_k(t_1)\}(r_k)& \mbox{交換}
\end{array}
\right.
\end{align}
途中(1 < j \le n)の故障:
\begin{align}
L_{j,k}&=\left\{
\begin{array}{ll}
f_k(t_j-t_{j-1})(1-r_k) & \mbox{修理}\\
f_k(t_j-t_{j-1})(r_k)& \mbox{交換}
\end{array}
\right.
\end{align}
最後の故障:
\begin{align}
L_{n+1,k} =1 -F_k(w-t)
\end{align}

f:id:abrahamcow:20150109223446p:plain

こうして構成された尤度をもとに, 元論文ではワイブル分布, 対数正規分布を仮定したシミュレーションとケース・スタディを行って, この手法の有用さを示している.

注記

筆者はとても不勉強な人間です. わからないところは飛ばしてます.

学生各位, このブログからの孫引きは避けたほうがいいと思います. ちゃんと読んだらぼくに教えてください.