要点まとめ

再帰型ニューラルネットワーク (RNN=Recurrent Neural Network)とは、時系列データのように時間的な繋がりを持つデータを扱うためのネットワーク。

時系列データの代表例としては、音声データ・テキストデータ等がある。

通常のNNでは入力→中間層→出力という構成だが、中間層への入力に対して一つ前の時系列データの中間層からを入力とすることで、時間軸の繋がりを持つ構成にしたものをRNNという。

$\displaystyle u^{t} = \boldsymbol{W}_{(in)}\boldsymbol{x}^{t} + \boldsymbol{W}\boldsymbol{z}^{t-1} + b$

$\displaystyle z^{t} = f(\boldsymbol{W}_{(in)}\boldsymbol{x}^{t} + \boldsymbol{W}\boldsymbol{z}^{t-1} + b)$

$\displaystyle v^{t} = \boldsymbol{W}_{(out)}\boldsymbol{z}^{t} + c$

$\displaystyle y^{t} = g(\boldsymbol{W}_{(out)}\boldsymbol{z}^{t}+c)$

$u^{t}$ は活性化関数を通す前、活性化関数を通したものを $z^{t}$ という中間層となる。

出力側も同様に、活性化関数を通す前を $v^{t}$ 、活性化関数を通した後の出力を $y^{t}$ としている。

BPTT(Back Propergation Through Time)の式は前記のRNNの式を微分を用いるが、かなり複雑。

実装演習

バイナリ加算についてのRNNの結果を確認。

現在の中間層への、前の中間層からの入力にも重みがあるのがRNNの特徴である。