要点まとめ

$n$ 次元ベクトル $\boldsymbol{x}$ の分類を行うために、パラメータ $\boldsymbol{w}$ を用いて $f(\boldsymbol{x}) = \boldsymbol{w}^{T} \boldsymbol{x} + b$ の符号で分類する。分類境界から最も近いベクトルをサポートベクトルといい、分類境界とサポートベクトルとの距離をマージンという。

分類誤りを許さない分類をハードマージンといい、スラック変数 $\boldsymbol{\xi}$ を用いて誤りを許容する分類をソフトマージンと言う。

誤りを小さくしつつ、マージンを最大化する $\boldsymbol{w}$ を求める最適化問題(主問題)は、ラグランジュ関数を導入することで、より変数の少ない双対問題に置き換えられる。

非線形分類を行う場合は写像する関数 $\boldsymbol{\phi}(\boldsymbol{x})$ を用いて高次元空間に写像した双対問題を解くことになるが $\phi(\boldsymbol{x}_i)^{T} \phi(\boldsymbol{x}_j)$ の計算コストが膨大で現実的は計算困難。ここでカーネル関数 $K(\boldsymbol{x}_i, \boldsymbol{x}_j) = \phi(\boldsymbol{x}_i)^{T} \phi(\boldsymbol{x}_j)$ に置き換えることで計算コストを大幅に下げることが可能になる。

実装演習

f:id:yui-gen-ron:20211119125809p:plain

2クラス分類の分類境界

決定関数

特徴ベクトル $\boldsymbol{x}$ と同じ次元のパラメータ $\boldsymbol{w}$ を用いて決定境界を決める決定関数 $f(x)$ を下記のように表す。

決定関数を用いて下記のような2クラス分類を考える。

$\boldsymbol{x}$ が2次元の場合、決定関数は下記のようになる。

線形サポートベクトル分類 (ハードマージン)

線形分離可能な場合、分類境界から最も距離が近い訓練データをサポートベクトルと言い、サポートベクトルと分類境界との距離をマージンと呼ぶ。

マージンが最大となる分類境界 $f(\boldsymbol{x})$ を求める。

サポートベクトル $\boldsymbol{x}$ と分類境界 $f(\boldsymbol{x})$ との距離は、 $\boldsymbol{w}$ のL2ノルム $|| \boldsymbol{w} ||^2 = \sqrt{w_1^{2} + w_2^{2} + \cdots + w_n^{2}}$ を用いて、次のように表せる。

分類境界から最も近くにあるサポートベクトル $\boldsymbol{x}_i$ との距離は、下記のように表せる。

マージンを最大化するには、下記の問題を解けば良い。

更に式を変形すると、ハードマージンの場合は下記を解けば良いことになる。

 , ただし、すべてのに対して

線形サポートベクトル分類 (ソフトマージン)

完全には分類不可能な、多少の誤りを許す分類を、ハードマージンに対してソフトマージンと言う。ソフトマージンはでは誤りを許容する非負の変数スラック変数 $\boldsymbol{\xi} = (\xi_1, \xi_2, \cdots , \xi_n)$ と正則化係数 $C$ とを用いることで、下記のように表せる。