線形回帰モデルとは

要点まとめ

説明変数 $\boldsymbol x$ に対して、パラメータ $\boldsymbol w$ を使用して、 $\hat{\boldsymbol y} = \boldsymbol {w}^T \boldsymbol {x} + w_0$ のモデルを立てる。

学習用データ $\boldsymbol y$ を用いて、平均二乗誤差 $MSE_{train} = \frac{1}{n_{train}} \sum_{i=1}^{n_{train}} (\hat{\boldsymbol{y_i}}^{(train)} - \boldsymbol{y}_i^{(train)})^{2}$ が最小となる $\boldsymbol{w}$ を求めるために、平均二乗誤差を $\boldsymbol{w}$ で偏微分したものが0になる条件から、 $\boldsymbol{w}$ を求める。

Pythonで実装する場合、

## sklearnモジュールからLinearRegressionをインポート
from sklearn.linear_model import LinearRegression

# オブジェクト生成
model = LinearRegression()

# fit関数でパラメータ推定 (data : 説明変数, target : 目的変数)
model.fit(x_train, y_train)

#予測 新たな目的変数を与えると、推定値を返す
y_pred = model.predict(x_valid)

# 平均二乗誤差で性能を評価
from sklearn.metrics import mean_squared_error
MSE = mean_squared_error(y_valid, y_pred)