この記事はブロックされています。続きを読みたい方はログインをして下さい。会員ではない方は新規会員登録をして下さい。


魔法の数式スパースモデリングとディープラーニングが切り開く未来とひらめきの謎 中編

前回は魔法の数式スパースモデリングってなに? ということを鶴亀算と犬猫算を使ってなんとなく大雑把に説明した。
連立一次方程式であっても、鍵となる解が分からなければ解きようがない、というのが問題で、それを最小二乗法という判定方法で解決しようというのが、スパースモデリングなんだよね。

最小二乗法は回帰分析で出てくる用語。
回帰分析というのは何らかの変量(値が変動するもの)があるとき、その変動の原因を統計的に究明し、それらの関係を表す「回帰モデル」と呼ばれる数式を求めることを意味する。

もっと簡単に言うと、原因と結果を分析することで、例えば年齢と身長の関係をグラフにすると、年齢とともに身長は右肩上がりで伸びていくよね。
グラフにすると「y=ax+b」のような一次方程式になったりする。よくみるグラフだよね。
「y」を目的変数とした場合、説明変数は「x」となる。「x」が1次元ならば単回帰、「x」が2次元以上ならば重回帰と言う。
で、ある集団の年齢と身長を調べていくと年齢とともに身長が伸びるということが分かるんだけれど、伸び率には個性があるよね。これを変量と呼ぶ。一律ぴったり同じ割合だけ伸びるわけではなく、成長という現象にはムラがあり、そして終わりがある。性差もある。

なのでグラフとしてマッピングしていくと値にバラつきが出てくるんだよね。
身長が縮むことはないから右肩上がりなんだけれど、値にはバラつきが生じる。
このバラつきを一つのモデルとしてまとめるにはどうすればいいか?
一番簡単なのが値が近いもの同士をまとめて、遠いものは切り捨てるというやり方だ。
その基準となる考えが最小二乗法で、「誤差の二乗の和を最小にする」という方法。
これでバラついた値の誤差を収束し単純化できる。

関連記事