9:00 AM - 9:15 AM
[20a-B01-1] Piecewise linear Regression Analysis of Nonlinear Data
Keywords:Machine learning, Materials Informatics
本講演では、我々が行っている解析技術として、多次元のデータ空間をいくつかに区分けし、各区分における回帰を同時に最適化する、区分線形回帰と呼ばれるアルゴリズムを紹介する。データ空間全体を等価に扱う決定木や線形回帰とは異なり,部分的に表れているデータの相関を適切に抽出できる点が大きな特徴である。さらに、区分けも回帰もできるだけシンプルに表現されるよう,L0正則化と呼ばれる非常に強い制限要素を課して最適化を行うことが出来る。後者は、目的変数の量に対して説明変数の量が極端に多いような場合,いわゆるスパースデータと呼ばれるデータ群から有意な相関を抽出する上で大きな利点となる。