[B-16-24] 異種の効用関数に対応した強化学習型ウィンドウフロー制御方式に関する一検討
キーワード:q学習
機械学習を利用したトラヒック制御方式の研究が活発に行なわれている。我々はこれまで、Q 学習に基づく AIMD 型のウィンドウフロー制御方式 Q-AIMD を提案した。Q-AIMD ではすべてのフローが同一の効用関数 (スループット最大化) を持っていることを前提としているが、それぞれのフローの効用関数が同一とは限らない。強化学習によって、各フローの効用関数の違いを反映できるウィンドウフロー制御方式 Q-HAIMD を実現する。Q-AIMD を複数の効用関数に対応できるように拡張する。具体的には、2 種類の効用関数 (スループット最大化: U(x) = x、一定以上のスループットの実現: U(x) = min(x, c)) を対象とし、それぞれの効用関数に応じて Q 学習における報酬を決定する。
講演論文集PDFを閲覧したい場合はパスワードを入力してください。
パスワードは、講演参加申込者、聴講参加申込者にメールで御連絡しております。