異種の効用関数に対応した強化学習型ウィンドウフロー制御方式に関する一検討

武貞悠太

[B-16-24] 異種の効用関数に対応した強化学習型ウィンドウフロー制御方式に関する一検討

^○武貞悠太¹, Nay Aung Han², 中村遼³, 大崎博之² (1.関西学院大, 2.関西学院大, 3.福岡大)

キーワード：q学習

機械学習を利用したトラヒック制御方式の研究が活発に行なわれている。我々はこれまで、Q 学習に基づく AIMD 型のウィンドウフロー制御方式 Q-AIMD を提案した。Q-AIMD ではすべてのフローが同一の効用関数 (スループット最大化) を持っていることを前提としているが、それぞれのフローの効用関数が同一とは限らない。強化学習によって、各フローの効用関数の違いを反映できるウィンドウフロー制御方式 Q-HAIMD を実現する。Q-AIMD を複数の効用関数に対応できるように拡張する。具体的には、2 種類の効用関数 (スループット最大化: U(x) = x、一定以上のスループットの実現: U(x) = min(x, c)) を対象とし、それぞれの効用関数に応じて Q 学習における報酬を決定する。

講演論文集PDFを閲覧したい場合はパスワードを入力してください。

パスワードは、講演参加申込者、聴講参加申込者にメールで御連絡しております。

講演情報

[B-16] インターネットアーキテクチャ

[B-16-24] 異種の効用関数に対応した強化学習型ウィンドウフロー制御方式に関する一検討

パスワード