5:40 PM - 6:00 PM
[1P5-OS-16-01] Investigation of Optimal Network Architectures for Domain Adaptation
Keywords:Reinforcement Learning, Control Engineering, Sim2Real, Domain Randomization
強化学習で実環境の制御則(policy)を獲得する際、サンプルの取得が難しい状況がある。この問題の対策の一つとしてdomain adaptationがあり、具体的な方法としてシミュレーション環境による制御則の事前訓練と実環境から取得したサンプルによるファインチューニングがある。Domain adaptationは幅広く研究されているが、actorやcriticを構成するネットワークアーキテクチャについてはあまり注目されていない。そこで、本研究ではdomain adaptationのための最適なネットワークアーキテクチャについて検討する。特に、基盤モデルのファインチューニング手法として広く採用されているLoRAのように、少数のパラメータのみを学習することで事前学習の情報を有効活用できるかどうかに注目し、その有効性を実験的に検証する。
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.