2023年度 人工知能学会全国大会(第37回)

講演情報

ポスターセッション

一般セッション » ポスターセッション

[4Xin1] ポスターセッション2

2023年6月9日(金) 09:00 〜 10:40 X会場 (展示ホールB)

[4Xin1-08] 大規模言語モデルとヒューリスティクスに基づくreadme生成

〇是枝 祐太1、森下 皓文1、今一 修1、十河 泰弘1 (1.株式会社日立製作所)

キーワード:自然言語処理、大規模言語モデル、ソフトウェア工学、言語生成

プログラムコードの再利用はソフトウェア開発における基本的な生産性向上方法であるが,コードレポジトリの説明文 (readme) は整備コストが高く,しばしばreadmeが整備されないことがコードの再利用を妨げている.近年報告された研究は関数・クラスなど数十行のコードに具体性の高いコメントを付与するが, readmeの生成においては数万から数百万行のコードを抽象的に要約して生成を行う必要があるため,コメント生成技術をreadme生成の問題にそのまま適用することはできない.本研究では,レポジトリが実施することの概要を示す代表的なコード断片 (代表コード) をヒューリスティクスと弱教師付き学習により抽出することで,大規模言語モデルでreadmeを生成できることを示した.主観評価と自動評価により,提案手法の有効性を確認した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード