2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-1 データセットとベンチマークの技術的・社会的な視点

[1P4-OS-1b] データセットとベンチマークの技術的・社会的な視点

2025年5月27日(火) 15:40 〜 17:20 P会場 (会議室801-2)

オーガナイザ:鈴木 健二(ソニーグループ),原 聡(電気通信大学),谷中 瞳(東京大学),菅原 朔(国立情報学研究所)

16:20 〜 16:40

[1P4-OS-1b-03] 国産農業用LLMのための要点抽出方法に基づく評価手法の検討

〇石原 潤一1、小林 暁雄1、桂樹 哲雄1、大友 将宏1、橋本 祥2、阪本 浩太郎3、杉村 安都武4、米丸 淳一1、川村 隆浩1 (1. 農業・食品産業技術総合研究機構、2. 筑波大学、3. (株)BESNA研究所、4. 三重県農業研究所)

キーワード:大規模言語モデル、農業情報

農研機構は、内閣府「研究開発とSociety 5.0との橋渡しプログラム(BRIDGE)」における「AI農業社会実装プロジェクト」にて、農業分野に特化した日本語大規模言語モデル開発している。本研究では、三重県農業研究所より提供されたイチゴに関するマニュアル類を元にインストラクションデータを構築し、これを用いてElyza-8B モデルに対しインストラクションチューニングを施した。本システムは特定ドメインに特化しているため、抑えるべき専門知識や要点が回答に網羅されると好ましい。そこで、著者らは、これまでLLMによる述語項構造解析を用いた要点一覧の抽出と、それらを正解データとの含意関係認識をベースとしたLLM as a Judgeによる自動評価手法を提案してきた。しかしながら、この手法では、モデル出力がより具体的な要点を出力していた場合に、適切に含意関係を認識できないという問題があった。本稿では、人手による要点抽出データを新たに構築し、これを用いた自動評価に対する厳密な性能評価と評価手法の改良の方向性について議論を行う。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード