2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-32 Mechanistic Interpretability

[3L6-OS-32] Mechanistic Interpretability

2025年5月29日(木) 17:40 〜 19:20 L会場 (会議室1007)

オーガナイザ:高槻 瞭大(AIアライメントネットワーク/東京大学),峰岸 剛基(東京大学),宮西 洋輔(サイバーエージェント/北陸先端科学技術大学院大学),高木 優(国立情報学研究所)

18:20 〜 18:40

[3L6-OS-32-03] 大規模言語モデルにおける地理表現の形成と訓練データの影響

〇大竹 啓永1,2、大内 啓樹1,3、尾崎 慎太郎1,2、平岡 達也4、渡辺 太郎1、宮尾 祐介5,2、大関 洋平5、高木 優2 (1. 奈良先端科学技術大学院大学、2. 国立情報学研究所 大規模言語モデル研究開発センター、3. 理化学研究所、4. MBZUAI、5. 東京大学)

キーワード:人工知能の説明可能性、人工知能の知識評価、地理ドメイン

大規模言語モデルは、地理分野の様々なタスクを解決する能力を実証しており、これらの能力は、内部の地理空間的世界モデルに基づいていることが示唆されている。しかし、これまでの研究では、主に英語中心のデータで学習させた少数のモデルのみを用いて、このような内部表現について検討されており、他の言語で学習させたモデルで地理空間表現がどのように出現するかは不明なままであった。本研究では、異なる言語のデータで事前訓練済みモデルにおいて、複数の地域の内部地理表現を調査する。我々の実験結果より、これらの世界モデルの特性は、訓練時に使用された言語に強く依存する可能性があることを示している。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード