大規模言語モデルにおける潜在表現の複雑性と階層性の分析

関口 正登

10:20 〜 10:40

[3S1-GS-2-05] 大規模言語モデルにおける潜在表現の複雑性と階層性の分析

〇関口正登¹、石垣龍馬¹、前田英作¹ (1. 東京電機大学)

キーワード：大規模言語モデル、表現学習、解釈可能性、Intrinsic Dimension、δ-hyperbolicity

大規模言語モデル（LLM）は急速に発展し，さまざまな実用分野で活用されている．一方で，その動作原理には未解明の部分が多く残されている．本研究では，LLMの推論過程をより深く理解するために，LLMの潜在表現の分布を分析した．分析手法として，分布の本質的な次元であるIntrinsic Dimensionと，分布の階層構造を測る指標であるδ-hyperbolicityを用いた．実験結果から，LLMの推論過程における複雑性と階層性を考察し，LLMが内部で自然言語の意味をどのように扱っているかについて示唆を得た．本研究は，LLMの解釈可能性の向上に加え，アーキテクチャの改善に貢献する．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3S1-GS-2] 機械学習：

[3S1-GS-2-05] 大規模言語モデルにおける潜在表現の複雑性と階層性の分析

パスワード