JSAI2025

Presentation information

General Session

General Session » GS-2 Machine learning

[3S4-GS-2] Machine learning:

Thu. May 29, 2025 1:40 PM - 3:20 PM Room S (Room 701-2)

座長:千々和 大輝(NTT)

2:00 PM - 2:20 PM

[3S4-GS-2-02] Measuring Intrinsic Dimension of Token Embeddings

〇Takuya Kataiwa1, Hakaze Cho2, Tetsushi Ohki1,3 (1. Shizuoka University, 2. JAIST, 3. RIKEN)

Keywords:Embedding, Mechanistic Interpretability, Intrsic Dimension

本稿では,言語の埋め込み表現である単語ベクトルや埋め込み層について,表現に必要十分な次元である内在次元 (Intrinsic Dimension; ID) を計測し,その冗長度合いを定量評価する.具体的には,(1) Word2Vec や GloVe などの小規模モデルの埋め込みが持つIDを推定し,(2) Pythiaシリーズを代表とする大規模言語モデルの埋め込み層における ID をスケール別・学習過程別に解析する.実験の結果,埋め込み空間が外在次元に比べ低い次元の多様体上に分布する傾向が見られた.また,モデル規模の拡大に伴う冗長率の変化や,学習初期において ID が急速に収束する傾向が観察された.また,推定されたIDがLoRA適用時のランク選択に有効な可能性を示した.

Please log in with your participant account.
» Participant Log In