16:40 〜 17:00
[2L5-GS-1-04] 代数統計的アプローチによる言語モデルの構造学習手法の開発
キーワード:言語モデル、代数統計、モデル選択
代数幾何学と統計学の融合領域である代数統計学では,確率モデルを高次元空間における多様体とし,その構造を多項式環のイデアルにより捉える.この観点からは,言語データにおける条件付き独立性や階層的構造といった複雑な制約の自然なモデル化が期待できる.本研究では,言語の確率モデルを,文を構成する単語の同時確率分布として定式化し,代数統計的アプローチを適用して,確率多様体を制約する消失イデアルによりモデルを特徴づけ,データに適合するモデルを選択する手法を開発する.人工データによる実験で提案手法は情報量規準に近い性能を示し,確率モデルの構造的な特徴を直接抽出することを示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。