2025年度 人工知能学会全国大会(第39回)

講演情報

一般セッション

一般セッション » GS-2 機械学習

[2S4-GS-2] 機械学習:

2025年5月28日(水) 13:40 〜 15:20 S会場 (会議室701-2)

座長:金井 関利(NTT)

15:00 〜 15:20

[2S4-GS-2-05] カテゴリカル系列データにおける多項分布レジームのセグメンテーションとモデル選択基準の検討

〇武石 悠希1、萩田 碧偉1、山崎 綾一郎1、髙井 健人1、谷口 ジョイ1,3、山岸 祐己1,2 (1. 静岡理工科大学、2. 理化学研究所、3. 国立国語研究所)

キーワード:カテゴリカルデータ、情報量基準、レジームスイッチング

カテゴリカルな系列データは,それらの変化が複雑な場合,無駄な情報が多く,可視化時の解釈が困難となる.本研究では,観測データが複数のレジームによって異なる多項分布に従うと仮定し,尤度最大化に基づいて,動的計画法でレジームの分割点を検出することを試みる.類似手法として Pruned Exact Linear Time(通称PELT法)があるが,基本的には1次元データに対しての適応を想定しており,カテゴリカルデータのような多次元を扱う場合には,都度目的関数を次元数分拡張して問題を落とし込む必要がある.提案手法は,カテゴリカルデータ解析における系列的変動の理解や解釈性向上に寄与し,特に複雑な変動特性を有するデータセットにおいて,有用な分析基盤となることが期待される.評価実験では,モデルの過適合を抑制するための適切な評価指標(AIC/BIC/MDL/エルボー法)を検証し,それぞれの評価指標におけるモデル選択の傾向について明らかにする.特に,エルボー法の自動化手法である L method に着目し,その挙動についても調査を行う.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード