2023年度 人工知能学会全国大会(第37回)

講演情報

ポスターセッション

一般セッション » ポスターセッション

[4Xin1] ポスターセッション2

2023年6月9日(金) 09:00 〜 10:40 X会場 (展示ホールB)

[4Xin1-78] エッジデバイス搭載可能なAttention Moduleを用いた動的手話認識システム

〇孟 悦捷1、柳澤 政生1、史 又華1 (1.早稲田大学)

キーワード:人工知能、手話認識、エッジ端末、画像認識、トランスフォーマー

近年では人工知能の活用として、Siriのような音声アシスタントが人々の生活に便利をもたらしている。しかし、話すことのできない聴覚障害者にはそれを使用することができず、課題となっている。その解決策として深層学習を使ったジェスチャー認識モデルが開発されている。しかし、先行研究では画像からジェスチャーを認識する研究や3D-CNNもしくはCNN+LSTMを使って動画からジェスチャーを認識する研究が多く、メモリ使用量が多い。これらの問題に着目し、本論文ではTransformerを使ったジェスチャー認識モデルDGT-STAを提案する。Attention moduleを使用することで浅層ニューラルネットワークで3D-CNNを超える精度に達成でき、他のAttention moduleを使用したモデルよりメモリ使用量を50.91%まで削減した。また、本論文ではモデルの学習を行うために日本手話のデータセットを作成し、DGT-STAの評価を行った。最後に、本論文ではIoT エッジ端末におけるDGT-STAの実装可能性を検証した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード