[3Win5-23] 生成モデルにおける日本語の敬語・非敬語の理解と処理
キーワード:人工知能、自然言語処理、transformer
本稿では、gpt-2をはじめとする生成モデルが、日本語の敬語・非敬語文をどのように理解・処理しているかを解明することを目標とし、敬語・非敬語にそれぞれ強く反応するニューロン(敬語ニューロン・非敬語ニューロン)に関する解析を行う。 具体的には、敬語・非敬語に対応する敬語ニューロンを特定した上で、敬語文・非敬語文を判断する二値分類器としての敬語ニューロンの評価や、モデルに文を入力した際の敬語ニューロンの挙動の調査を行う。 また、敬語ニューロンの活性値を操作した上でモデルに文章を生成させる実験も補足的に行う。 本研究は、モデルが敬語・非敬語の概念を理解する仕組みを洞察し、言語特化型モデルの改良に向けた示唆を提供する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。