14:40 〜 15:00
[4F3-GS-3-03] 大規模言語モデルを用いた労働災害の原因推論
キーワード:大規模言語モデル、GPT-4、テキスト含意、フューショット学習
企業内で日々蓄積される労働災害の報告書は,原因分析,再発防止策の策定,安全教育などに利用することができる.しかし,これらのテキストデータは構造化されておらず,効率的な知識の蓄積と再利用を阻む原因となっている.
本研究ではこれらの文書を構造化し,再利用可能な有益な知識として蓄積することを目的とした.
本実験では,電力会社で発生した労働災害の報告書に関するテキストデータに対し,汎用LLMであるGPTを用いてテキスト含意を基にしたマルチラベルアノテーションを計4つのアプローチで行った.またアノテーションタスクに使用する事故の原因の抽象カテゴリ自体もゼロショットでGPT-4から抽出し,それを人間の専門家がチェックをすることでラベルを決定した.
実験の結果,特にプロンプトエンジニアリングを用いたワンショットのアプローチにおいて,GPTは強力な一般化能力を発揮し,一部の評価指標において人間のアノテーターと同じレベルに肉薄する有望な性能を示した.
しかし同時に,本研究のように専門性が高く,多面的複数の要素が絡まりあう事例を扱う際は,モデルの選択やプロンプト設定に慎重な調整が求められることも示唆された.
本研究ではこれらの文書を構造化し,再利用可能な有益な知識として蓄積することを目的とした.
本実験では,電力会社で発生した労働災害の報告書に関するテキストデータに対し,汎用LLMであるGPTを用いてテキスト含意を基にしたマルチラベルアノテーションを計4つのアプローチで行った.またアノテーションタスクに使用する事故の原因の抽象カテゴリ自体もゼロショットでGPT-4から抽出し,それを人間の専門家がチェックをすることでラベルを決定した.
実験の結果,特にプロンプトエンジニアリングを用いたワンショットのアプローチにおいて,GPTは強力な一般化能力を発揮し,一部の評価指標において人間のアノテーターと同じレベルに肉薄する有望な性能を示した.
しかし同時に,本研究のように専門性が高く,多面的複数の要素が絡まりあう事例を扱う際は,モデルの選択やプロンプト設定に慎重な調整が求められることも示唆された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。