[2Win5-93] LLMを用いた有害なコンテンツを直接閲覧しない判断方法の検討
キーワード:コンテンツモデレーション、大規模言語モデル、安全性、ブロックチェーン、有害なコンテンツ
サービス上の有害なコンテンツを認知し,速やかに対策することは利用者を守る上で,コンテンツモデレーターやサイバーセキュリティ担当者の重要なミッションである.しかしながら,有害なコンテンツの内,画像や映像などの対策の判断に直接閲覧することが必要となるコンテンツについては,閲覧者に多大な負担を強いることが知られている.そのため,利用者だけでなく,コンテンツをモニタリングする関係者を含めた保護を実現しながら,有害なコンテンツに対処できるかが課題である.本研究では,LLMを用いたコンテンツの言語的な解釈に着目し,直接閲覧することが難しいコンテンツの有害性判断に,文章で判断する仕組みを適用することが有効であるか評価する.広く公開され,検証の再現性も確保されており,有害なコンテンツを含むことでも知られているブロックチェーンの代表的なサービスである Bitcoin を対象に,ブロックチェーン上に埋め込まれた画像データを LLM による文章化によって解釈し,埋め込みデータについて調査した研究の結果と比較することで,提案する仕組みの有効性を示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。