14:00 〜 14:20
[4A3-GS-10-01] 広告文書の判別のためのLLMによる文書データ拡張および,文書構造のメトリックスを指標とした生成文書の妥当性評価
キーワード:インターネット広告、モデル評価、データ拡張
インターネット広告市場の拡大に伴い,法律あるいは倫理上問題のある広告の誤配信を防止する仕組みが求められている.問題のある広告文書を識別および解釈可能な機械学習モデルを作るためには,適切な学習用データを一定量確保する必要がある.
本研究では,化粧品広告および健康食品広告を対象として,薬機法上不適切な広告文書を識別するモデルの学習データを確保する手段として,LLMによる学習データ拡張を行う方法について検討を行った.
薬機法では「効果効能に関する表現」「医療従事者の推薦表現」「他社の誹謗表現」など様々な表現の制約が定められている.文書生成時のプロンプトに,このような問題表現を含めた文書を生成するように指定することで,違法性の理由を明示可能なデータセットを構築することを試みた.また指定単語の使用の有無,MVR,および名詞率を組み合わせた評価指標により,生成された文書の妥当性を定量化する指標を考案し,定量的な分析を行った.
本研究では,化粧品広告および健康食品広告を対象として,薬機法上不適切な広告文書を識別するモデルの学習データを確保する手段として,LLMによる学習データ拡張を行う方法について検討を行った.
薬機法では「効果効能に関する表現」「医療従事者の推薦表現」「他社の誹謗表現」など様々な表現の制約が定められている.文書生成時のプロンプトに,このような問題表現を含めた文書を生成するように指定することで,違法性の理由を明示可能なデータセットを構築することを試みた.また指定単語の使用の有無,MVR,および名詞率を組み合わせた評価指標により,生成された文書の妥当性を定量化する指標を考案し,定量的な分析を行った.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。