[1Win4-38] 工業画像の論理的異常検出を説明するキャプション生成
キーワード:工業画像、マルチモーダルモデル、異常検出、画像キャプション
本研究は、マルチモーダルモデルを用いて工業画像における論理的異常を検出し、正確な説明を生成することを目的とする。従来の異常検出手法は、主に画像特徴の抽出およびパターン認識に依存しており、工業環境における複雑かつ微細な論理的不整合を効果的に捉えることは困難であった。これらの課題を解決するため、マルチモーダル学習技術を用いて視覚データとテキストデータを統合し、異常検出精度の向上を図った。既存のデータセットに各画像の説明文を付加し、訓練時に異常画像と正常画像の比率やモデルのパラメータを調整することで、検出性能を最適化した。その結果、訓練後のモデルは異常画像を効果的に識別するだけでなく、検出された異常も適切に説明できることが確認された。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。