日本食品科学工学会第71回大会

講演情報

シンポジウム

シンポジウムB

[SB4] シンポジウムB4

2024年8月30日(金) 09:00 〜 11:45 B(S3)会場 (3F N322)

世話人:下山田 真(静岡県立大学)、中野 祥吾(静岡県立大学)

10:20 〜 10:55

[SB4-03] 食品画像処理と生成AIへの期待

*加藤 邦人1 (1. 岐阜大学 工学部)

キーワード:食品画像認識、生成AI、マルチモーダルAI、大規模自然言語モデル、コンピュータビジョン

    【講演者の紹介】
    加藤邦人(かとうくにひと):岐阜大学工学部電気電子・情報工学科情報コース教授.岐阜大学人工知能研究推進センターセンター長 略歴:1996年中京大学大学院情報科学研究科修士課程修了.岐阜大学工学部電子情報工学科情報コース助手.2009年同大学応用情報学科准教授.2011年メリーランド大学コンピュータビジョンラボラトリ客員研究員.2019年岐阜大学人工知能研究推進センターセンター長.2021年岐阜大学電気電子・情報工学科情報コース教授.博士(情報認知科学)

    食品の評価には,成分分析など化学的分析と,物性測定により計測される弾力性や粘性など物理的分析が定量評価に用いられる.一方で,味や匂い,見た目といった被験者を用いた官能評価は,人間の感覚によって行われるため,主観的な要素が強く,定量的な評価が課題となっている.画像認識や音声認識技術は,新たな評価手法としての活用が模索されてきた.
    画像認識は,食品の形状,色,光沢などの外観や,テクスチャなどの構造を定量化するための有力なツールとして利用されている.具体的には,食品の形状や色,テクスチャなどの解析を自動化し,または定量的な評価法として応用される.また,感性情報処理の分野では,人間の感性量を計測し,画像等の入力刺激との関連を調べる研究が進められている.これらを人の食品に対する感覚に応用することで,より客観的で再現性の高い食品評価が期待される.さらに,近年の人工知能技術の発展を受けて,企画,調査段階でのマーケティング調査,製品の差別化,人の行動解析,パッケージデザインなど,製品のマーケティングに応用する例等もある.
    最近では,Large Language Model (LLM) の進化に伴い,生成AIが脚光を浴びている.LLMは膨大なデータを学習し広範な知識を身に着け,高度な推論能力を持つAIモデルであり,特に画像や音声を扱うマルチモーダルLLMや,画像と言語を連携させるLarge Vision Language Model (LVLM) が開発されている.これにより,AIが画像を理解し,自然言語でその内容を説明することが可能となった.
    LLMの食品分野への応用例としては,レシピの自動生成がある.AIが様々な食材の組み合わせや調理法を学習し,新しいレシピを提案することができる.また,食品のデザインやパッケージングの分野でも,AIが創造的なアイデアを提供することが期待されている.さらに,生産プロセスの効率化や,マーケティング戦略の最適化にも生成AIの技術が活用されはじめている.
    本稿では,LVLMを用いて個人の嗜好を学習し評価する方法を提案する.従来の感性情報処理では,人間の感性を数値化することが研究の中心であったが,人の感性を数値で計測するのは非常に難しかった.LVLMが言語を使って好き嫌いとその理由を正確に説明できるようになれば,感性量を数値化するのではない,新たな評価が期待される.我々は,アンケートにより集めた食品画像と,その好みの理由をLVLMに学習させ,新たな入力に対し被験者と同様に回答できるLVLMを開発した.例えば,画像を提示したときに,どの部分が好きで,どの部分が嫌いかをLVLMが言語で表現することで,より深い理解が得られる可能性がある.このようなアプローチにより.生成AIは単に数値を返すのではなく,言語を通じて人間の感性に合わせた説明を行うことができる.本稿では,食品画像認識技術と生成AIの活用について述べ,食品産業への生成AIの可能性を紹介する.生成AIの最新動向を紹介し,生成AIがどのようにして食品業界に革新をもたらすかを考察する.これにより,より精度の高い嗜好評価が可能となり,食品開発やマーケティングにおいても大きな変革をもたらすことが期待される.