2019年度 人工知能学会全国大会(第33回)

講演情報

一般セッション

一般セッション » [GS] J-3 データマイニング

[4B2-J-3] データマイニング: 構造とクラスタ

2019年6月7日(金) 12:00 〜 13:20 B会場 (2F メインホールB)

座長:真矢 滋(東芝) 評者:宮口 航平(日本IBM)

12:00 〜 12:20

[4B2-J-3-01] 頻出部分グラフに基づくレシピフローグラフの分散表現の獲得

〇二宮 あかり1、尾崎 知伸1 (1. 日本大学)

キーワード:分散表現、レシピ、グラフ

料理レシピ投稿型サイトであるクックパッドは,レシピの投稿が容易な点,自身のホームページを開設可能な点等の特徴から多数のユーザによって利用されている.類似レシピの検索や代替食材の提案など,ますます高度になる利用者の要求に精度良く応えるためには,蓄積された各レシピの特徴を抽出するとともに,大規模かつ多様なレシピデータ全体を分類・構造化することが必要となる.本稿では,レシピフローグラフに対する分散表現を獲得し,各レシピを実数ベクトル空間へと写像することが,より詳細な手順に着目したレシピデータの分類・構造化に繋がると考える.一般的なグラフデータの分散表現獲得に関しては種々の手法が提案されているが,料理においては手順の断片が重要であると仮定し,主要な手順の選択とそれらを通じたベクトル化を提案する.提案する枠組みを評価するために,クックパッドデータセットを対象に,レシピフローグラフおよび調理手順文書それぞれの分散表現を獲得し,比較実験を行った.その結果,提案手法はレシピ間の違いをうまくとらえることができ,分類問題に適していることを確認した.