14:30 〜 14:50
[2D4-GS-2-04] SoC環境におけるGPUベース物体検出CNNの性能評価
キーワード:畳み込みニューラルネットワーク、システム・オン・チップ、グラフィックス プロセッシング ユニット
画像認識および物体検出に利用され、近年ではSystem on Chip(SoC)環境にも実装されているCNN(Convolutional Neural Network)は、Convolution層の演算量が多いため、SoC環境では性能が劣化する可能性がある。本研究では、Convolution演算のSoC内蔵GPU向け高速化検討として、Convolutionを行列積で解くアルゴリズムをOpenCLで実装して物体検出アルゴリズムYOLO-Nanoの処理時間をIntelおよびQualcommのSoC内蔵GPUで測定した。その結果、Tensorflow Lite CPUに対し、QualcommおよびIntelのCPUでは、それぞれ1.04倍、6.37倍の速度改善効果が得られ、GPUでは、それぞれ1.21倍、1.52倍の速度改善効果が得られた。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。