生成AI

VLMによる店舗内顧客の動線トラッキング及び属性判定

VLM(Vision-Language Model)を用いて、空間内への人の出入りと属性判定を実現した事例を紹介します。

お客様の課題

N社は、店舗内の特定エリアにおいて「どのような属性の顧客が、どの時間帯に、どこから入り、どこへ抜けていったのか」を正確に把握したいと考えていました。しかし、従来の画像認識手法では、複雑な動線の追跡や、細かな属性(年代・性別など)の正確な判定に限界を感じておられました。

KICONIA WORKSと取り組むことになった理由

N社でも内製化による開発を進められていたものの、性能や学習コストの面で実用化には至りませんでした。そこで、KICONIA WORKSへ問い合わせをいただきプロジェクトが始まりました。

プロジェクト成功の要因

N社が検証された既存のプロセスを丁寧にヒアリングしたところ、特殊な画角で撮影された動画が入力データになっており、既存の人物検出やトラッキングモデルの活用が難しく、学習データの収集も困難であることがわかりました。
そこで、あらかじめ高度な視覚・言語理解を持つ最新の生成AI(VLM)活用を提案しました。動画のままではコストが合わないこともあり、ニーズや目標性能を満たすことができるように動画から必要な静止画のみを切り取るロジックを構築し、活用画像を絞ることで、高性能なVLMモデルを採用しながらも、商用利用に耐えうるコストへの抑制に成功しています。
また、生成AIや画像処理プログラム等の処理フローをブラックボックスにせず、N社の担当者と一つずつ確認しながら進めたことで、高い納得感と信頼関係を築けたことも大きな成功要因です。

お客様からの評価

「プロジェクト開始から終了まで、期待値が右肩上がりに高まり、最終的に期待以上の成果を得られた」と大変高い評価をいただきました。また、開発プロセスをすべてオープンにして伴走したことで、成果物への納得感だけでなく、最先端AIの活用ノウハウという面でも多くの学びが得られたと喜んでいただいております。

プロジェクトチームからのメッセージ

  • 清家(エンジニア)
    開発に着手する前の設計が大事であると改めて実感しました。
    また、少し前のVLMではこの開発で与えたタスクの成功率は本プロジェクトほど高くなかったので、モデルの進化を感じました。
  • 書上(プロジェクトマネージャー)
    元々お客様の方で進めていただいていた手法をそのまま活用し、そこに弊社のエッセンスを加えていくことも検討していましたが、あえてゼロベースで考えた時に最新の生成AIの活用によって劇的に性能を向上しコストを抑える可能性を見出し、お客様にもご納得いただいた上で進めていき、良い成果を出すことができました。

PROJECT TEAM

下地

機械学習エンジニア

清家 大雅

奈良先端科学技術大学院卒業後、メンタルヘルス系企業にて自社サービス開発やAI関連業務に従事。現在は画像処理・画像認識を中心に、LLM+RAG構築案件にも携わる。

下地

コンサルタント/プロジェクトマネージャー

書上 拓郎

慶應義塾大学商学部卒業後、大手企業・コンサルなどを経て、AI開発ベンチャーに参画。様々な業界で開発経験を経て、当社を会社設立。年間30以上のAIやシステム開発案件に携わっている。