生成AI画像認識

VLMと画像処理を用いた建設業界におけるDX化

VLM(Vision-Language-Model)と画像処理を組み合わせた事例を紹介します。

お客様のニーズ

N社では、建設現場で管理者が目視で行っていた安全確認業務の負荷を軽減したいと思い、現場に設置したカメラによって安全確認業務ができることを求めていました。

KICONIA WORKSと取り組むことになった理由

スケジュールに制約がある中で、スピード感を持って開発が進められる会社をご検討されていたようです。複数社へ相談された上で、開発のスピードとヒアリング時の安心感からKICONIA WORKSとプロジェクトを進める決断をしていただきました。

プロジェクト成功の要因

カメラ画像から作業者が高所作業をしているかを認識しなければならず、距離の概念がない2Dカメラ映像からは高さをコンピュータに考えさせることは困難でした。そこで、深層学習による画像処理技術で作業者を認識したあと、その作業者が高所にいるかVLMと深層学習を組み合わせて判定させるようにモデルを開発しました。
また、運用上有効な性能がどれぐらいかをN社の担当者とも議論した上で、モデルを作り込むことができたことも成功要因の一つです。

お客様からの評価

現場で運用を始めたところ、安全確認業務の負荷軽減が実現でき、現場からもシステムに対してポジティブな声を得ることができたとのことです。高い成果を出せたことに大変満足していただきました。また、定例会議やチャットでの丁寧なやり取り、ともに泥臭く現場でのデータ収集を行ったことも評価いただきました。

プロジェクトチームからのメッセージ

  • 雪江(エンジニア)
    高所判定という抽象度の高い検出作業にVLMを絡めて取り組めたことは、難易度が高く面白かったです。データの収集とアノテーションの設計、ツール開発に加え、実際にモデルを動かし、それに対しての施工管理者のフィードバックを得るというところまで一気通貫で経験ができたのが有意義でした。
  • 北村(プロジェクトマネージャー)
    お客様と一緒に現場で実際に学習用データを撮影したり、ミーティングやチャット等で密にコミュニケーションをとっていたりしたことで、柔軟に進めることができました。プロジェクトの終盤から現場での運用が始まっていて、現場の方からも好評の声をいただいているようで、とても嬉しく思います。

PROJECT TEAM

下地

機械学習エンジニア

雪江 亮太

東京大学大学院卒業後、大手自動車部品メーカーにてサービス開発に従事。現在は機械学習を中心に様々なモデルの開発やアプリケーション開発の開発に取り組んでいる。

下地

プロジェクトマネージャー

北村早紀

慶應義塾大学法学部卒業後、製造業での生産改善、予防医療ベンチャーでの事業開発などに従事。現在はAI開発のPMを中心に、広報・採用人事なども担当。