主専攻実験

令和2年度 知能情報メディア実験

T-9  ヒューマンセンシング

実験概要

本実験の目的は,顔,手形状,顔向き,ゼスチャー,動作などの人の動きを認識するアルゴリズム・システムの試作を通して,画像認識の基本原理を数理レベルから深く理解することにあります.同春学期に開講する画像認識工学と併せて受講すると,講義で紹介する画像認識における高次元ベクトル空間の基本数理や識別理論に対する理解が,本実験で扱う具体的な課題を通して,より深まることが期待されます.

本実験で使うRealSenseセンサーとは?

インテル社によって開発されたRealSense Depth Camera D415はステレオカメラの1種であり,2つのカメラの撮像結果の差分に基づいて深度結果を推定する深度センサとなっています.長さ99mmというコンパクトさとUSB給電による動作でありながら高い撮像結果の精密さとリアルタイム処理可能な深度推定速度を有しています.

Matlabについて

Matlabは,Mathworks社が開発している数値解析ソフトウェアの名称であり,インタプリタ形式のプログラミング言語の一種です.Matlabの特徴としては,数値線形代数の処理性能,関数とデータの可視化,ユーザーフレンドリなGUI,多様な他言語とのインターフェースが充実していることが挙げられます.さらに,Toolboxが豊富に用意されているので,プログラミングでの実装にあまり精通していない方でも高度な数値解析を実現できます.

進め方の基本方針:


ヒューマンセンシングの流れ

手形状を用いたじゃんけんシステムの例で基本的な流れを概説します.

*学習フェース

手形状クラス(グー,チョキ,パー)毎に以下の処理を行う.

(1)RealSenseを用いて距離画像を手の形状を変化させながら複数枚入力する.

(2)距離情報を用いて,各距離画像からそれぞれの手領域を抽出する.

(3)各距離画像から識別に有効な特徴を抽出する.

(4)複数枚の距離画像から抽出された特徴セットから主成分分析を用いて辞書を作成する.

*識別フェーズ

(1)識別したい手形状の距離画像を入力する.

(2)距離情報を用いて,手領域を抽出する.

(3)手領域の距離画像から特徴(学習フェーズと同じ)を抽出する.

(4)(3)で抽出された特徴を予め用意されている各手形状クラスの辞書特徴を比較し,類似度を求める.

(5)全クラスの中で最大類似度を有する形状クラスを該当するクラスとする.

(6)識別結果を用いてコンピュータが出したCG手と比較し,勝ち負けを判定する.

レポート

以下の項目を含んだレポートを提出してもらいます.

 お知らせ 

実験スケジュール 


課題・資料 


参考サイトなど 

TA 

高松哲哉 (コンピュータサイエンス専攻 博士前期課程2年)

tetsuya_takamatsu AT cvlab.cs.tsukuba.ac.jp

Hao Guoqing (コンピュータサイエンス専攻 博士前期課程2年)

hao_guoqing AT cvlab.cs.tsukuba.ac.jp