Entry

パタン認識の手法とかいろいろ

2009年01月29日

iPhoto はネコやイヌの顔も認識できるよ,という話なんですけど,パタン認識の話をちょっとかじると,そりゃ認識できるわな,とかいった感想しかなくて,なんともゴニョゴニョ。引用してるくせにそれだけの感想。

A huge disappointment for pet owners, was word that iPhoto's newest feature, Faces, wouldn't recognize animals according to Apple employees on the show floor. We even did a few tests at Macworld Expo with images they had of the dog Luce.

iPhoto's Faces Recognizes Cats | Mac|Life

最近は,OpenCV のような画像認識周りの便利ライブラリが整っているので,パタン認識をプログラミングで扱うこと自体は,それほど難しいことじゃなかったりします。ただ一方で,パタン認識の手法は,かなり広範にわたっていて,平均的なライブラリの方法論を超える応用的な手法が多かったりもします。ここしばらく,あたしゃこの領域に首を突っ込んでるんですけど,まあいろいろなアイデアがあるもんだと思います。

ざっくりと分類すると,こんな感じになるんだろうか。

  • 特徴点抽出系 - 目や鼻の位置に応じた濃度差を特徴点として登録し入力画像中を探索する。
  • 幾何学変換系 - Hough 変換のような幾何学変換を利用して,どのパタンによく似ているか,投票で検出する(円や直線のような幾何図形で利用)。
  • 機械学習系 - ベイズ推論を基礎にしたニューラルネットワーク等々を利用して,統計的に認識パタンを学習/検出する。
  • 畳み込み演算系 - 畳み込み演算で生成する相互相関関数(似ているほど絶対値が高くなる関数)を利用して,パタンと似ている値を持っている箇所を探索する。

あたしゃ主にフーリエ変換を使ってゴニョゴニョやってるんですけど,これは畳み込み演算系に分類されます(勝手に分類したんだけど)。OpenCV を使っても簡単にできる手法としては,指紋認証でも使われている位相限定相関法(POC)っつのがある。この手法は本当にすごいです。POC の演算後,IDFT(フーリエ逆変換)することで,パタンとマッチした座標や類似度を定量的に検出することができる。あたしゃ,フーリエ変換のルーチンから,自前でコーディングしたんですけど,ほんとにできるとは思いませんでした。もちろん,自前のルーチンですから,ものすごく遅いんですけど。

あと,ここで「探索する」とか一言で書いてるんですけれど,時間領域で探索する場合,採用する手法によって性能にかなりの差が出てきます。あたしゃ GA(Genetic Algorithm; 遺伝的アルゴリズム)なんかを試してみたんだけれど,これも遺伝子の作り方や戦略の選択方法によって,かなりの性能差が出てくる。また,小さな探索空間を小さなパターンで探すのならともかく,規模が大きくなると,ほとんど実用になりません。なかなかうまくは行かないもんです。ハイ。

一方,OpenCV で扱うパタン認識では,おそらくベイズ推論系の手法を使うのが一般的なんじゃないかと思います。ニューラルネットワークとか,サポートベクターマシンとかを使うアレ。指紋のような固定されたパタンではなくて,表情や方向が変わる顔認識なんかでは,おそらくこの方法がもっとも有利なんじゃないかと思います。効率よく学習させれば,笑ってようと泣いてようと,ネコだろうとイヌだろうと,認識することができます。

んなもんで,ちょっとベイズ推論についてもゴニョゴニョやってるんですけれど,こっちはすこぶる難しい。今……というか,かなり前から『パターン認識と機械学習』を読んで,設計っぽいこともしてるんですけれど,理屈はわかるものの,なかなか実装にまで応用することができません。

パターン認識と機械学習 上 - ベイズ理論による統計的予測
C. M. ビショップ
シュプリンガー・ジャパン株式会社
売り上げランキング: 23966
おすすめ度の平均: 5.0
5 機械学習の新・定番教科書,待望の邦訳!

多分,こゆのはモデルを決めてエイヤっとやるようなもんなんだとは思います。認識率が悪かったら,もう一度工夫してやり直す,みたいな。コツコツやるってのもまた努力なわけだけれども,やり直しになったときの「もうやだ……orz」感は,なんとも言えなかったりもする(←飽きっぽい)。

Trackback
Trackback URL:
Ads
About
Search This Site
Ads
Categories
Recent Entries
Log Archive
Syndicate This Site
Info.
クリエイティブ・コモンズ・ライセンス
Movable Type 3.36
Valid XHTML 1.1!
Valid CSS!
ブログタイムズ

© 2003-2012 AIAN