Entry

今日届いた本 - 『Algorithms for Image Processing and Computer Vision』

2009年07月27日

正直言うと洋書なんか読みたくないんだけれども,いろいろと行き詰っているところがあるので,仕方なく読むことにしました。ただ,さっきざっと読んだんですけれど,この本は超おすすめ。訳本出したら売れるんだろうな,きっと。

Algorithms for Image Processing and Computer Vision
J. R. Parker
Wiley
売り上げランキング: 5044

このサイトで画像処理関連の書籍を取り上げるたびに,あたしゃ困った困ったと言っているんですけれど,知人から「何に困っているのか分からない」とか言われて,そういえばそうだったか,と。別に隠すつもりでもなかったんですけどね。

あたしが今ぼちぼち取り組んでるのは,文書画像の構造解析です。OCR の前処理部分。入力された画像を適当な領域に分けて,各領域の意味付けと領域の相互関係を解析する処理(ライブラリ)を作っています。ちなみに,これは仕事じゃなくて趣味。1年くらい前までは,文書画像とは違う別の画像解析を仕事でやってたんですけどね。そのときのツテで知った OCR の詳細に興味がわいたので,そっち方面を自前で作っているのでした。

本書はいわば,OCR や写真加工といった,2次元画像処理を扱った本です。画像処理本は邦書にもたくさんあるんですけれど,どうも OCR 周りの論文を読んでいると,邦書で取り上げられているようなことをやっていない。いや,1980年代くらいの古い論文では,確かにやってるんですよ。近傍処理とか,画素追跡とか。文字認識にしても畳み込んで距離を測って……とかやってる。けど,今時の論文では,そんなことやってない。

今時は,文字認識にしても数理統計的な処理(例えばベイズ推論)を使うものが多いし,領域抽出にしてもチマチマと画素を追っかけるようなことはあまりなくて,ボロノイ図を作ってグラフ理論で解いたりしている。一方で,画素を追っかける方法ってのは,同じ「アルゴリズム」と呼ばれるものでも,数理的な裏づけのない「ノウハウ」の類だったりします。やってみたらうまくいった,みたいなアドホックなやり方。一見華々しい画像解析の領域も,失敗と成功を繰り返して,もっとも上手くいく閾値を見つけ出すような,根気の要る作業だったりするのでした。

で,そゆのはもうヤダと……。ちゃんと理論に裏付けられた方法を(まずは)知りたいと思ったのでした。

本書は,1997年初版なんですけれど,当時のアプローチとしては,かなり新しかったんじゃないかと思います。特に,あたしが本書で知りたかったのは,モルフォロジーを使った認識処理だったんですけれど,モルフォロジーを扱った邦書は,現在でもほとんどありません。洋書では,本書の他にもいくつか見つけたんですけどね。また,数少ない邦書も,どちらかというと理屈が先立つようで,実装に役立つ話がなさそうなのでやめました。

本書をお勧めする理由は,次の理由から。

  • 数理的なアプローチによる画像処理について,かなり易しいところから順を追って説明している。
  • 参考文献が豊富に紹介されている。
  • 実装例(C言語)が豊富。登載されているソースコードはもちろん,性能のいい FFT ルーチンも CD で提供されている(FFT の性能については未検証)。
  • フーリエ変換(FFT/DFT)の画像処理における応用例が多く紹介されており,その延長線上で Wavelet が議論されている。
  • OCR 関連で必要な文字分割,文字認識(印刷/手書き)における一般的な考え方が,1章を割いてかなり詳しく書かれている。
  • 数式だけでなく,処理結果や図表が比較的多く示されている。

米国の教科書に特有の特徴なのかもしれないけれども,実践と理論を上手く融合して纏め上げている点は,秀逸だと思います。理論を説明した後,すぐに実装例と結果を紹介している点は,頼もしい限り。

一方で,本書はいわゆるクックブックの類なので,基本的な画像処理技術については,ある程度踏まえている必要があります。本書から画像処理を始めるのは,ちと無謀。

この手の本は本当に邦書に少ないんですよね。英語読むの疲れるから,さっさと邦訳を出してもらえないだろうか(←身勝手な人)。

Trackback
Trackback URL:
Ads
About
Search This Site
Ads
Categories
Recent Entries
Log Archive
Syndicate This Site
Info.
クリエイティブ・コモンズ・ライセンス
Movable Type 3.36
Valid XHTML 1.1!
Valid CSS!
ブログタイムズ

© 2003-2012 AIAN