Entry

ちょっと気になる Curvelet 変換

2010年08月15日

"Text Extraction From Graphical Document Images Using Sparse Representation" という論文をつらつら読んでいたところ,文書画像にあるダイアグラムの文字要素と罫線要素をうまく分離していてスゲー!ちょっとやってみようと思ったんですけど,Curvelet 変換なるものが基盤の理論になっているようで,こいつがなかなか難しい。

日本語の資料がまだ少なくてあたしもさっき知ったばかりなんですけれど,Curvelet 変換というのは,Wavelet 変換と同じマルチスケールな変換のようです。フーリエ変換が,局所的な波を上手く検出できない不便があったのに対して,Wavelet 変換はマザーウェーブレットをスケーリング(拡大・伸縮)することで局所的な波の特性を得ることができたのでした。しかし,Wavelet 変換にも難儀なところがあって,波の方向に対しては柔軟な対応ができなかった。そもそも,画像に対する Wavelet 変換は,1次元の変換を縦横方向にかけたものなので,縦方向と横方向(それと両者の成分)で波を解析することになります。

一方,Curvelet 変換は,波の方向に対しても特性を評価することができる変換のようです。たしかに,冒頭の論文では,多方向に伸びる罫線要素を抽出することができている。すげーなー……よく考えるな。

高速変換もあるようで(FDCT),すぐに実用に使えそうな雰囲気も持っている(参照:Fast Discrete Curvelet Transforms [PDF])。要チェックや!

Trackback
Trackback URL:
Ads
About
Search This Site
Ads
Categories
Recent Entries
Log Archive
Syndicate This Site
Info.
クリエイティブ・コモンズ・ライセンス
Movable Type 3.36
Valid XHTML 1.1!
Valid CSS!
ブログタイムズ

© 2003-2012 AIAN