今日も微速転進

ここではないどこかへ

情景文字認識(Scene Text Detection)関連のメモ


スポンサーリンク

ただのメモ書きです。研究がしたいわけではないです。

適当に見つけたというか、観測範囲で遭遇したもの。全然網羅できていないです。

ERFilter以外にもいろいろありますねってことで。

お手軽に使えて決定打という感じのがあるといいのに。

情景文字認識とは

英語だとScene Text Detector。交通標識とか看板とか、日常生活で目にする風景にある文字の検出、認識。

号数忘れたけどWeb+DBのバックナンバーにも解説記事。

EAST: An Efficient and Accurate Scene Text Detector

以下、参考になりそうな利用例。

www.pyimagesearch.com

SWT

Microsoftの研究所の開発したアルゴリズムPython用のライブラリもある。

特許とかそのへんは不明。

ERFilter

もともとは画像の回転検出用?

パラメーターの調整方法がよくわからないので試してない。

ドキュメント:Scene Text Detection — OpenCV 3.0.0-dev documentation

contlibのモジュールだったはず。

データセット

自由には使え無いと考えたほうが良さそう。

ICDARに関しては過去のイベントのページにもデータセットがある(20132011*1

検索するとOPU-JST-1というのがヒットするけど入手方法は不明*2

そのほかリンク集

そのほか

良さそうなページを見つけたら追加します。

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

画像認識 (機械学習プロフェッショナルシリーズ)

画像認識 (機械学習プロフェッショナルシリーズ)

*1:登録が必要っぽい

*2:さすが日本って感じですね

広告