Tesseract
前回に引き続き、オープンソースのOCRエンジンTesseractの開発状況ウォッチング、です。 a244.hateblo.jp 2018年10月の状況 4.0系使用時の注意点 未解決のバグで影響の大きそうなもの #1015 認識結果に関するIssue グレースケール v.s. 二値化画像 PNG形式の…
オープンソースのOCRエンジン(正確に言うとOCR用のライブラリ)、Tesseract OCRの開発状況ウォッチング、です。 しばらくメーリングリスト、GitHubのリポジトリからの通知をチェックできていなかった時期があるので見落としがあるかも。 2017年秋ごろに下書…
過去記事の続き。やはり実際のデータでデータ処理をやるのは勉強になります。 ……お金になるかは別にして、Pythonという言語の習熟度は向上しているはず。 a244.hateblo.jp 方針 OCR処理 画像の抽出 画像をPDFに変換・結合 一括OCR JSON分割 タブ区切りテキス…
自分でモロに忘れそうなので備忘録として。 作戦というか方針 データの入手 目次のOCR処理 目次ファイル 画像の切り出し Tesseract 4.x 目次のOCR 認識結果の例 OCR結果のテキストファイルの結合 まとめ 一時ファイルがじわじわと増殖するのでもっとスマート…
2月16日付でオープンソースのOCRエンジンである Tesseract OCR の3.05がリリースされています。 2月中に記事にしようと思いつつ結局3月になってしまいました。 github.com Ubuntu 17.04 の Feature Freeze に間に合わせたいという要望が出た結果、唐突にリリ…
前回に引き続き、開発版のTesseract 4.0alpha ネタです。大した内容はありません。 a244.hateblo.jp やったこと 前回の続きとして、新しいjpn.trainneddataファイルをバラして内容を確認してみます。 ファイルが混ざると面倒なので作業ディレクトリを2つ作り…
この記事は開発中のアルファ版を対象にしてます。その点には十分注意してください。要するに自己責任でどうぞって話です*1。 github.com 微妙に出遅れている感じがありますが……。 11月中旬ごろからメイン開発者のRay Smith氏によるバージョン 4.x のコードが…
TesseractというのはGoogleが開発を支援しているオープンソースのOCRエンジンです。 Tesseract本体のインストールについては公式のWikiを参照。もしくはググって下さい。 github.com TesseractのC/C++APIを使用するタイプと、tesseractコマンドを呼び出すタ…
メモっとかないと間違いなく忘れそうなので大したネタでもないけど。 iOSでカメラから取り込んだ画像は撮影時の本体の向きが考慮された状態になっていない(メタデータとして向きの情報が記録されている)。 つまり、 iOSで読み込んだ画像をそのままOCRエン…
タイトルの通りOCRアプリをリリースしました。iPhone 5s以降がターゲットで、日本語と英語をサポート。 OCRエンジンの調整とか含めて去年の11月末ぐらいからダラダラと。〆切が無いというのは恐ろしいですね。 なぜ今更OCRアプリか? 有り体に言えば「そこに…
過去記事のXcode 7対応版です。 ※実機で動かす場合の注意を末尾に追加。 a244.hateblo.jp cocoapods で環境構築。前提はXcode 7.0.1、Swift 2。 新規プロジェクトを作ることを前提にします。 Podfile の作成 注意点としては、 確実にXcodeを終了しておく デ…
今日もtesseract-ocrネタです。当面はブログのネタに困らないように思われます。 [2015/08/28 追記] tesseract-ocr のRuby 用のラッパー(ruby-tesseract-ocr)はまだ3.04に対応していないようです。 Ruby経由でtesseract-ocrを使用している場合は、アップグ…
[2015/08/25 20:37] タイトルを修正しました。 懲りずにtesseractネタです。まだまだ続きます。 今回はiOSアプリでtesseract-ocr を使うためのラッパーライブラリ、Tesseract-OCR-iOSについて。 github.com 導入(for Swift) GitHubにあるテンプレートプロ…
ブログのテーマを変えました。以前のテーマだと表が見づらかったので。 引き続きフリーのOCRエンジン、tesseact-ocr について。プログラミングがらみの記事です。かなりグダグダです。 アルゴリズムはさっぱりわからないので、言語データ(辞書データ)の方…
久しぶりに技術系の話題を。 オープンソースのOCRエンジン、Tesseract-OCRの新バージョンがリリースされているので試してみました。 比較対象は3.02.02。既存環境を破壊したくないので、対照実験になっていませんが勘弁してやってください。 開発元のwebサイ…