Tesseract 近況その2 （2018/10 Early）

前回に引き続き、オープンソースのOCRエンジンTesseractの開発状況ウォッチング、です。 a244.hateblo.jp 2018年10月の状況 4.0系使用時の注意点未解決のバグで影響の大きそうなもの #1015 認識結果に関するIssue グレースケール v.s. 二値化画像 PNG形式の…

2018-09-30

情景文字認識（Scene Text Detection）関連のメモ

OCR 文字認識情景文字認識

ただのメモ書きです。研究がしたいわけではないです。適当に見つけたというか、観測範囲で遭遇したもの。全然網羅できていないです。 ERFilter以外にもいろいろありますねってことで。お手軽に使えて決定打という感じのがあるといいのに。情景文字認識と…

2018-09-18

KDPで電子書籍を出版しました

電子書籍の制作 KDP 本を書きました OCR Python Google Cloud Vision API

電子書籍をリリースしました。PythonからGoogle Cloud Vision APIを使って文字認識（OCR）する方法の解説書です。 Google Cloud Vision APIとPythonで文字認識作者: machine powers発売日: 2018/09/14メディア: Kindle版この商品を含むブログを見るまた黒歴…

2018-08-09

Google Vision API の手書き文字認識（英語）を試す

OCR Google Cloud Vision API Python 手書き文字認識

経緯どこかのニュースサイト（英語）でGoogle Nextで発表された新機能として"hand wrtten"（手書き）という文字があったのでググってみたところ、 Google Vision APIのドキュメント（英語の方）にさり気なく"Detecting Handwriting"という記述を発見。下記…

2018-06-23

財務省の公開した交渉記録PDFをいじるその3（本件終了）

OCR Python 時事ネタ関連 Hexo 行政関係財務省交渉記録

一応切りの良いところまで作業したのでここで終了。プログラムは汚いので載せてないです。フォーマットが微妙に違うなどの数々のトラップによりかなりの部分を手作業で治すハメに。自分で作ったページ範囲データの不備のせいでさらに無駄な苦労があったり…

2018-06-20

Tesseract OCR 近況（2018/06）

OCR Tesseract

オープンソースのOCRエンジン（正確に言うとOCR用のライブラリ）、Tesseract OCRの開発状況ウォッチング、です。しばらくメーリングリスト、GitHubのリポジトリからの通知をチェックできていなかった時期があるので見落としがあるかも。 2017年秋ごろに下書…

2018-06-04

財務省の公開した交渉記録PDFをいじるその2（本文データのOCR etc.）

時事ネタ関連 PDF OCR ImageMagick Tesseract 財務省交渉記録行政関係

過去記事の続き。やはり実際のデータでデータ処理をやるのは勉強になります。 ……お金になるかは別にして、Pythonという言語の習熟度は向上しているはず。 a244.hateblo.jp 方針 OCR処理画像の抽出画像をPDFに変換・結合一括OCR JSON分割タブ区切りテキス…

2018-06-03

財務省の公開した交渉記録PDFをいじるその1（目次のPDF編）

時事ネタ関連 PDF OCR ImageMagick Tesseract 財務省交渉記録行政関係

自分でモロに忘れそうなので備忘録として。作戦というか方針データの入手目次のOCR処理目次ファイル画像の切り出し Tesseract 4.x 目次のOCR 認識結果の例 OCR結果のテキストファイルの結合まとめ一時ファイルがじわじわと増殖するのでもっとスマート…

2018-06-02

Google Cloud Vision APIで画像メインのPDFから直接OCRする（PDF/TIFF Document Text Detection）

OCR Google Cloud Vision API PDF

この記事で紹介しているAPIは今のところベータ版です。正式リリースまでに仕様が変化する可能性があります。 [2018/09/04 追記] ドキュメントの翻訳はまだのようですが2018年7月24日付でGAリリースになっています。 PDF、TIFFともに2000ページまで。 PDF/TIF…

2018-05-27

日本語OCRのためのJIS漢字などに関するメモ書き（随時更新）

OCR JIS漢字日本語関連随時更新

ちょっと中途半端な感じがするけどせっかくなので。 JIS漢字というか主に第三水準、第四水準の漢字についてのメモ。第二水準漢字ですら、そもそもどういう文脈でどういう語に使われるのか、さっぱり分からない字が多い。前置き漢字のリスト MJ漢字参考に…

2018-04-22

陸自のイラク日報をOCRしてJSON化する（暫定版／Google Cloud Vision API）

Python Google Cloud Vision API OCR 時事ネタ関連

すでに検索サイトも作った方がいますし、ブログ記事化した方もいますが、マイペースでいきましょう。スクライド風にに言うと「俺がスロウリィ!?」ですが気分が乗らなかったのはしょうがない。スクライド 5.1ch DVD-BOX (期間限定生産)出版社/メーカー: バ…

2017-12-31

Google Vision API のOCR機能が強化されている

OCR API GCP Google Cloud Vision API

ずいぶん前に一度試してから放置した。5月時点で正式提供版になり、以前試したときから地味に進化している。 a244.hateblo.jp ざっくりいうと、OCR向けのタイプが一つ増えているのと、返却されるJSONにキーが新たに追加されている。光学式文字認識（OCR） |…

2017-06-08

「英単語Clip』というアプリをリリースしました

OCR iOS アプリ関連自作アプリ

タイトルのとおり、です。英単語ClipAtsuyoshi SUZUKI仕事効率化無料一言で言うと（英和・英英）辞書を引くのがめんどくさいを解決するアプリ。当面の間、名称は英単語Clipですが、そのうちしれっと名称変更すると思います。海外向けの名称がWordPressの…

2017-03-20

なんとなく ABBYY Cloud OCR SDK を試してみた

API OCR

ABBYY Cloud OCR SDK、日本語の情報が全然ないみたいなのでちょっと試してみる。ぶっちゃけると認識率云々よりも料金体系的にあまり使い勝手がよろしくない。概要などモバイル向けの別の選択肢開発者向けの評価プログラム（free trial）とりあえず登録 …

2017-03-17

Microsoft Cognitive ServicesのOCR API を試す（Computer Vision API）その1

API OCR Microsoft Cognitive

世間は機械学習やら動画解析APIで盛り上がっているような感じですが、いつも通り周回遅れで。去年から試そうと思いながらアカウントが作れず*1に放置状態だった。今更だけどネタにしてみる。 azure.microsoft.com 以前英語のページから登録しようとした時は…

2017-03-12

SwiftOCRというOCRライブラリを試してみた

Mac OCR Swift iOS

某所で紹介されていたSwiftOCRというライブラリ付属のサンプルを試してみたので一応？ Tesseract より高速、省メモリらしい。一応昨年末の時点でSwift 3にも対応している。一行のテキスト、それもシリアルナンバーのようなランダム英数字に向いているとのこ…

2017-03-08

Tesseract OCR 3.05 のインストールと新機能

Mac OCR Tesseract Arch Linux Ubuntu

2月16日付でオープンソースのOCRエンジンである Tesseract OCR の3.05がリリースされています。 2月中に記事にしようと思いつつ結局3月になってしまいました。 github.com Ubuntu 17.04 の Feature Freeze に間に合わせたいという要望が出た結果、唐突にリリ…

2016-12-02

開発版のTesseract 4.0 alpha をためしてみるその2

OCR Tesseract

前回に引き続き、開発版のTesseract 4.0alpha ネタです。大した内容はありません。 a244.hateblo.jp やったこと前回の続きとして、新しいjpn.trainneddataファイルをバラして内容を確認してみます。ファイルが混ざると面倒なので作業ディレクトリを2つ作り…

2016-12-01

開発版のTesseract 4.0 alphaをためしてみる（macOS）

OCR Tesseract

この記事は開発中のアルファ版を対象にしてます。その点には十分注意してください。要するに自己責任でどうぞって話です*1。 github.com 微妙に出遅れている感じがありますが……。 11月中旬ごろからメイン開発者のRay Smith氏によるバージョン 4.x のコードが…

2016-09-10

今更だけどGoogle Cloud Vision APIでOCR （その2）

OCR GCP Ruby IT プログラミング Google Cloud Vision API

[2018/08/14 注意] この記事の内容は古くなっています。現時点で同じ画像で試すと認識結果が変化します。特にTEXT_DETECTIONの替わりに DOCUMENT_TEXT_DETECTIONを指定すると結果に変化があります。黒背景でも文字を適切に認識するようです。 [追記ここまで…

2016-09-01

今更だけどGoogle Cloud Vision APIでOCR その1

OCR GCP Ruby IT プログラミング

今更だけどGoogle Cloud Vision API。そのうち試そうと思っているうちにGCPの仕様期間3ヶ月があっさりと終了……。毎月最初の1000リクエストはコストゼロだそうなので試してみます。 Google Cloud Platform Japan 公式ブログ: ついに Google Cloud Vision API…

2016-07-04

Tesseractの各言語のラッパーいろいろ（随時更新）

OCR Tesseract プログラミング

TesseractというのはGoogleが開発を支援しているオープンソースのOCRエンジンです。 Tesseract本体のインストールについては公式のWikiを参照。もしくはググって下さい。 github.com TesseractのC/C++APIを使用するタイプと、tesseractコマンドを呼び出すタ…

2016-04-15

Tesseract-OCR-iOSと二値化処理の切り替え

Internet OCR iOS Swift

久しぶりにOCR関連。前置き二値化処理 (image thresholding)というのは、各色ごとに（8ビットなど）の階調で表現された画像データを、あるしきい値（閾値）を基準に0と1の二値で表現できるデータに変換すること。このあるしきい値でという部分がポイント…

2016-03-26

OCRアプリ handyOCR ver 1.1 をリリースしました。

iOS OCR Swift

（前略）、というわけで、OCRアプリ handyOCR ver 1.1 をリリースしました。 geo.itunes.apple.com 基本的にバグ修正リリースです。特定の画像でOCR処理が空振りするケースがありました。そこで対策として画像の二値化処理アルゴリズムを切り替えられるよう…

2016-03-14

OCRと画像の回転

iOS Tesseract OCR

メモっとかないと間違いなく忘れそうなので大したネタでもないけど。 iOSでカメラから取り込んだ画像は撮影時の本体の向きが考慮された状態になっていない（メタデータとして向きの情報が記録されている）。つまり、 iOSで読み込んだ画像をそのままOCRエン…

2016-03-12

OCRアプリをリリースしました。

つくったもの OCR Tesseract iOS アプリ関連

タイトルの通りOCRアプリをリリースしました。iPhone 5s以降がターゲットで、日本語と英語をサポート。 OCRエンジンの調整とか含めて去年の11月末ぐらいからダラダラと。〆切が無いというのは恐ろしいですね。なぜ今更OCRアプリか？有り体に言えば「そこに…

2015-10-15

Xcode 7.0 + Swift2 でTesseract-OCR-iOSを使う（追記あり）

Tesseract OCR Swift iOS Xcode

過去記事のXcode 7対応版です。 ※実機で動かす場合の注意を末尾に追加。 a244.hateblo.jp cocoapods で環境構築。前提はXcode 7.0.1、Swift 2。新規プロジェクトを作ることを前提にします。 Podfile の作成注意点としては、確実にXcodeを終了しておくデ…

2015-08-26

tesseract-ocr 3.04のインストール（macOS/OSX）※追記あり

Mac OCR Tesseract

今日もtesseract-ocrネタです。当面はブログのネタに困らないように思われます。 [2015/08/28 追記] tesseract-ocr のRuby 用のラッパー（ruby-tesseract-ocr）はまだ3.04に対応していないようです。 Ruby経由でtesseract-ocrを使用している場合は、アップグ…

2015-08-25

Tesseract-OCR-iOSと言語データ（jpn.traineddata）

Mac OCR Tesseract Swift

[2015/08/25 20:37] タイトルを修正しました。懲りずにtesseractネタです。まだまだ続きます。今回はiOSアプリでtesseract-ocr を使うためのラッパーライブラリ、Tesseract-OCR-iOSについて。 github.com 導入（for Swift） GitHubにあるテンプレートプロ…

2015-08-24

tesseract-ocr の言語データ(jpn.traineddata)について（その1）

OCR Tesseract

ブログのテーマを変えました。以前のテーマだと表が見づらかったので。引き続きフリーのOCRエンジン、tesseact-ocr について。プログラミングがらみの記事です。かなりグダグダです。アルゴリズムはさっぱりわからないので、言語データ（辞書データ）の方…

今日も微速転進

ここではないどこかへ

OCR

Tesseract 近況その2 （2018/10 Early）

情景文字認識（Scene Text Detection）関連のメモ

KDPで電子書籍を出版しました

Google Vision API の手書き文字認識（英語）を試す

財務省の公開した交渉記録PDFをいじるその3（本件終了）

Tesseract OCR 近況（2018/06）

財務省の公開した交渉記録PDFをいじるその2（本文データのOCR etc.）

財務省の公開した交渉記録PDFをいじるその1（目次のPDF編）

Google Cloud Vision APIで画像メインのPDFから直接OCRする（PDF/TIFF Document Text Detection）

日本語OCRのためのJIS漢字などに関するメモ書き（随時更新）

陸自のイラク日報をOCRしてJSON化する（暫定版／Google Cloud Vision API）

Google Vision API のOCR機能が強化されている

「英単語Clip』というアプリをリリースしました

なんとなく ABBYY Cloud OCR SDK を試してみた

Microsoft Cognitive ServicesのOCR API を試す（Computer Vision API）その1

SwiftOCRというOCRライブラリを試してみた

Tesseract OCR 3.05 のインストールと新機能

開発版のTesseract 4.0 alpha をためしてみるその2

開発版のTesseract 4.0 alphaをためしてみる（macOS）

今更だけどGoogle Cloud Vision APIでOCR （その2）

今更だけどGoogle Cloud Vision APIでOCR その1

Tesseractの各言語のラッパーいろいろ（随時更新）

Tesseract-OCR-iOSと二値化処理の切り替え

OCRアプリ handyOCR ver 1.1 をリリースしました。

OCRと画像の回転

OCRアプリをリリースしました。

Xcode 7.0 + Swift2 でTesseract-OCR-iOSを使う（追記あり）

tesseract-ocr 3.04のインストール（macOS/OSX）※追記あり

Tesseract-OCR-iOSと言語データ（jpn.traineddata）

tesseract-ocr の言語データ(jpn.traineddata)について（その1）