tesseract-ocr の言語データ(jpn.traineddata)について(その1)

ブログのテーマを変えました。以前のテーマだと表が見づらかったので。 引き続きフリーのOCRエンジン、tesseact-ocr について。プログラミングがらみの記事です。かなりグダグダです。 アルゴリズムはさっぱりわからないので、言語データ(辞書データ)の方を調べてみる。 具体的には、GitHubで公開されている、langdata配…