2016-09-24

Namecheapへのドメイン移管

IT Internet ネットワーク管理

更新期間はまだ先ですが、さくらインターネットからNamecheapに趣味で運用中のドメインを移管しました。

Namecheapのサービス概要はこちらが詳しいです。

さくらインターネットのサービスに不満があったわけではなくて、なんか面白味にかけるのと、UIがイマイチなので。時間のあるうちにやっておこうというのと、DNSSECなどいろいろ試して見たいので。

GoDaddyも候補の一つでしたが、Whoisの情報公開代行費用が高いので却下。

参考：DNSSEC対応の独自ドメインを年額$0.88で運用できるよという話 - hnwの日記

手順

まずはさくらインターネット側の転出手順に書いてある内容を確認。

f:id:atuyosi:20160924033742p:plain

スクリーンショットを取り損ねたので概要のみ。

https://www.namecheap.com のページの検索ボックスの左にある半透明の"Transfer"ボタンをクリックすると検索ボックスのボタンが切り替わる
移管したいドメインを入力して検索ボックス横の"Transfer"をクリックする
ドメインがロックされていなければ、詳細情報の入力ページに遷移する。この時点でオースコードを要求されるので、移管元（今回はさくらインターネット）の方で手続きする
移管元で転出手続きをすると、ドメイン管理者として設定してあるメールアドレスにオースコードの記載されたメールが届く（2営業日待たされた）
Namecheap 側に戻って、オースコードを入力、付加サービスを確認して支払い手続きへ
支払い手続きを完了させると（今回はPayPal）、通知のメールが送信される
Namecheap から ”Domain Transfer Request for XXX” というタイトルのメールが来るのでメール内のリンクをクリックして承認手続きへ（XXXは移管しようとしているドメイン名）
完了通知が来るのを待つ（5営業日以内と書いてありましたが、ざっくり30時間後ぐらいに完了通知のメールが届きました）
Namecheap のダッシュボードにログインしてDNSサーバーの設定を変更（移管直後は移管元の設定のままになっている）

返金ポリシーによると期間内（5営業日）にドメイン移管が完了しなかった（失敗した）場合は返金されるとのことです。

Namecheap のDNSを使うのもアリですが、今回はCloudFlareのDNSサーバーにしてみました。今更CloudFlareって感じですが、なんとなく使って見たかったので……。

CloudFlareはいわゆるCDNサービスで、フリーミアムモデルで運営されています。つまり、基本機能は無料で使えます。

SSLについても面倒を見てくれるようですが、ホスト名なしのアクセスと、"www.ドメイン名"について有効化する必要があるようなので一旦OFFにしています。

費用など

ドメイン移行費用： $11.88
ICANN 手数料 $0.18

合計$12.06でした。日本円としてはPayPal経由で支払ったので1,273円でした。素直にPayPalのレートで換算しているので、円相場そのままではないです。

多分、1ドル101.50円ぐらいのレートに手数料4%。PayPal側で変換せずにドルでカード会社側に請求させれば3%ですが、為替レートの確定タイミング次第で割高になりかねないので妥協しました。差額は数十円のレベルなので。

公式ページは少々わかりにくいですが、スクロールしていくと、”Why use Namecheap?”という文章の下、中央に"Price"というタブがあるのでそこをクリック。価格表の左側の"Register"という箇所をクリックすると表が折りたたまれる。更新なら"Renew"、移管の場合は"Transfer"というセルをクリックすると、表が展開されれ、それぞれの費用が確認できます。

注意点

日本のドメイン登録業者だとWhois 情報公開代行は無料オプションの場合が一般的ですが、Namecheapの場合は1年目無料で2年目以降は有料（$2.88）
説明文、インターフェイスも英語です。
JPドメインは移管できない模様

まとめ

SSLはLet's Encrypt の更新の関係もあるので一旦保留として、通常のアクセスはCDNのおかげで体感速度が向上しているような気がします。

それではまた。

2016-09-22

ブログの名前を変えました

思うところあって、ブログ名を変更しました。

それだけです。漢字とひらがなで迷いましたが、特に深い意味はありません。

2016-09-17

Kindle Unlimitedで読んだ本と簡単な書評（2016年9月前半）

Kindle Kindle Unlimited IT 書評

月額料金の元は取れているけど、可処分時間はだだもれ状態です。

本当の意味で元が取れるかどうかは、本を得て読んだ知識をどれだけ活用できるかにかかっているように思います。

今月はNextPublishingという金の鉱脈を見つけたのでかなり偏っています。

基本的に10冊制限の関係で一回読んで終わりになっています。

ビジネス書・一般
技術（or IT）
雑誌
- 『Mac Fan 2016年10月号』
語学
- 『英語のワナにはまるな! これが正しい選択だ!!』
翻訳関連
- 『技術翻訳　奥義と裏技　（１）』
まとめ

ビジネス書・一般

『これだから電子書籍は凄い！！』

これだから電子書籍は凄い！！: 電子出版で人生を切り拓こう！　　Kindleで売るノウハウを大公開。

作者: 岡本隆裕
発売日: 2014/11/28
メディア: Kindle版
この商品を含むブログを見る

2014年のKindleベストセラー作家（？）の方の本。電子書籍を書いた経験談とタイトルのつけ方などのちょっとしたノウハウ。

読みやすい。電子書籍を発行しようと考えているならタイトルのつけ方の箇所だけでも読む価値はある。

『日本はなぜ負けるのか　インターネットが創り出す21世紀の経済力学』

[asin:B01GJ6VA5M:detail]

ざっくり言うと、インターネットによる社会構造の変化と規制緩和を訴えている本。非IT系の企業にIT系の技術者が少ないことを問題視しているのは珍しいのでは。
それとIT業界以外の業界における多重下請け構造についても問題視している。IT業界の多重下請け構造の闇については十分理解しているが、言われてみれば（少なくとも建築業界など）他の業界だからといって問題がないとは言えない。

規制緩和については、事業者保護 vs. 消費者保護というのがポイントだと思う。少なくともアメリカは後者に舵を切っているみたいに読める。日本の岩盤規制、あるいは法体系そのものが（天皇を筆頭にした）既得権益者、事業者を守ることに重点を置くシステムになっているように思える。それが日本の停滞の理由ではないか。

本書を読んだ上での私の理解を要約すると以下のようになる。

インターネットによる社会構造の変化により、資本家と労働者の対立構造を破壊し、消費者が提供者（≒事業者）になりうる状況では既得権益を守ろうとすればするほど社会の発展を阻害する結果をもたらす。

結局のところ、イノベーションという単語を技術革新と訳したのがそもそもの誤りではないかと思う。技術がもたらす意識変革ぐらいに訳すべきだったと思う。

『大前研一世界を知る６つの特別講義』

大前研一世界を知る６つの特別講義 (大前研一ビジネスジャーナルアーカイブス（NextPublishing）)

出版社/メーカー: good.book
発売日: 2016/03/16
メディア: Kindle版
この商品を含むブログを見る

内容が多岐にわたっているので要約も説明もしづらい。

無理やりまとめると、『今（2015年あるいはそれ以前の時点）の世界の潮流はこうだ。お前ら危機感持たんかい。茹でガエルか阿呆』という感じではないか。

危機感が一番のキーワード。

いくつか誤解していた部分もあったし、勉強になった。日本の現状についてはよくこれで国が財政破綻しないものだと思った。分析は素晴らしいが、果たしてこれをどう活かすか。

提言については今ひとつ鋭さに欠けるように思う。

『日本のIT　なんか変？　次世代のデジタル産業を担う若者たちへ』

日本のIT　なんか変？　次世代のデジタル産業を担う若者たちへ IT Leaders Books (IT Leaders Books（NextPublishing）)

作者: 木内里美
出版社/メーカー: インプレスR&D
発売日: 2013/02/15
メディア: Kindle版
この商品を含むブログを見る

IT Readers というIT企業向けの限定配布の雑誌のコラムを書籍化したもの。著者は建築業からからITシステム分野に移った（企業内のITシステム部門の担当にへ移動という経歴？）方だそうで。

個人では購読できないんですよ、この雑誌。某社にいた頃は確か図書室*1にあったんですが。

半分IT業界、半分建築みたいな立ち位置で書かれているのでなかなか面白い。特に前半は2008年あたりの時事ネタを扱ったコラムなど、隔世の感がある。

後半へ行くほど説教くさいのが難点。

『エースと呼ばれる人は何をしているのか』

エースと呼ばれる人は何をしているのか

作者: 夏まゆみ
出版社/メーカー: サンマーク出版
発売日: 2014/06/20
メディア: Kindle版
この商品を含むブログ (1件) を見る

この著者、面白いというのが正直な感想。AKB48と「モーニング娘。」の振り付けで有名になった人。

正直言うとアイドルの顔と名前が一致しないので、具体例を出されてもよくわかならなかった。

内容はざっくり言うと、「自分に自信を持て、自分のポジションを確立しろ、群れるな」みたいなやつ。あと前向き、だったかな？
読みやすいけど軽くてイマイチ響かない。

某アイドルの裏話に興味があるなら面白いと思う。

『加算混合の発想硬直思考からどう脱するか』

加算混合の発想硬直思考からどう脱するか（2015年新装版） (大前研一books（NextPublishing）)

作者: 大前研一
出版社/メーカー: good.book
発売日: 2015/02/18
メディア: Kindle版
この商品を含むブログを見る

大前研一氏の若かりし日の名著。1980年代初版の本。

さすがに内容が古いのと、他の本を先に読みたくなったので途中離脱。

いかにも元技術者という視点、文章で面白い。経済系のコンサルタントで経営者目線の話が多い大前研一氏の原点が垣間見える感じ。また機会があればじっくり読みたい。

『漫画原作者は一体「何」を書いているのか』

漫画原作者は一体「何」を書いているのか

作者: 猪原賽
出版社/メーカー: 賽の目記ブックス
発売日: 2015/12/06
メディア: Kindle版
この商品を含むブログ (1件) を見る

漫画原作者のブログ記事をまとめたもの。この手の職業別の業界裏話は（部外者からすれば）新鮮で面白い。

サンデーの新編集長の宣言が云々という話が掲載されている。それはいいのだがその「宣言」そのものを引用しておいて欲しかった。

サンデーを読んでいない人間からするとなんか熱血タイプの独裁編集長が誕生したということしかわからない。

「マンガ文化最高!! 守り抜かなぎゃ!!」みたいな主張は正直うんざりする。守りたいのは自分の食い扶持でしょう、みたいな。

気持ちはわかるが「日本語」という言葉が喪われない限り、出版社や雑誌が滅びようとも文化は残るはず。食い扶持は消えるかもしれんけどね。

ベーシックインカム賛成派からするとそういう文化に対する固執は時代錯誤にしか見えない。

『著作権のことをきちんと知りたい人のための本』

クリエイターが知っておくべき権利や法律を教わってきました。著作権のことをきちんと知りたい人のための本

作者: 鷹野凌
出版社/メーカー: インプレス
発売日: 2015/04/24
メディア: Kindle版
この商品を含むブログ (3件) を見る

会話体の文章にところどころ弁護士の先生のツッコミが入る。各トピックごとの4コマ漫画が面白い。

非常にわかりやすいと思う。

対象読者の年代がイマイチよくわからないのがネック。苦痛ではないけど30代後半とか40代あたりを狙っているのだろうか。

そういえばその昔、萌える法律読本というのがあったのを思い出した。

技術（or IT）

『未来型国家エストニアの挑戦　電子政府がひらく世界』

未来型国家エストニアの挑戦　電子政府がひらく世界 (NextPublishing)

作者: ラウルアリキヴィ,前田陽二
出版社/メーカー: インプレスR&D
発売日: 2016/01/29
メディア: Kindle版
この商品を含むブログを見る

分類は若干迷ったがこっちで。

とにかくすごいの一言に尽きる。マイナンバーでまごついてる日本とは比較にならない。

国民全体にIDカードを持たせること自体もそうだし、政府の情報公開スタンスや業務の効率化など日本には無理だと思う。日本の場合、国民のITリテラシーの低さは容易には改善できないだろうと思った。まして国民全体に危機感が欠如している日本でこう言う先進的な取り組みは難しい。

そもそも日本のITベンダ社内ですらなかなか効率化が進んでいないんだから。

何はともあれ一度行ってみたい国。

エストニアの電子政府のようなコンセプトが進んでいくと、国と国民のあり方も変化していくのではないかと思う。IDカードによる電子証明書で本人確認ができるなら、どこに住んでいるかはあまり重要ではなくなっていくはず。国土にとらわれない国家が誕生しないだろうか？

そうやって突き詰めていく度、国家というものが携帯電話会社のようなサービス事業者に変化していくのではないかとワクワクしている。

仕事で使える！Google Cloud Platform 最新クラウドインフラ導入マニュアル

仕事で使える！Google Cloud Platform 最新クラウドインフラ導入マニュアル (仕事で使える！シリーズ（NextPublishing）)

作者: 吉積礼敏,福田潔
出版社/メーカー: インプレスR&D
発売日: 2016/03/25
メディア: Kindle版
この商品を含むブログを見る

Google Cloud Platform の解説と、アカウント登録からGoogle Compute Engine のインスタンスの立ち上げまで。

文章はわかりやすい。技術書としてはちょっと物足りないが概要としては十分か。導入検討のために上司を説得したい時には参考資料として役に立ちそう。

『仕事で使える！Googleドライブ　クラウドストレージ徹底活用術』

仕事で使える！Googleドライブ　クラウドストレージ徹底活用術 (仕事で使える！シリーズ（NextPublishing）)

作者: 佐藤芳樹
出版社/メーカー: インプレスR&D
発売日: 2015/06/12
メディア: Kindle版
この商品を含むブログを見る

まあ一言で言うとGoogle最強伝説。

変なこだわりを持たずにGoogle帝国の軍門に降るしかたない……。そんな感じ。

文章は普通で読みやすい。電子書籍としては表が画像でないのでポイント高い。

監査系の機能とか知らない機能があったので勉強になった。

不便な社内システムに不満を持った社員が勝手に持ち出し禁止の資料を私物のUSBメモリやHDDドライブにコピーしたり、あるいはよそのクラウドサービスにアップロードされるよりは断然マシ。

普通に便利だよね、Google 関連サービス。だからこそタチが悪いんだけど。

まあ複数メールアドレスを持つとか、ブラウザを使い分けて検索とそれ以外を極力分けるとか、他社のサービスで代替できる場合はそっちを使うとか自衛策はある。

雑誌

『Mac Fan 2016年10月号』

Mac Fan 2016年10月号 [雑誌]

出版社/メーカー: マイナビ出版
発売日: 2016/08/29
メディア: Kindle版
この商品を含むブログを見る

語学

『英語のワナにはまるな! これが正しい選択だ!!』

英語のワナにはまるな! これが正しい選択だ!! impress QuickBooks

作者: ジェームス・M・バーダマン
出版社/メーカー: IBCパブリッシング（インプレス）
発売日: 2014/12/17
メディア: Kindle版
この商品を含むブログを見る

典型的な日本人の間違いを集めて英語話者の発想を解説している本。Q&A形式なのはいいけど読むのに時間ががかる。

Kindleではなく紙媒体の書籍になりますが、単語の使い分けは『イメージと語源でよくわかる似ている英単語使い分けBOOK』を読んでおくのがオススメです。単語ごとの違いを説明したイラストと語源の解説が充実していて理解しやすいです。

翻訳関連

『技術翻訳　奥義と裏技　（１）』

技術翻訳　奥義と裏技　（１）: 翻訳とは　無生物主語構文

作者: 富井篤
出版社/メーカー: 富井篤
発売日: 2015/03/04
メディア: Kindle版
この商品を含むブログを見る

いかにも翻訳調という感じの文章を自然な日本語にするためのノウハウ本。シリーズ構成になっているうちの一冊。過去に出版された本の内容を再構成したものらしい。

ぶっちゃけこのシリーズを月に二冊ずつ読めばKindle Unlimited の月額料金を普通に回収できてしまう。

読むのは大変だけど、翻訳に興味があるなら読んで損はなさそう。というか（英語の）翻訳者を目指すなら必須では？

関連シリーズ：翻訳関連のノウハウ本

まとめ

同じ著者の他の本を読もうと思ったケースがいくつかありますが、Kindle Unlimited に消極的な会社の本だったり。

Kindle Unlimitedに積極的な出版社さんに還元しようとするなら一度読んだ本を単品で買うのが一番なんでしょうけれど。

一度読んだ本を何度も読むのは実は苦手で、一回目はサクサク読めても二回目は脳が受付拒否することがあります。声に出して読み上げて、録音して耳で聴くのも一つの手ですがいかんせん面倒だったり。Voice Overの読み上げはイマイチ違和感ありますし*2。

そんなこんなで読書の秋。

みなさま良い読書ライフを。

*1:いっちょ前に図書館を名乗っていたがメインの工場のそれには劣る

*2:まだ中耳炎が完治していないこともあって音声読み上げは聞き取りづらいです。

2016-09-11

久々に英単語帳を購入した

雑記購入したもの英語関連

f:id:atuyosi:20160911001209j:plain

語彙力を強化したいと思って単語帳の良さそうなやつを探していた。

かつて一世を風靡した『ドラゴン・イングリッシュ基本英文１００』の巻末の英語の勉強法についてのアドバイスが載っている。語源を解説しているタイプの英単語帳がいくつか推薦されていた。

紹介されている単語帳を検索すると改訂版らしきものが複数ある……。書名が紛らわしいどころか同じ著者の、しかも似たようなコンセプトの単語帳がそれぞれ異なる出版社から発売されている。

どれを購入するかすごく迷ったが、Amazonのレビューを参考に学研の下記の単語帳を購入。

語源で英単語増補改訂版 (連想式にみるみる身につく)

作者: 清水建二,ウィリアム・ジョセフカリー,中田達也,William Joseph Currie
出版社/メーカー: 学研教育出版
発売日: 2015/06/24
メディア: 単行本
この商品を含むブログを見る

この本の「はしがき」によると、『連想式にみるみる身につく語源で英単語』と『イラストで記憶に残る語源ビジュアル英単語』の2冊をまとめて1冊にしたものだそうです。

タイトルに『語源で〜』とある通り、同じ語源の単語をグループにして、単語の本来の意味と、イメージを想起させるイラストが掲載されているのが特徴です。

同じ著者のものも含め、他の類書の場合、CDが付いてないとか、CDはあるけど発音記号が未記載とか、あちらを立てればこちらが立たず、な単語帳が多い。しかし、本書はその点もばっちりカバーしている。

CD2枚付き
発音記号あり
赤シート付き

タイトルに「イラスト」という単語はないが、各グループに語源にちなんだイラストがあるので「イラストで覚える〜」系の英単語帳とも言える。

こちらは単語帳ではないが、同じ著者の『イメージと語源でよくわかる似ている英単語使い分けBOOK』もなかなかいい（こちらはCDなし、発音記号もなし）。

実際のページレイアウトは以下の画像参照。

f:id:atuyosi:20160911001300j:plain

まず、左ページで語幹と語源の解説、イラストと代表的な単語。

f:id:atuyosi:20160911001408j:plain

右ページは同じ語源の単語が並ぶスタイル。

f:id:atuyosi:20160911001501j:plain

とまあこんなな感じ。

唯一の難点は、付属CDの単語と例文の間の無音区間が短いところかな。「単語、（存在する場合は単語の派生系、）例文」という繰り返しになっている部分で、単語と例文の間にもう一秒ぐらい間を取ってほしい。

CDの収録可能時間は基本的に74分42秒（79分58秒のフォーマットもあるけど）なので、各CDあたりトラック数75、それぞれのトラックが平均50秒なのでギリギリもう1秒ならなんとかなったように思います。

もしくは音声データをダウンロード配布するという解決策もある。実際、音声データはダウンロード提供という英語教材も店頭に並んでいる。

参考：CDの最大収録時間

入試やTOEICに登場しない単語もかなり入っているのではないかと思いますが、総合力を引き上げてくれそうな単語帳です。

年明けにTOEIC受けようか思案中です。それではまた。

2016-09-10

今更だけどGoogle Cloud Vision APIでOCR （その2）

OCR GCP Ruby IT プログラミング Google Cloud Vision API

[2018/08/14 注意]

この記事の内容は古くなっています。現時点で同じ画像で試すと認識結果が変化します。特にTEXT_DETECTIONの替わりに DOCUMENT_TEXT_DETECTIONを指定すると結果に変化があります。

黒背景でも文字を適切に認識するようです。

[追記ここまで]

引き続いてGoogle Cloud Vision API で遊んでみる。

a244.hateblo.jp

前置き
検証
まとめ

前置き

前回はざっくり対応漢字の確認をしたのでそれ以外の観点で。

絵文字
文字サイズ
傍点
数式（英数字だけでも）

検証

前提条件としてGoogle Cloud Platform のユーザー登録とAPIと課金の有効化は完了しているものとする。画像はMacのPagesで適当に入力し、スクリーショットを作成。

検証用のスクリプト

前回のやつを一部修正。BatchAnnotateImagesRequest.newの引数に与えるオブジェクトをそれぞれのコンストラクタで生成してから引数に与えるように修正。

#! /usr/bin/env ruby

require 'json'
require 'google/apis/vision_v1'

Vision = Google::Apis::VisionV1
vision = Vision::VisionService.new
#vision.key = "API KEY"
vision.key = ENV['GOOGLE_PRIVATE_KEY']

filename = ARGV[0]

features_list = Google::Apis::VisionV1::Feature.new({max_results: 3, type: "TEXT_DETECTION"})
context = Vision::ImageContext.new({language_hints: ["Japanese"], lant_long_rect: nil})

request = Vision::BatchAnnotateImagesRequest.new(  { requests:  [ features: [ features_list ], image: Vision::Image.new({content: File.read(filename) , image_context: context } ) ] }) 

result = vision.annotate_image(request) do |result, err |


  unless err  then

    result.responses.each do | res |
      puts res.text_annotations[0].description

#      res.text_annotations.each do | ta |
#        puts ta.description
#      end

    end

#    print JSON.pretty_generate(result.to_h)
  else
    puts err
  end

end

必要に応じて32行目をコメントアウトする。

使い方は前回と同じく環境変数をセットして引数に対象画像ファイル名を指定する。trial.rbという名前にしているので、下記のように実行。

$ export GOOGLE_PRIVATE_KEY="APIキー"
$ ruby trial.rb 画像ファイル名

検証その1

まずは絵文字と文字サイズから。

検証画像

本来はちゃんと解像度を固定するところだけどPagesのスクリンーンキャプチャ画像で代用。

f:id:atuyosi:20160906234743p:plain

744 x 566ピクセル。

結果

絵文字
文字サイズ(6pt-18pt)
2,完璧主義、憂鬱、誹謗中傷、薔薇。
3,完璧主義、憂鬱、誹謗中傷、薔薇。
4,完璧主義、憂鬱、誹謗中傷、薔薇。
5·完璧主義、憂鬱、誹謗中傷、薔薇。
6,完璧主義、憂鬱、誹謗中傷、薔薇。
7,完璧主義、憂鬱、誹謗中傷、薔薇。
*元

末尾のゴミはご愛嬌として*1。

絵文字は全滅。6ptの文字列は全く認識されてない。文字の大きさは一定サイズより小さいと認識されないらしい。人間から見て読みづらいサイズは認識しないのか、文字がありそうな領域の検出時点で弾かれているのか。

絵文字を文字とみなすかと言われると微妙なので妥当といえば妥当。

検証その2

画像

f:id:atuyosi:20160907155530p:plain

739 x 751ピクセル。壁の字の羅列箇所は、2、8、12番目の文字だけ完璧の「璧」になっている。逆に意図的に完璧の璧を壁(かべ)にしている。

丸囲み数字とはあまり言わないのかも。Wikipediaでは丸数字、丸付き数字と書いてある。

結果

丸囲み文字
-NEC特殊文字
闢] ㍾ ㍽ ㍻キロ芋ン脊/ラトン7-Myy?"-ドルトンth龍す
,似たような漢字の中に紛れ込ませると?
壁璧壁壁壁壁璧璧壁壁壁璧壁壁壁壁壁(10pt)
壁璧壁壁壁壁辟璧壁壁壁璧壁壁壁壁壁(12pt)
壁璧壁壁壁壁壁璧壁壁壁璧壁壁壁壁壁(14pt)
完璧の璧を壁に変えてみると?
完璧な人間はいない。(10pt)
完璧な人間はいない(1 4pt)
,下線
我輩は猫である名前はまだない。
傍点
我輩は猫である。名前はまだない。
·その他
吾輩は猫である。 はまだない。
Cehぶうまんばん
漢字にルビを振る。重複するデータを削除する。順風満帆。

中黒（・）の認識が不安定なのと、一部存在しないはずの文字が出ている。なぜか「漢字(かんじ)」と「重複(じゅうふく)」のルビは無視されて、不完全ながら「順風満帆(じゅんぷうまんぱん)」の方は認識されている。

認識結果をエディタに貼り付けて検索をかけると、「璧」と「壁(かべ)」の識別に失敗しているのは10ptのケースと「完」の文字の直後。

f:id:atuyosi:20160907162951p:plain

完璧の「璧」を壁(かべ)に置き換えたものは補正されている。これは前回の叱咤激励と同じ。意図的に「壁(かべ)」の文字にしているので（通常は誤字だけど）意図した文字ではない。

ちょっとサンプルが足りないですが、ざっくりまとめると以下のようになる。

丸囲みの数字は全滅というか無視されている
"㍾㍽㍻" はきっちり認識しているけど、「㌔」が二文字で認識されている以外の単位系の特殊文字は全滅
傍点は無視しているようで対象の文字は認識できている
アンダーラインは句点（。）の認識に失敗している
黒背景に白抜きの文字は認識できない
熟語の場合は認識結果に補正がかかる
文字に振り仮名がふってあったとしても認識できるが、振り仮名自体は完全には認識できない

比較的フォーマルな文書ではNEC 特殊文字は使われないだろうからいいとして丸囲み数字*2はきっちり認識してほしいところ。

特に Tesseract に対する優位点を整理すると、

（文字サイズが小さい場合に）圧倒的な認識率
傍点、下線、ルビによる影響を受けにくい
認識可能な漢字の対応範囲が広い

一応補足しておくと、画像を拡大してやれば Tesseract の方も認識率は改善するはず*3 。ただ Tesseract は傍点、ルビの類は苦手なようなので前処理で除去してしまうか、ルビは独立した行としないとつらい。

個人の主観であって定量データではないです。労力の割に得るものなさそうなので。

検証その3（数式）

まあダメ元でやるだけやってみました。全然ダメです。

LaTeXでと言いたいところだけど面倒なのでPages+MathTypeで逃げる。30日間の評価期間が終了しても"MathType Lite"として数式エディタ機能は使えるとのこと。

画像

f:id:atuyosi:20160907193818p:plain

マクスウェル方程式の積分系と組み合わせの計算式あたりで妥協。 581 x 314ピクセル。

結果

B.dA-0
OB
Vx E
at
E.dA
through
n!
DE
dA

英数字はもう少し認識するかと思いましたが微妙な感じ。括弧はいけるかと思いましたが分数はダメだった模様です。

まとめ

Google Vision API のOCR機能について、①、②のような数字と黒背景かつ白抜きの文字を認識できないことがわかったのは大きな収穫。他の条件（アンダーラインや振り仮名）は画像自体を拡大してやればなんとかなりそう。

認識対象文字をコントロールできないのは難点だけど、それでも Tesseract と比べれば圧倒的な認識率。

傍点などの文字に対する装飾の情報は普通にロストするのでそこは頭に入れておく必要がある。

絵文字と数式は無茶振りとして、天下のGoogle製APIにも不完全な部分があるということでした。