KDPで電子書籍を出版しました
スポンサーリンク
電子書籍をリリースしました。PythonからGoogle Cloud Vision APIを使って文字認識(OCR)する方法の解説書です。
Google Cloud Vision APIとPythonで文字認識
- 作者: machine powers
- 発売日: 2018/09/14
- メディア: Kindle版
- この商品を含むブログを見る
また黒歴史が一ページ。何はともあれ実績解除。
7月中に書き始めて、途中で方針転換して内容を一部カット、紆余曲折の結果どうにか書籍としての体裁を整えたという感じ。
バージョン1.1.1が最新です。いきなりヘマをやらかしているので奥付に記載のバージョンが1.0の場合はコンテンツを更新してください。
内容について
サポートページ:『Google Cloud Vision APIとPythonで文字認識』
構成としては次のとおり。
- 第1章 文字認識(OCR)とは
- 第2章 Google Cloud Vision APIの準備
- 第3章 Google Cloud Vision APIによる文字認識
- 第4章 PDF/TIFFデータと文字認識
- 第5章 PDFの作成
- 付録A Google Cloud SDKについて
- 付録B サンプルコードの実行方法
GoogleのAPIを使うための本です。自力でOCRエンジンを作るという本ではありません。
変更履歴
- Ver. 1.2.0 第4章の見出しを変更
- CSSを修正
制作ツールなど
以下のQiitaの記事を参考にしています。
Kindleで技術書の電子書籍を公開するまで - Qiita
使用したツール類は以下のとおり。
- Pandoc 2.2.3.2
- Visual Studio Code (エディタ)
- Figma(作図、表紙の作成)
- 修正用のRubyスクリプト
- Rake(ビルドツールとして)
- KindleGen
- textlint/prh
PandocでEPUB、章見出しと目次をスクリプトで修正したのちkindlegen
コマンドでKindle用の形式(mobi形式)にしてアップロード、です。
幸い数式を含んでいないのであまりややこしいことはやっていません。
表紙に使用している写真はUnsplashから。
表紙は以下の書籍を参考にして自力でそれっぽく仕上げました*1。ある程度売上が上がったら外注したいです。
iOSアプリのアイコンよりは断然楽。Amazonの推奨サイズは少し縦に長過ぎるので白銀比(1810 x 2560)で作成しました。
まあ非デザイナーが作ったにしては及第点でしょう。
KDPへのアップロード
KindleGenコマンドでEPUBからmobi形式に変換したものをアップロードしました。
KindleGenコマンドで変換するのが良いのか、Kindle Previewerで変換するのがいいのかは検証していません。
なお、問題の納税者番号ですが、「外国(米国以外)の納税者番号を持っている」を選択してマイナンバーを入力すれば良いというページを見つけたのでとりあえずマイナンバーを入れておきました(以前はEINだったのに現在はTINという表記なので)。
マイナンバーそのものが納税者番号かと言われると違う気もしますが、確定申告したタイミングでマイナンバーと紐付けられてしまうので手続き的には問題ないのでしょう。
アップロードした原稿データの差し替え・修正が反映されるのに4-6時間はかかるようです。AppleのiOSの審査よりは早いですが。
誤字に気づいてから修正まで最低でも数時間かかります。皆様お気をつけください。
反省点
- 自分で立てたスケジュールをまったく守れていない
- ループのインデントが深いとサンプルコードが見にくい
- 図の配置がおかしい箇所がある
- 図のキャプションの番号
- 章見出しは改善の余地あり
- prhの辞書をちゃんと作っておけばよかった……
図表番号はpandoc-crossref
というツールで実現できそうですが見送りました。
改善予定
図の差し替え、内容の追加、CSSの調整などを予定しています。
Pandocはバージョン2.3でEPUB関連の拡張が入っているので新機能を活用したいとは思っています。
次版ではPandocの各種フィルタを使うのが目標の一つ。
感想
Pandocによる電子書籍の感想としてはちょっと画像の入った電子書籍をつくるなら断然楽です。ある程度の分量のソースコードを掲載するならPandoc単体では厳しいかも。
ソースコードを埋め込むPandocフィルタはあるみたいですが試していないです。
iBooksでEPUBのプレビュー表示しているといい感じでもKindle Previewer or Kindle for Macで表示がくずれるなど心が折れそうな要素がいろいろありました。
結構面倒だったその割にはちょっと達成感に乏しい感じです。
初めてiOSアプリを審査に通したときにくらべれば断然マシでした*2。
この分量でこの労力ということは、フルタイムで働きつつ、数百ページの本を書いている人はちょっと化物ではないでしょうか……。
昔からケアレスミスの多さに定評があるとはいえ、タイトルで誤字るという大ヘマは流石にないよ……。> 自分
そのほか
出版祝い(?)もお待ちしております。
KDPセレクトに登録しているのでKindle Unlimitedの対象になっています。
長かった。「パトラッシュ、僕はもう疲れたよ」という気分ですね。主に誤字のせいで。