今日も微速転進

ここではないどこかへ

Python

KDPで電子書籍を出版しました

電子書籍をリリースしました。PythonからGoogle Cloud Vision APIを使って文字認識(OCR)する方法の解説書です。 Google Cloud Vision APIとPythonで文字認識作者: machine powers発売日: 2018/09/14メディア: Kindle版この商品を含むブログを見る また黒歴…

Pythonで複数の画像をPDFにする(1画像1ページ/圧縮なし)

スキャン済みの画像データをゲットしたのはいいけれど……。 PNG形式のバラ画像200枚というのは不便ですねって話。 ImageMagickで一気にPDF化することはできないので……。 1画像ずつPDFにして結合すればいいんだけど、それはそれでめんどいのでPythonでやってみ…

PythonとPmodのマイクモジュールで玄関のチャイムの音を検知する

ラズパイコンテストの応募ネタです。しょぼいけど動いたので。 背景 前提 事前調査 方針 準備 各種モジュール Pythonスクリプト 実行した様子 通知 メッセージ 課題など 感想 背景 難聴による聴力低下が進むと玄関のチャイムの音が鳴っても聞こえない、また…

Python とビルド済みのOpenCVバイナリパッケージ

ビルド済みのOpenCVバイナリパッケージについてメモ書き。 あくまでもPython向けにOpenCV 3.xをインストールする方法の1つです。 macOSでPython本体を使う場合の一番ズボラな方式。 非力なマシンに最適。 背景 そもそもOpenCVソースコード自体にPython用のバ…

Pmod HATとマイクモジュール(Pmod MIC3)

とりあえずゲットした部品を使えるようにしただけ。ものは7月末に届きました。 経緯 付属品など 環境・その他 ハード ドキュメント ライブラリ セットアップ SPIの有効化 パッケージの追加 Python環境のセットアップとライブラリのインストール ハードウェア…

『100問でわかるPython』の感想

100問でわかるPython作者: 松浦健一郎,司ゆき出版社/メーカー: ソシム発売日: 2017/10/25メディア: 単行本この商品を含むブログを見る 図書館にあったので借りてみた。プログラミング系の本にしては珍しく赤シートが付属。 右側に問題とヒントが記載されてい…

Google Vision API の手書き文字認識(英語)を試す

経緯 どこかのニュースサイト(英語)でGoogle Nextで発表された新機能として"hand wrtten"(手書き)という文字があったのでググってみたところ、 Google Vision APIのドキュメント(英語の方)にさり気なく"Detecting Handwriting"という記述を発見。 下記…

書評:『逆引きPython標準ライブラリ』

図書館にあったので借りてみました。読んだというより何が書いてあるのか眺めたという感じですが。 結論:微妙。 はっきり言っておすすめしません。3,000円出せるなら他の本が良いでしょう。 読み始めて最初のうちは役に立つと思いますが、すぐに物足りなく…

PythonのWebスクレイピング解説書の比較メモ

全部買ったわけではないですが、購入検討ように比較したメモ。 初歩的なレベルであればブログやQiitaに記載されている記事でなんとかなる場合が多いですが、クローラーを作成してがっつりやるなら一冊買って持っておいたほうがいいはず。 意識したポイント …

Amazon Advertise API 関連メモ書き

AmazonのProduct Advertising APIに関するメモ書き。備忘録なので非常に雑です。 APIの概要 公式ドキュメント 使用するには 注意事項 APIに指定するパラメータについて カテゴリのリスト Python用ライブラリ 参考情報 Response Groups関連 商品に関するXML属…

財務省の公開した交渉記録PDFをいじる その3(本件終了)

一応切りの良いところまで作業したのでここで終了。 プログラムは汚いので載せてないです。 フォーマットが微妙に違うなどの数々のトラップによりかなりの部分を手作業で治すハメに。自分で作ったページ範囲データの不備のせいでさらに無駄な苦労があったり…

すごいプログラミング入門書が登場したかもしれない

局所的にTwitterでかなり話題になっている本。 現時点では予約受付中で目次とサンプルページをベースで書いています。目次を見る限り、確かに基本的な内容中心。 コンセプト、アイディアの時点で素晴らしいのでサンプルページを見ただけで、 間違いなくすご…

厚生労働省ブラック企業リスト5月版(2018年)

今月はデータ自体が公開されないのかと思いましたよ……。 月末にギリギリで出してくるとは。 a244.hateblo.jp またこのネタかって感じもしますが当面は続けます。 データの入手元 機械可読データ(タブ区切りテキスト形式) PDFからTSVへの変換スクリプト 前…

厚生労働省ブラック企業リスト4月版(2018年)

遅くなりましたが、4月版。今年の5月で厚生労働省が企業名を掲載し始めてから丸一年ということになります。 このブログで追いかけているのは8月からですが。 a244.hateblo.jp データの入手元 機械可読データ(タブ区切りテキスト形式) PDFからTSVへの変換ス…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その3)

前回、前々回の続き。ようやく完成。 a244.hateblo.jp a244.hateblo.jp pdftkコマンドで目次(しおり)を追加 まずはpdftkコマンドの、update_info_utf8を使う方法。 コマンドの書式 $ pdftk input.pdf update_info_utf8 info.txt output output.pdf input.p…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その2)

前回の続き。PDFファイルに対する目次の追加は次回。 a244.hateblo.jp 前提 工程 スクリプト その1 その2 課題など 汎用性の問題 ファイルのパスの扱い Pythonスクリプトでハマったところ まとめ 前提 macOS Python 3.6 工程 PDFファイルの暗号化の解除(シ…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その1)

PDFの目次?部分をパースすればいいかと思ったらまたしても単純ではない……。 やりたいこと 方針および手順 課題と方式検討。 準備 暗号化の解除 ページ番号の取り出し pdftk のセットアップ 使用方法 連載記事名とページ番号の取り出し 出力例 まとめ やりた…

陸自イラク日報のPDFにテキストを付加して検索できるPDFを作る(試行錯誤 その1)

意外なことに簡単なようですんなりとはいかない。とりあえずやってみた的な記事。 過去記事の続き。 JSONデータはDBにぶち込むほうが使い勝手がいいだろうとは思いますが、どっちにしろ出遅れているので違う方向で。 前提条件など OCR処理自体は過去の記事で…

陸自のイラク日報をOCRしてJSON化する(暫定版/Google Cloud Vision API)

すでに検索サイトも作った方がいますし、ブログ記事化した方もいますが、マイペースでいきましょう。 スクライド風にに言うと「俺がスロウリィ!?」ですが気分が乗らなかったのはしょうがない。 スクライド 5.1ch DVD-BOX (期間限定生産)出版社/メーカー: バ…

某新聞社のサイトから陸自のイラク日報をダウンロードするPythonスクリプト

別に普通にダウンロード用のソフト使えば済むんだけど勉強を兼ねて。 Pythonのライブラリのお陰でろくに勉強になっていないけど、BeautifulSoup4でやろうとしたらnth-of-type()が空振りするんでlxmlに逃げました。 情報公開請求?で入手した文書の著作権はあ…

FirefoxとWebDriverでheadlessモード(macOS)

いつの間にかFirefoxもheadlessモードに対応したらしいのでちょっと試してみた。 内容は大したことないです。 WebDriverと言うのは正確に言うとSelenium WebDriverでブラウザをプログラムから制御するライブラリ。headlessモードというのは実際に画面にウィ…

書評:『入門 Python 3』

ちょっと今更感はあるけどそういえば書評を書いてないね、ということで*1。 概要 入門 Python 3作者: Bill Lubanovic,斎藤康毅,長尾高弘出版社/メーカー: オライリージャパン発売日: 2015/12/01メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) …

Voice Kit とサーボモーター その1

最終的な目標は音声でVoice Kit につないだカメラの首振りなどの制御。 まずは下準備としてラズパイからサーボをコントロールする。 やりたいこと Voice HAT (Voice Kitの拡張ボード)のカメラマウント用のサーボモーターをつなぐ Pythonからサーボモーター…

厚生労働省のブラック企業リストをPythonで解析する(PDFMiner.six)

タイトルの通り、5月ごろに話題になった例のPDFをPython3 + PDFMiner.six でパースしてTSV(タブ区切りテキスト化)する話です。 以前からやろうと思っていながら放置していました。 すでにgithub でTSVデータにして変換してくださった方がいるので完全に二…

OpenCV関連本いろいろ(洋書)

本のタイトルから対象にしているOpenCVのバージョンが判断しづらいケースや、内容の違いがよくわからないものが多いのでリスト化してみました。 随時更新予定です。 確実に言えることは、Amazon から買うより出版元の割引セールで買うか、電子版なら定額読み…

せっかくなのでラズパイでLEDを光らせてみる(RPi.GPIO)

なんとなくラズパイ買ったらやっておかないといけないような気がしたので(使命感?)。 ネタ元はトランジスタ技術 2016年 11月号。 横着なのでGPIOとブレッドボードの接続はT字の接続基板キットを使用。 cocopar Raspberry Pi model B+/raspberry pi 2B/3B …

広告