プログラミング

結局PHPに手を出すハメになってしまった……

因果という因縁というか……。 この業界にいると悪名高きPHPからは逃れられないようです。 まあ、断るということもできたんですが、立て続けにPHP案件の紹介が来るとさすがに知人の好意*1はあまり……。 PHPの思い出 Homebrew で PHP PHP 5.6.x PHP 7.x Composer…

厚生労働省のブラック企業リストをPythonで解析する(PDFMiner.six)

タイトルの通り、5月ごろに話題になった例のPDFをPython3 + PDFMiner.six でパースしてTSV(タブ区切りテキスト化)する話です。 以前からやろうと思っていながら放置していました。 すでにgithub でTSVデータにして変換してくださった方がいるので完全に二…

ラズパイにOpenCV 3.2 をインストールする(暫定版)

前回の記事で年内の最後の予定だったけどせっかくなので。 ほぼ作業メモみたいなものです。 環境 準備 旧バージョンのアンインストール(元からインストールされている場合のみ) 作業ディレクトリの作成 ソースの入手 展開 ビルド CMake ビルド インストー…

Raspbian (Raspberry Pi 3 model B) に OpenCV 3.1 をインストールする

ラズパイ3の環境にOpenCV 3.1をソースからインストールする備忘録(作業メモ)です。 かなり冗長です悪しからず。 Webカメラをつないで終わりではありませんよね、ということでOpenCVです。 Raspbianの標準のパッケージとしてバージョン2.4系が提供されてい…

今更だけどGoogle Cloud Vision APIでOCR (その2)

引き続いてGoogle Cloud Vision API で遊んでみる。 a244.hateblo.jp 前置き 検証 検証用のスクリプト 検証その1 検証画像 結果 検証その2 画像 結果 検証その3(数式) 画像 結果 まとめ 前置き 前回はざっくり対応漢字の確認をしたのでそれ以外の観点で。 …

今更だけどGoogle Cloud Vision APIでOCR その1

今更だけどGoogle Cloud Vision API。そのうち試そうと思っているうちにGCPの仕様期間3ヶ月があっさりと終了……。 毎月最初の1000リクエストはコストゼロだそうなので試してみます。 Google Cloud Platform Japan 公式ブログ: ついに Google Cloud Vision API…

はてなブログの見出しとMarkdownモード、そしてスクレイピング

今更ではあるけれど……。 (はてなダイアリーとの互換性だかなんか知らないけど、)はてなブログでは<h2>タグは使わない前提になってるらしい。 なんの話かというと、現状このブログの記事のほとんどは見出しに<h1>タグを使っているエントリが複数ある状態で色々と好</h1></h2>…

Tesseract-OCR の各言語のラッパーいろいろ

サーバーサイドでOCRさせたいので各言語のtesseract-ocrラッパーを調査。 [2017/02/20 追記] tesserocrを追加。 また、以下の情報はTesseract 3.0xについてのみです。4.xについては調査していません*1。 最新の3.05でも動くものは動くと思いますが、新機能で…

Ruby で平仮名またはカタカナをローマ字にする

ちょうどいいRubyのライブラリがないか調べたので備忘録。 昔はSuikyoというライブラリがあったはずだけど、今はメンテされていない様子。 ローマ字表記について Rubyのライブラリ romkan romankana romaji 課題など ローマ字表記について そもそも論として…

「プログラミング教育必修化」について思うこと

(画像はフリー写真素材ぱくたそさんより) ちょっと周回遅れだけども、思うところがあるので書いておく。 あちこちで批判的な記事が出ているので今さらだけど、私もうまくいかないに一票。 これまでの理科系教育がうまくいっていないのに、プログラミング教…