今日も微速転進

ここではないどこかへ

2018-06-01から1ヶ月間の記事一覧

書評:『はじめての技術書ライティング』

期待したような本ではなかった。読む側として期待しすぎだったか。 ちょっとタイトル詐欺感は否めない。率直に言って、あまりオススメの本ではない。 概要 はじめての技術書ライティング―IT系技術書を書く前に読む本 (NextPublishing)作者: 向井領治出版社/…

厚生労働省ブラック企業リスト6月版(2018年)

今月も恒例の公表事案。 a244.hateblo.jp 今月も月末更新。 データの入手元 機械可読データ(タブ区切りテキスト形式) PDFからTSVへの変換スクリプト 前月との比較 まとめ データの入手元 www.mhlw.go.jp ファイルは労働基準関係法令違反に係る公表事案とい…

macOSとスクリーンショット

備忘録というかメモ。 基本 基本的なやり方 クリップボードにダイレクトにコピーしたいとき ウィンドウの影を消す マウスカーソルつきのスクリーンショット スクリーンショットに関する設定 保存先の変更方法 保存形式の変更 ファイル名の接頭辞(文字列)の…

今週のふりかえり(2018年6月第4週)

雨は売っと惜しいけど、晴れの日に風が吹くといい感じ。 あと一週間で6月もおしまい‥…。 今週の学び 中国語に関して 最近の読めなかった単語など その他・ノウハウなど ソフトウェア開発関連 Electron 入門 apac 今週の思いつき 今週試したソフトウェア or …

「機械学習で男性エンジニアを女性に」という炎上案件について

いまいちコンテキストが理解できないのだけど。 logmi.jp その場に「いなかった人」がどうも文脈を把握しきれずに騒いでいる感じがする。 これ音声を機械学習で変換しようという技術についての発表ですよね? 女性エンジニアが少ないことと、機械学習は何の…

Gimp 2.10.x macOS版について(McGimp 2.10)

本格的にロゴ画像作成にトライしようと思ってGimpをダウンロードしようとしたのですが……。 現時点ではmacOSの最新バイナリパッケージはまだ提供されておらず。 Gimpの最新の安定版はバージョン2.10.x系列。 代替手段 macOS版Gimp 2.10 (McGimp) McGimpの日本…

財務省の公開した交渉記録PDFをいじる その3(本件終了)

一応切りの良いところまで作業したのでここで終了。 プログラムは汚いので載せてないです。 フォーマットが微妙に違うなどの数々のトラップによりかなりの部分を手作業で治すハメに。自分で作ったページ範囲データの不備のせいでさらに無駄な苦労があったり…

はてなブログpro、(課金期間が)停止。

課金した分、もとは取れたけど……。なんかいまいちイラつくというか、微妙。 年契約とか面倒なこと言わずに月額500円なら払うんだけど、その「途中解約受け付けませんでぇ〜」ってのがなんとなく嫌。 トップページの一覧表示は魅力的なんだけど、そもそもこの…

Tesseract OCR 近況(2018/06)

オープンソースのOCRエンジン(正確に言うとOCR用のライブラリ)、Tesseract OCRの開発状況ウォッチング、です。 しばらくメーリングリスト、GitHubのリポジトリからの通知をチェックできていなかった時期があるので見落としがあるかも。 2017年秋ごろに下書…

書評:『達人に学ぶDB設計 徹底指南書』

[2018/09/27 追記] 改訂版が出るそうです。 達人に学ぶSQL徹底指南書 第2版 初級者で終わりたくないあなたへ作者: ミック出版社/メーカー: 翔泳社発売日: 2018/10/11メディア: 単行本この商品を含むブログを見る 以下は旧版についてのレビューです。 [追記こ…

今週のふりかえり(2018年6月第3週)

雨は嫌いだけど、外出を躊躇させるという意味では読書が進んでいいのかな、と思えなくもない。 今年は意外と雨が降っていない気もするけど。 今週の学び 2018/06/18の地震について 最近の読めなかった単語など その他・ノウハウなど ソフトウェア開発関連 構…

すごいプログラミング入門書が登場したかもしれない

局所的にTwitterでかなり話題になっている本。 現時点では予約受付中で目次とサンプルページをベースで書いています。目次を見る限り、確かに基本的な内容中心。 コンセプト、アイディアの時点で素晴らしいのでサンプルページを見ただけで、 間違いなくすご…

物流と労働を取り巻くパワーワードの宝庫(書評:『現代思想 2018年3月号』

いまは6月ですが……。 他所のブログ経由なので周回遅れです。6月ですが紹介しているのは2018年3月号。 現代思想という雑誌の感想です。 概要 感想など キーワード 紹介されているサービスなど 読みながら考えたことなど 再配達問題 労働組合についての私見 通…

話題のレシート1枚10円アプリについて

普通に個人情報ホイホイかと思ったけど、よく考えたら面白いかも。 なんの話? nlab.itmedia.co.jp www.itmedia.co.jp (おそらく裕福な家庭環境の)高校生*1が起業して、レシートの画像を一枚10円で買い取るというサービス(iOSアプリ)をリリースしたとい…

書評:『インターフェイスデザインの心理学』

ざっくり書評。対象は『インターフェイスデザインの心理学』。 インタフェースデザインの心理学 ―ウェブやアプリに新たな視点をもたらす100の指針作者: Susan Weinschenk,武舎広幸,武舎るみ,阿部和也出版社/メーカー: オライリージャパン発売日: 2012/07/14…

Adsense に関する備忘録

リンクとか諸々。備忘録です。 公式ヘルプ support.google.com 基本はここ。 ヘルプフォーラム productforums.google.com トラブルなど、困ったとき用。 AdSenseのタグの修正 support.google.com 公式ドキュメント言及している範囲については問題ない。 ツー…

今週のふりかえり(2018年6月第1, 2週)

早く梅雨が明けますように。 今週の学び メールサービス その他・ノウハウなど はてなブログのMarkdownとシンタックスハイライト tmuxとsshと色 Python Tips GitHub Markdown テキストの前処理 今週見つけた・試したソフトウェア or サービス 各種エンコード…

またひとつ、パンドラの箱が開いた

小説家のSNSでの過去の発言が原因で声優降板、アニメ化企画が中止になったそうな。しかも出荷停止とかいう話も出ている。 これの事件、いろいろまずいと思う。以下、順不同。 (明言していないが)作者の過去の言動というな理由で降板という実例ができてしま…

ブログのカスタマイズについての備忘録

一部のカスタマイズはPro化(有料プラン)が前提です。このブログはあと2週間でProではなくなりますが……。 下書き状態で放置していたので情報の鮮度はいまいちです。あしからず。 テーマを変えたり自動広告を試したり試行錯誤中です。 使用しているテーマ た…

目の手術から3年経過

a244.hateblo.jp 若年性白内障の手術してからまる3年経ちました*1。 もう3年、です。石の上にも三年といいますが、気がついたら三年です。 特に問題がないので書くことに困る状況……。 目に関しては問題なし。問題は耳の方ですね。右耳の耳鳴りと聴力低下。 …

財務省の公開した交渉記録PDFをいじる その2(本文データのOCR etc.)

過去記事の続き。やはり実際のデータでデータ処理をやるのは勉強になります。 ……お金になるかは別にして、Pythonという言語の習熟度は向上しているはず。 a244.hateblo.jp 方針 OCR処理 画像の抽出 画像をPDFに変換・結合 一括OCR JSON分割 タブ区切りテキス…

財務省の公開した交渉記録PDFをいじる その1(目次のPDF編)

自分でモロに忘れそうなので備忘録として。 作戦というか方針 データの入手 目次のOCR処理 目次ファイル 画像の切り出し Tesseract 4.x 目次のOCR 認識結果の例 OCR結果のテキストファイルの結合 まとめ 一時ファイルがじわじわと増殖するのでもっとスマート…

Google Cloud Vision APIで画像メインのPDFから直接OCRする(PDF/TIFF Document Text Detection)

この記事で紹介しているAPIは今のところベータ版です。正式リリースまでに仕様が変化する可能性があります。 [2018/09/04 追記] ドキュメントの翻訳はまだのようですが2018年7月24日付でGAリリースになっています。 PDF、TIFFともに2000ページまで。 PDF/TIF…

広告