今日も微速転進

ここではないどこかへ

2018-05-01から1ヶ月間の記事一覧

厚生労働省ブラック企業リスト5月版(2018年)

今月はデータ自体が公開されないのかと思いましたよ……。 月末にギリギリで出してくるとは。 a244.hateblo.jp またこのネタかって感じもしますが当面は続けます。 データの入手元 機械可読データ(タブ区切りテキスト形式) PDFからTSVへの変換スクリプト 前…

PDFからコマンド操作で画像を取り出す方法

PDF

財務省やらかし案件がらみで。PDFを画像化するのではなく、内部に含まれる画像を取り出そうという話です。 財務省の公開しているPDF,差し替え前の黒塗りが外せる状態のPDFが入手できるとのこと。 security.srad.jp これはOCRやり直しか……。 ページ数とPDF内…

音に関する信号処理についてのプログラミングの本いろいろ(たぶん随時更新)

音声かそれ以外かは問わない。 信号処理の本を買えばいいはずなんだけど、理論の本だとプログラム化するノウハウが載ってなさそうだし、ハードウェアの話をされても困る。 ハッキリとプログラミングについて説明しているであろう書籍だけピックアップ。 サウ…

今週のふりかえり(2018年5月第3, 4週)

試験的に隔週でいってみます。 今週の学び Amazonアカウントの新規作成 その他・ノウハウなど Skype番号 今週試したソフトウェア or サービス JSON Viewer (Python) 英語学習系app さくらのメールボックス、契約更新 ソフトウェア開発関連 gsutil tmux とb…

財務省が国会に提出した交渉記録PDFに関して

財務省が国会に提出したらしい「森友学園」との交渉記録のPDFの件。あまり政治ネタはどうかな、と思いつつ。 結論:某新聞社のサイトじゃなくても財務省のページから入手可能。 おかしな連中にPVを献上するのはやめて、財務省のサイトへGo。 某新聞社がPDFを…

日本語OCRのためのJIS漢字などに関するメモ書き(随時更新)

ちょっと中途半端な感じがするけどせっかくなので。 JIS漢字というか主に第三水準、第四水準の漢字についてのメモ。 第二水準漢字ですら、そもそもどういう文脈でどういう語に使われるのか、さっぱり分からない字が多い。 前置き 漢字のリスト MJ漢字 参考に…

書評:『ゼロから作るDeep Learning 』

もっと早く買えばよかった。そしてもっと早く読み始めればよかったと思う。 すでにいろんな方が書評を書いておられるので無駄な気もしますが、一応。 概要 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メー…

Voice UIと各種障害者への影響についてのちょっとしたメモ

音声で何かを操作するユーザーインターフェイス(User Interface: UI)、Voice UIと各種障害についての思いつき。 めんどうなので障害者の表記がどうとかそういうクレームは受け付けません。 障害者への影響について、あまり話題になってない?ように思える…

書評:『PDF構造解説』

購入してから全部読み終えるまでに時間がかったのと、途中の章を飛ばして読んだりしたのでちょっと消化不良なところがある。 結論から言うと母国語で書かれた書籍は偉大。英語の仕様書数百ページとか読む気がしませんよってところかな。 必要に迫られたら読…

macOSでOpenMHAをインストール

補聴器アルゴリズムの開発用のOSSであるOpenMHAをmacOSにインストールする手順です。 OpenMHAとは ドイツのHörTech gGmbHという非営利の補聴器システムについての研究団体?がオープンソースで開発・公開しているプロジェクト。 一般的なパソコンで動作し、…

ブログ開設から3年、というメールが届いた

特に思うところはない。 目の病気の手術を受ける前に、結果が思わしくなかったら愚痴の一つでも書こうと思って作ったブログ。まさか3年続くとは。 大抵のことは3ヶ月は続けられるんだけど、まさかの3年か。 問題は「はてなブログPro」を継続するかどうか。継…

紙の雑誌と電子版と中古市場と(+ Software Design 2018年6月号 感想)

久しぶりに紙媒体で雑誌を買った。そこまでは別にいい。全然普通。 一点、納得いかないのがその価格。 ソフトウェアデザイン 2018年6月号出版社/メーカー: 技術評論社発売日: 2018/05/18メディア: 雑誌この商品を含むブログを見る なお、このブログ記事のタ…

Coherent PDFでPDFを分割・結合してみる

PDFの分割・結合ネタの続き。と言うか落穂拾いみたいなもの。 試すだけ試してみました。 Coherent PDF (cpdf)、楽ができるかと思いましたが期待したようには動作せず。 PDFの目次データ(いわゆる「しおり」、PDFの用語で言うところのdocument outline)の扱…

今週のふりかえり(2018年5月第2週)

振り返るだけじゃだめなんですけどね。何もしないよりマシ。 健康問題で足踏みしている間に世界はどんどん進んでいく。 目の病気で会社を辞めたときも思ったことだけど、人がリタイアしても動き続ける会社と社会って(一種の化物という意味で)すごいですよ…

Androidのアクセシビリティ機能に関するメモ

一応あるということはわかった。特に目新しいネタが有るわけではないです。 基本 support.google.com ユーザ補助機能 視覚障害者向けの機能はちゃんとある。 macOS/iOSのVoiceOverに対応するのはTalkBack。 聴覚障害者向けとしては一応、「字幕」というのが…

オライリーの翻訳本に魅力を感じなくなってしまった

自分自身の読解力の低下とか思考力の低下あるのかか。 オライリー以外の選択肢が増えたからかな。 昔ほどオライリーの新刊(翻訳本)にワクワク感を感じなくなってしまった。技術分野の多様化か、新しい技術にあまり興味がわかないのか? 昔はシンプルなレイ…

コンテンツ産業とお金の行き先(仮)

いいタイトルが思いつかない。中途半端な記事になってしまった。書き直すかも Twitter経由で面白い記事を読んだ。CDを捨てて音楽のストリーミングに切り替えたという話。 tamaranche.hatenablog.com 感想 ストリーミングのほうがCD買うより継続してアーティ…

厚生労働省ブラック企業リスト4月版(2018年)

遅くなりましたが、4月版。今年の5月で厚生労働省が企業名を掲載し始めてから丸一年ということになります。 このブログで追いかけているのは8月からですが。 a244.hateblo.jp データの入手元 機械可読データ(タブ区切りテキスト形式) PDFからTSVへの変換ス…

今週のふりかえり(2018年5月第1週)

もう5月。タイから戻って2ヶ月以上か。あの強烈なエアコンが懐かしい。 気候の面で過ごしやすさはバンコクのほうが上かな。真夏は別かもしれんけど。 今週の学び その他・ノウハウなど 今週試したソフトウェア or サービス ソフトウェア開発関連 気になった…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その3)

前回、前々回の続き。ようやく完成。 a244.hateblo.jp a244.hateblo.jp pdftkコマンドで目次(しおり)を追加 まずはpdftkコマンドの、update_info_utf8を使う方法。 コマンドの書式 $ pdftk input.pdf update_info_utf8 info.txt output output.pdf input.p…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その2)

前回の続き。PDFファイルに対する目次の追加は次回。 a244.hateblo.jp 前提 工程 スクリプト その1 その2 課題など 汎用性の問題 ファイルのパスの扱い Pythonスクリプトでハマったところ まとめ 前提 macOS Python 3.6 工程 PDFファイルの暗号化の解除(シ…

某雑誌の総集編から特定の連載記事だけ抜き取りたい (その1)

PDFの目次?部分をパースすればいいかと思ったらまたしても単純ではない……。 やりたいこと 方針および手順 課題と方式検討。 準備 暗号化の解除 ページ番号の取り出し pdftk のセットアップ 使用方法 連載記事名とページ番号の取り出し 出力例 まとめ やりた…

広告