今週のふりかえり(2018年6月第4週)
スポンサーリンク
雨は売っと惜しいけど、晴れの日に風が吹くといい感じ。
あと一週間で6月もおしまい‥…。
今週の学び
- 仕事は着手前の準備、リスク調査が大事
- OCRは前処理が命
- 人間、焦るとダメ
- 「仕事を選ぶな」ではなく「客を選べ」
- 途中まで作業した成果物を放棄してやり直す勇気
お金という結果が見えないとがんばれない。にもかかわらず、お金のために割り切れない。
中国語に関して
Twitterのやり取りを見てちょっと中国語に興味が湧いてきた。
つくづく専門用語や業界用語を表すの中国語が最強だと思う。来た当初はなぜ頑なに英語を使わないのかと頭を抱えたけど、二、三文字で意味も完全に表せるの凄い。個人的に感動したのがデフォルト:黙認値、トラッキング:跟踪。長年日本語ではうまく言い表せなかった概念をスパッと言い切っていて爽快。
— Hayakawa Ayako (@AyakoHayakawa) 2018年6月23日
中国語をゼロからはじめる初心者におすすめの参考書と勉強法をまとめてみた - 4ヵ国語を勉強するブログ
最近の読めなかった単語など
- 慫慂:しょうよう
お役人様ぐらいしか使わないのでは……。
その他・ノウハウなど
sedやgrepでは正規表現の前方先読みや後方戻り読みは使えない。perlやrubyによるワンライナーの出番。Pythonでもできるみたいだけどあまり向いているというワンライナー用の言語というイメージはない*1。
実行する際は、-i
オプション無しでテストしてから。
Rubyで大量のファイルを一気に置換する例(gsub
メソッドの引数を対象に合わせて変更):
$ ls source/_posts/entry-* | xargs ruby -i -pe '$_.gsub!(/パターン文字列/, "文字列")'
ag
コマンドの検索結果に対する例(電話番号の一部を伏せ字に):
$ ag -l '\d{4}-\d{4}' source | xargs ruby -i -pe '$_.gsub!(/\d{4}-\d{4}/, "****-****")'
xargs
はmacOS付属のものを前提にしています。Linux付属のものと挙動が違うケースがあるので(この例はともかく)複雑なことをやる際は注意が必要です。
ソフトウェア開発関連
Electron 入門
なかなか良さそう。
apac
関連:amazonアフィリエイト、無料ツールまとめ(17サイト) - NAVER まとめ
今週の思いつき
- スマートフォンを活用すれば直接民主主義、可能では?
- 手書き文字認識用の学習データセットをつくりたい
- どの程度のデータ量が必要化検討
- データフォーマットをどうすればよいか
- データの保存コスト
- 既存のデータでやってみて検討
- かつて一世を風靡したバー◯ードバトラーのQRコード版とかどうだろうか
誰かが作ってくれないかな、改変再配布可能な(日本語の)手書き文字認識用の学習データセット。
今週試したソフトウェア or サービス
babylink
http://babylink.herokuapp.combabylink.herokuapp.com
McGimp
広告カスタマイズの無効化
Googleのインタレスト広告の設定が可能。英語のページに切り替わる。
フリーフォント
macOSのフォントに関して
macOS High Sierra に組み込まれているフォント - Apple サポート
改変したりフォントデータを取り出して販売するのでなければ商用可らしい。
読んだ本
Software Design総集編
- 作者: Software Design編集部
- 出版社/メーカー: 技術評論社
- 発売日: 2018/05/26
- メディア: 単行本
- この商品を含むブログ (1件) を見る
2016年代の号と2017年代の号の特集をピックアップして読んでいる。毎年同じような特集テーマのループぶりが面白い。
特集テーマからキーワードの変遷を分析するのもいいかも、と思ったり。
気になった本、サイト、etc.
本・商品・プロダクト、その他の興味が湧いた何か。
情報源
- CommonMark:Markdownの統一仕様
保育所のリストを作るためのリンク元
買わなかった本
Software Design 2018年7月号
- 出版社/メーカー: 技術評論社
- 発売日: 2018/06/18
- メディア: 雑誌
- この商品を含むブログを見る
またエディタの話かよってことで不買。
『Pythonプロフェッショナルプログラミング 第3版』
- 作者: 株式会社ビープラウド
- 出版社/メーカー: 秀和システム
- 発売日: 2018/06/12
- メディア: 単行本
- この商品を含むブログを見る
※ はてなの「Amazon商品紹介」が機能していないです(💢)。→はてなのサポートに連絡したところ対処済み(2018/6/27)。
結局買わなかった。コンセプトは非常にいいと思った。ただ、発売タイミングが微妙すぎる。前提とする環境が、Python 3.6.4なのはまあいいとして、ほかが微妙。
さすがにUbuntu に関しては18.04 LTSのリリースを待ってから発売すれば済む話では?
紙の本というのはWebと違って書き換えられない訳で、そういう意味では発売タイミングはもっと考慮して欲しかった。
Djangoの1.xにはLTSバージョンがあるみたいだけど。ほんの数ヶ月遅らせれられなかったのかな。
Djangoの話題はテストとWeb開発の箇所だけで大部分の内容は良いと思った。
ぶっちゃけ、自社用の研修ドキュメントを外販してるんじゃねぇのって感じはするけど内容は良さげ。
Django の対象バージョンが2.xだったら間違いなく買っていたと思う*2。
購入したもの
スラスラ読める JavaScript ふりがなプログラミング (ふりがなプログラミングシリーズ)
- 作者: リブロワークス,及川卓也
- 出版社/メーカー: インプレス
- 発売日: 2018/06/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
- 作者: 小笠原みつき,西村公宏,柳佳音,志甫侑紀,池田友洋,木村涼平,?橋優介,大塚雅和,飯塚直,吉川竜太,末永恭正,久保田祐史,浜田真成,穴井宏幸,大島一将,桑原仁雄,牧大輔,池田拓司,はまちや2,竹原,WEB+DB PRESS編集部
- 出版社/メーカー: 技術評論社
- 発売日: 2018/06/23
- メディア: 単行本
- この商品を含むブログを見る
Web+DB Pressのこの号は当たり号。参考になる。
アウトプット
過去記事のとおり、財務省の交渉記録(売却まで)の分をWeb化した。
Adsenseの自動広告を試験的にセットしていますが、そこに広告入れるの?って感じのところに広告が入る……。
はてなブログ
- 書評:『達人に学ぶDB設計 徹底指南書』 - ながいものには、まかれたくない
- Tesseract OCR 近況(2018/06) - ながいものには、まかれたくない
- はてなブログpro、(課金期間が)停止。 - ながいものには、まかれたくない
- 財務省の公開した交渉記録PDFをいじる その3(本件終了) - ながいものには、まかれたくない
- Gimp 2.10.x macOS版について(McGimp 2.10) - ながいものには、まかれたくない
- 「機械学習で男性エンジニアを女性に」という炎上案件について - ながいものには、まかれたくない
最近のPython-devとか、最近のruby-coreみたいにOSSの追っかけ記事がネットに増えるといいなと思ったり。
今週の気づき&まとめ
なんだか今年もあっさりと半分終わりそう。