今週のふりかえり(2018年5月第2週)


スポンサーリンク

振り返るだけじゃだめなんですけどね。何もしないよりマシ。

健康問題で足踏みしている間に世界はどんどん進んでいく。

目の病気で会社を辞めたときも思ったことだけど、人がリタイアしても動き続ける会社と社会って(一種の化物という意味で)すごいですよね。

労働力不足を叫んでいるけど、お金欲しさに必要もない無駄な事業をはじめて、その無駄が無駄を読んでいるわけだから実際は困らないんじゃないかな。

今週の学び

やっぱり欲が大事

note.mu

なかなかいい記事。

我慢ばかりしていると心が死んで欲がなくなる。

「やりたいことはなんですか」とか訊かれて本気で回答に困る。

減り続ける貯金残高を見ていると、何を見ても「やめておこう」という発想になる。

さっさとベーシックインカムが実現するとこういう事例はかなり緩和するだろうし、鬱に札束が効くというのも道理だと思う。

補聴器開発関連

以前言及した論文の解説がGoogleのブログで解説されている。応用として"hearing aid"とはっきり書いてある。

ai.googleblog.com

ただこの場合、カメラ付きの補聴器、スマートグラスをベースにするか必要があるように読める。音が聞こえないと振り向けないけど、顔を向けている先の視界内内の相手の声をうまく分離してくれるのはかなり有益なはず。

視線トラッキングで視線を向けている対象者がしゃべった時に音声を抽出できるといいかも。ただ、やっぱり複数人が同時にしゃべらない、と言うのは必要だと思う。

話者識別は事前に学習データを集めて学習させる必要があるらしいけど、このGoogleの論文の方式だとカメラとマイクの入力が対応していればいいっぽいのでその点は実用的な気がする。

プロジェクトページ:Looking to Listen at the Cocktail Party:
Audio-Visual Speech Separation

Microsoftも障害者向けAIはいろいろやっている模様。

www.microsoft.com

なお、話者識別自体はMSのAPIで学習データさえあれば以前からできるらしい。

話者識別はinterface誌の別冊にも事例がある。

"hearing aid deep learning"で検索すると結構ヒットする。要調査。

文字認識関係

[速報]モバイルアプリに顔認識など機械学習の機能を組み込める「ML Kit」、Googleが発表。Google I/O 2018 - Publickey

ちゃんとText recognitionというワードが入っている。 手書きはともかく、スマートフォン側で高精度に文字認識できるのは大きいはず。

その他・ノウハウなど

blog.craftz.dog

現状特にやることがない。ただ、国内サービスからあまりこのEUの法律に関する動きがないのがちょっと気になる。EU圏内からの利用者はほとんどいないのか。

今週試したソフトウェア or サービス

Voice Kit/Vision KIt 用Raspibian

とりあえずmicroSDに焼いただけだけど、Voice Kit用のRaspbianが更新されている。Vision KitもVoice Kitも兼用らしい。

github.com

Voice KItはVersion 2.0がリリースされている。こんどはRaspberry Pi Zero WHとセットでmicroSDにソフトウェア一式セットアップ済みとのこと。

ただし今のところ国内販売はなし。

基板サイズがコンパクト化しているので、Pi Zero ではなく通常モデルと組み合わせるとカメラケーブルと鑑賞しなくて良さそうにみえる。

engadget、RSS登録しておいたほうがいいかな。

ソフトウェア開発関連

ImageMagick の使い方

imagemagick.rulez.jp

いつも忘れてググるのでとても助かる。

PyPDF2の後継プロジェクト

github.com

PyPDF2のメンテナンス体制を刷新して、新プロジェクトとしてPyPDF3を始めるらしい。

ロードマップ:Roadmap · mstamy2/PyPDF3 Wiki · GitHub

敬意:Rebooting PyPDF2 Maintenance · Issue #385 · mstamy2/PyPDF2 · GitHub

気になったもの

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識

  • 作者: Gary Bradski,Adrian Kaehler,松田晃一,小沼千絵,永田雅人,花形理
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2018/05/26
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

買わないけど厚みがヤバそう。

フォント

bizplus.morisawa.co.jp

デスクトップフォントの利用規約を読む限り商用利用は可能。フォント埋め込みもOKの模様(間違ってたらごめんなさい)。

IPv6

IPv6本 脱稿しました:Geekなぺーじ

電子版無償配布する予定とのこと。これは期待。

製品

basefood.co.jp

以前に名前を聞いたときはピンとこなかったけど。 コスト的に微妙な感じだけど、試してみたい。

面白いと思ったサイトなど

機械学習を学ぶための教材

arXivTimes/materials at master · arXivTimes/arXivTimes

ワンボードオーディオ

www.1baudio.net

読んだ本

『おしゃべりなコンピュータ 』

おしゃべりなコンピュータ 音声合成技術の現在と未来 (丸善ライブラリー)

おしゃべりなコンピュータ 音声合成技術の現在と未来 (丸善ライブラリー)

2015年の本。隠れマルコフモデルの説明はいまいちだと思ったが全体としては読みやすい。

率直に申し上げて、ドラえもんネタはうざいのでやめて欲しい。みんながドラえもん好きな訳がないだろうに。

同時通訳に関する箇所に「萌える法律本」が云々という記述がある。そもそも「萌える法律読本」が存在したことを知らないのか。
著者が複数だからかもしれないが、中途にオタク文化に理解のあるようなふりをしているのは残念。

補聴器関連に役立ちそうなキーワードとしてはロンバード効果。騒音下で会話する際、自然と聞き取りやすいようにはっきり大きく話すらしい。

周囲の環境を自動的に検出してモードを切り替えるような仕組みを仕込めるといいかと思った。

あとはアメリカの障害者関連の法律で、情報アクセスに関するものが紹介されていたのは勉強になった。

どおりでiPhoneにVoiceOverが搭載されていたり、Mac製品の起動時に初期状態でVoiceOverが喋りだすわけだ*1

  • The Americans With Disabilities Act (ADA)
  • The Communications and Video Accessibility Act
  • Twenty-First Century Communications and Video Accessibility Act of 2010 (FCCV)

ただし、3つ目は言及されていない。

参考:情報アクセシビリティ:ICTを活用した情報支援

購入したもの

Pimoroniでボタンユニットとタッチセンサーみたいなのを発注したが届いてない。

アウトプット

厚生労働省ブラック企業リスト4月版(2018年) - ながいものには、まかれたくない

コンテンツ産業とお金の行き先(仮) - ながいものには、まかれたくない

オライリーの翻訳本に魅力を感じなくなってしまった - ながいものには、まかれたくない

Androidのアクセシビリティ機能に関するメモ - ながいものには、まかれたくない

まあポエム記事に関してはそっとしておいてやって下さい。

あとつたない英語でgithubで質問を投げかけたりなど。

過去記事の更新

日本語のOpenCV 3.x 本の比較 - ながいものには、まかれたくない

今週の気づき&まとめ

思うところあってプチ断食に取り組んだり。4日目ぐらいまでは野菜ジュースだけでも意外と空腹を感じなかった。

生理的欲求まで「死んで」しまっているようで怖い。

プチ断食の効果として鼻炎がマシになったみたいな気がするが、体力・筋力・気力が大幅ダウンするのでおすすめできない。多分もう2度とやらない。

耳鳴りはましになっておらず、あきらめムード。治そうとあがくのが良くない気がしている。

ブログを書くという行為が代償行為になっているというか、ブログを書くだけで満足している感じがある。その点を踏まえて次回からふりかえりは隔週にするかも。

*1:VoiceOverが初期状態で有効になっているおかげで、Mac製品なら全盲か弱視でもほぼ一人でセットアップできるはず。電源の接続とかは支援がいるとは思うけど

広告