今日も微速転進

ここではないどこかへ

『画像認識(機械学習プロフェッショナルシリーズ)』という本(の装丁)が素晴らしいという話


スポンサーリンク

内容がダメとは言ってませんので念のため。 

画像認識 (機械学習プロフェッショナルシリーズ)

画像認識 (機械学習プロフェッショナルシリーズ)

Amazonで評判が良いので購入した本。

組版・装丁もいい感じ。意外なことに2色刷りかと思ったらカラーだった。随所にカラーの画像が入っている。それでいて普通のカラー印刷の本と違って厚めの光沢紙じゃなくて薄めの白い紙*1

印刷所の仕事か出版社側かは知らないけど、某料理漫画風に「シェフを呼べ」って感じ*2

内容についても書きましたが、この記事のもっとも重要な主張は、

こういう装丁のカラー印刷の本が増えて欲しい

ということです。

出版社のサイトなど

2014-2016年あたりにWebで見かけたキーワードはほとんど解説されているように見える。基本的に広く浅く系だけど俯瞰的。

紙媒体の方を購入してからKindle版が販売されていた。

画像認識の入門として執筆したというだけあって、1〜6章は基礎的な内容。7章以降は前半の内容を前提に、機械学習(特にニューラルネットワーク)による応用に用いられる手法の解説。

良いと思った点

  • 画像認識特有の話題を解説している
  • ほとんどの専門用語にカッコ書きで英語表記が書いてある
  • 説明の図が多い
  • 図版がカラー
  • 紙が薄くてページ数も手頃なので重たくない

英語の文献を読んだり検索するときに専門用語に対応する英単語が記載されているとすごく助かる。

気になった点

  • 図の文字が小さめ
  • 読んだだけでプログラムに落とし込むのは困難
  • 関連手法の解説カタログと化している?
  • 数学力がないと理解できない

最後の数学力に関しては読む側の問題だけど。

『こういう分野でこういう手法が用いられており〜こういう欠点がありそれを克服するにはこういう要件を満たす必要があり……。そこでこういう手法が提案されています。ここではXXXを解説します。……。』という感じの箇所が多数あり、各種手法の解説を延々繰り返しているようなところがある。

こういう応用例でこういる手法が成果を上げている、とか、こういうケースでこの手法を用いることで認識率が改善した、という応用を意識した情報が少ないのが残念。

学術書なので仕方ないんだろうけど、計算量を減らすとか、特定の要件を満たすのはもちろん重要だけどアプリケーションに応用したい立場としては何とかして欲しいところ。

その手法が提案された経緯についての情報はもちろん有意義*3なんだけど、現状のベストプラクティスとしてはこう、という方がありがたかったかも。

個別の手法の解説に加えて、特定の応用事例についてもう少し詳細な解説があると要素技術の理解を深めるのに役立つのではないかと思う。

参考文献に記載されている論文を頑張って読めという話なのかな。

まとめ

内容はざっくり読んだだけで理解し切れていない。解説されている手法の処理の流れはある程度掴めるんだけど、具体例としてプログラムをかけるかというとお手上げ。擬似コードでアルゴリズムを説明している箇所は問題ないけどこの記号なんだっけ……で止まってしまう。 

ここ最近Qiitaや技術系のブログで見かける専門用語について解説している点は非常に有意義で、購入した価値はあった。少なくともOpenCVなどのライブラリを使う際に、ドキュメントを読んだ時の挫折感は軽減しそう。

学生時代にもっと数学勉強しておけば良かったと思うことしきり。

*1:アスキーの技術書に近い雰囲気

*2:もちろん組版と装丁を褒めるために

*3:その場合は研究分野の歴史として人間ドラマとセットにすると面白いと思う

広告