今日も微速転進

ここではないどこかへ

書評:『10年戦えるデータ分析入門 』


スポンサーリンク

写経(というかSQL手打ち)は一部のみ。

概要

サポートページ:『10年戦えるデータ分析入門』サポートページ

少し変わったコンセプトの本。

データ分析と入っても機械学習とは違う。定形データ、それもアクセスログを題材に解説している。

建前としてエンジニアとエンジニア以外の人を対象読者にしている。

著者は『ふつうのLinuxプログラミング』『ふつうのHaskellプログラミング』で知られる青木 峰郎氏。個人的にはRubyの人というイメージなのでSQLの本というのは意外な感じ。

対象のデータベースはPostgreSQL。他のRDBだとwindow関数関連の箇所で上手くいかない可能性あり。

内容について

二部構成で第1部(1章から10章)がSQL、第2部(11章から14章)はデータベースを中心に据えたデータ分析基盤と構成要素の解説。
構成としては(著者自身が認めているとおり)中途半端。

発行日が2015年なので一部の記述はやや陳腐化している部分があるかも。

第1部

SQLをデータ分析のためのツールとして解説するというコンセプトは非常にいいと思った。SQLの解説書としては偏った内容。

リファレンスではないので分析関連の機能を網羅していない。

本文にはサンプルデータのロード方法の解説は記載がなく、サポートページの手順を読む必要あり。

なお、分析のためのSQLという観点では他にも書籍がある。

また、Software Designの総集編のバックナンバーにもSQL特集で解説がある。

第2部

データ分析基盤をどう構成すればいい、要件や要素技術の解説。実際にログデータを集めて分析しようとする際には参考になりそう。

SQLバッチ処理するうえでのノウハウなど、あまりWeb上に無い話題が紹介されているので読んで損はない。

感想

基本的にDBをWebサービススマートフォンアプリのデータ保存のためにしか使っていないのでかなり勉強にはなった。

正直に言うとSQLでデータ分析をするという視点がまったくなかったのでそれだけでも読んだ価値があった。

ただ、技術系以外の人間が読む本かというと厳しい。コンセプトはいいと思うが対象読者に関しては無理がある。第2部だけ切り離してマネジメント系の人向けの 記事にしたほうが良かったのでは似かと思う。

ビジネスにデータ分析をどうつなげるかという点だと『仕事で始める機械学習』のほうが参考になるかも知れない。

実際に分析目的でSQLを使いこなすには反復作業で量をこなす必要がある。

まあ直ぐに必要になりそうな感じではないけど、SQLは勉強しておいて損はないはず。

広告