著作一覧 |
翔泳社の野村さんからもらったので、なんとなく(ちょっと表紙のセンスが良いのと内容が想像できないこともあって)読み始めたら、これは妙だ。おもしろい。新しい。勉強になる。必読書の類にみえる。
とりあえず1章まで熟読、あとは流し読み時点で書いている。
内容は、GCPでこんなことができるよ(サンプルはhttps://github.com/GoogleCloudPlatform/data-science-on-gcpにあり、Cloud Shellで実行できるらしい)なのだが、読んだ限り単なるGCPの宣伝(こうすればダミー頭でも使えるので明日からデータサイエンティストみたいなやつ。ただしCloud Shellの使い方は図入りで解説されていて、かつ注で1年以上前のことだから今は違うかもみたいなことも説明されているが、ここはGCPの宣伝本としては本質なのだろうが、本書の内容からはそれほど重要ではないのも間違いない)ではない。
とにかく異様に頭の良い書き方がしてある(感心しまくっている)のがポイントだ。
まず課題が明確だ。その明確さによって、向き合い方、解法の探求、実問題への適用というそれなくして無意味であるところの、課題の汎化に対して大きく開かれている。そこがむちゃくちゃすごくて、読み始めると、あっという間にフォーカスされた問題と向き合わされる。
1章の冒頭で車を中古で売る時の例で走行距離計が数行取り上げられる。そこであっという間に改竄されていないか? という観点に触れられる。課題に対する見方の分岐の量、速度、種類が抜群なのだ。
読者対象として、データアナリスト、データベース管理者、データサイエンティスト、システムプログラマと並べたあとに、衝撃的な展開がある。お前ひとりでこれら全部のロールをやれる、そのようにシステムは進化したのだから、そうしろ。良い時代だろ? そうなのか。そう、GCPがあればね、とジョブズ風なプレゼンではなく、どのインフラがどうなっていることで、どの領域についての考慮点を減じることができ、というのがほぐされていく。しかし、それにしても、頭良いな、こいつ。
書いたのはGoogle CloudのPS部門のリーダーだそうだ(謝辞を読むとやたらと広範にわたって協力関係もある)。翻訳しているのは米系企業でデータを扱っていたりソリューションアーキテクトをしている人たち。ここで(訳者紹介は「はじめに」の直後になるからだ)ちょっと潮目が少し変わったような気がしたわけだが、確かに違う(もちろん、僕が最近の潮流についていけてないだけかも知れないが、そんなに大きくは外しているとは思えないので多数の人にとっても違うのではなかろうか)。
原書の出版が2018年1月なので1年半遅れだが、上記のように日本の僕の認識とのギャップから考えても、見た目の時間よりも遅くはないと思う。
はじめにを読んでいてえ?となったのは、本書がオライリーだということで、原書も動物シリーズではないのか、それとも版権の都合でこうなったのかは知らないが、ちょっと驚いたのだった。
スケーラブルデータサイエンス データエンジニアのための実践Google Cloud Platform(Valliappa Lakshmanan)
ジェズイットを見習え |