残した言葉、届いた本

※この記事は、著者らのご厚意でご恵贈いただいた『先輩データサイエンティストからの指南書 -実務で生き抜くためのエンジニアリングスキル』(技術評論社)についての記事です。
元所属会社のよく知るメンバーたちが執筆したということで張り切って書きました!

 

===

8年勤めたブレインパッド(BP)社を辞めるときに、社内限定公開の長いブログを1つ残しました。
当時僕が長年感じていた「BPデータサイエンティスト部の課題」についてまとめたものでした。
それは退職間際の憂さ晴らしではなく、8年も勤めたのに自分の手で解決できなかったなぁという懺悔集の気持ちで書き、在職の人たちに託すというものでした。

その中の一つに、「知の高速道路が整っていない」ということについて書きました。

僕の時代は新卒データサイエンティストは数年間をメンバーとして先輩データサイエンティストPMの元で働き、経験とスキルを積んで自身もPMになるというのがデータサイエンティストの王道ルートでした。
「データサイエンスで有名なBPに入ったのだから、他社と比べても圧倒的に早くデータサイエンティストとして成長できるはず」という期待をもって入社した新卒は多いはずです。
しかし、年間に圧倒的な案件数をさばき、組織も仕事方法も進化しているはずなのに、それらの知識の集積を使って新しい新卒が僕達の時代よりもより早く技術を習得し、より早くPMになれているかというとそういうわけでもなく、なんならPMになるために必要な年数は硬直化しているようにも見えたからでした。

「近年ほど案件の難易度が上がっている」「案件が多種多様なので知識を共通化しにくい」というのが困難な理由として当時挙げられていましたが、その中でもある程度共通に頻出する技術についてはベースラインとしてまとめられるべきでしたし、それを年ごとにアジャイルに逐次改善できたかもしれません。僕の場合は端的に、そこまでコミットをする気持ちを持てなかったというのが大きかったです。

 

先日、著者のうちのお二人 @nash_efp@suikabar_umai とご飯に行ったときに、僕の懺悔ブログの高速道路不在問題も意識して執筆したんですよと教えてもらい胸アツな気持ちになりました。
データサイエンティストとして成長する知の高速道路の敷設には具体的なノウハウのベースラインが必須であり、本書はその一つを社内に留まらず社外にも公開したということになるようです。

技術書を書くなら、ある特定分野の「基礎から応用まで」のような内容が多いなか、入門者の間口を広げるような、ある意味で広く浅く、入門者が知るべき内容をコンパクトにまとめて公開してくれるのはまた格別の尊さがあります。
社内限定高速道路だったかもしれないものが、こうして一般道として書籍という形で広く公開されたのこそBPらしいというか @nash_efpたちらしいというか、退職のときにブログを書いた身としてはとても胸いっぱいになる書籍です。

そんな観点でみると、「先輩」や「指南書」という、ちょっとクセのあるワードが並ぶタイトルですが、筆者たちの思いが届くんじゃないでしょうか。ぜひ書籍を手にとってみてください。
8/27、amazonでも本日発売のようです。

https://www.amazon.co.jp/dp/4297151006


余談
タイトルにもある「エンジニアリングスキル」についてはBPデータサイエンティストから事業会社に転職した自分も感じることがあるので与太話として書いてみます。

現場でデータ活用系の仕事をしていると、遅かれ早かれ、データの上流に食い込まないと本質的な改善ができないのではないかと感じる人が多いと思います。
一方で、BPのように受託分析の「データサイエンティスト」として単価をもらっていると、「上流を綺麗にする」活動はあまり歓迎されません。もっと(単価を説明しやすいような)わかりやすい成果物がでてくる業務をやることを期待されるからです。
それならいっちょ事業会社にでも転職して挑戦してみようと思う人がでてきます(僕のそのうちの一人でした)
さて、希望通りデータの上流で仕事をする機会が得られたとします。その場合、大きくはデータチームや組織の戦略・マネジメントをする人と、より現場側でデータマネジメントをする人に分かれるパターンがあるかなと思います。
データマネジメント側に行く場合、これまで下流でデータと格闘していた人たちが躓きがちなものの一つに、(データ)エンジニアリング的なスキルが足りないというのがありそうです。
昨今のデータマネジメント領域は往々にしてBI向け・プロダクト向けに綺麗なデータを生成する「データプロダクト」的なものを作るニーズが増えている印象です。これまではデータの下流でデータ活用する"人間"に綺麗なデータを渡すために頑張っていましたが、2025年の渡したい相手は"AIエージェント"であり、この潮流により益々データ基盤やデータプロダクトを作るニーズが強くなっていると感じています。
名前にデータ"プロダクト"とついている通り、本番環境にリリースして継続的な改善を必要とするようなプロダクト開発手法、その手法を実現するためのアジャイルな開発チームのお作法を知る必要があります。これはデータアナリスト/サイエンティストとしてこれまで行っていたアドホックな分析、アルゴリズム開発、一定範囲・一定期間動けば良いモデル開発とは大きく仕事の方法が異なります。
受託分析のようなクライアントワークをする人たちにはコミット期間が定められるので、プロダクト開発のような長期間の息の長い仕事に関わる機会は少ないはずです。機会がないがゆえにスキルギャップに苦しむ場面は多いかもしれません。
データ分析を代行するAIエージェントが本格的に登場しつつある昨今で、下流のデータサイエンス/データ分析だけをする現場は少なくなっていきそうです。データに関わる人は本書にあるような"実務で生き抜くためのエンジニアリングスキル"がますます必要となり積極的に補完していった方が良さそうというのは僕も賛成です。自分も引き続き学習の日々です。