What Data Scientists Really Do, According to 35 Data Scientists - Link
DataCampというオンラインでRやPythonを使いながらデータサイエンスを学ぶためのサービスがあります。そこで、DataFramedというポッドキャストをホストしているHugo Bowne-Andersonが、これまでの様々なデータサイエンティストに対するインタビューをもとにした考察をハーバード・ビジネス・レビューに寄稿していました。
ちなみに、このポッドキャストの方も、データサイエンス界では有名な多くのデータサイエンティスト(Github, Airbnb, Stackoverflow, RStudio, Mckinsey, Buzzfeed, Kaggle, etc.)にインタビューしていて、けっこうおもしろいので、英語が大丈夫な人にはおすすめです。
以下、一部抜粋。
少なくともテック業界においては、だいたいデータサイエンティストが何をしているのかが分かってきました。まず、データサイエンティストはしっかりとしたデータ分析を行うために、信頼に足るデータの基盤を作ります。次に、企業が成長するためのオンラインでの実験(A/Bテスト)を行います。最後に、ビジネスとカスタマーをよりよく理解し、より良い意思決定を行うために、機械学習のモデルを作り、パーソナライズされたデータを作ります。データサイエンスとは、特にテック業界においては、インフラ(基盤)、テスト(A/Bテスト)、意思決定のための機械学習、そしてデータ・プロダクトのことを意味します。
データサイエンティストが必要とするスキルというのは絶えず進化していますが、ディープラーニング(深層学習)は最も必要なスキルというわけではありません。インタビューした多くのデータサイエンティストが、ディープラーニングのモデルを作るための基盤をつくるよりも、新しいことをすぐに学び、ビジネスの質問にデータを使って答えるためのコミュニケーションがうまくできることのほうが重要だと言っていました。つまり、複雑な分析結果を技術的でないステークホルダーにうまく説明できるスキルこそが重要だということです。
これからデータサイエンティストとしてのキャリアを築いていきたいという人は、技術的なことよりも、質問する力にフォーカスするべきです。新しい技術というのは絶えず出てくるものですし、流行りもあります。しかし、クリティカル・シンキング、計量的なスキル、特定の業界、業務に特化したスキルというのはいつも需要があるものです。
産業、社会全般に影響をおよぼすデータサイエンスの革命はまだ始まったばかりです。データサイエンティストという職業は21世紀の最もセクシーな仕事であり続けるのでしょうか。もっと専門化されていくのでしょうか。それとも、プロフェッショナルの仕事をするほぼ全ての人たちに必要なスキルとなるのでしょうか。それは今のところまだはっきりしていません。
Hilary Mason(FastFowardLabのファウンダー、Accel Partnersというベンチャーキャピタルのデータサイエンティスト)は次のように言っています。
「10年後にデータサイエンスというものは存在するのでしょうか?私は、その言葉そのものがなかった時代を覚えています。そして、ウェブマスターという仕事のタイトルのように、それがなくなってしまうときが来ても驚かないでしょう。」