Photo by Troy Jarrell on Unsplash

データサイエンス業界では世界中で有名で、データサイエンスのベンダイアグラムの考案者であり、Machine Learning (機械学習)for Hackersの著者でもあるDrew Conwayが、最近ニューヨークのデータサイエンス・シーンに関する話をこちらに投稿していましたので、本人の許可をとってこちらに翻訳して見ましたので、ぜひみなさんにも読んでいただき、日本でのデータサイエンスシーンを盛り上げていくためのインスピレーションになればいいなと思います。

(以下筆者による日本語訳)


New York City: Data Science’s Best Bet for Growth and Opportunity

データサイエンスのさらなる成長と機会にとってなぜニューヨーク市が最高の場所なのか

Original URL

Drew Conway - 9/29/2017

Why New York City?

“The [2008 financial crisis] created a perfect storm of talent exiting afflicted institutions and investment money fleeing the public sector markets.”

2008年の金融危機は、才能のある人たちがそれまで関わっていた組織から出てくるという意味でも、投資のお金が市場から出てくるという意味でも、パーフェィクな嵐を生み出しました。

First, some history

Contrary to popular belief, New York has actually always been a major data science hub. The reason New York is often overlooked as a cornerstone of the data science community is because almost all the city’s data scientists were previously locked within enormous institutions like banks, ad agencies, and major media companies. They held vague and cryptic titles like quant, statistician, or business intelligence analyst.

ニューヨークは実はいつも昔からデータサイエンスとなるべき人たちの宝庫であったわけですが、そういった人たちは金融、広告、メディアなどと言った既存の大きな会社の中に閉じ込められてたわけです。彼らは何だかよくわからない職のタイトルを使っていました。例えば、クアント、統計学者、BIアナリストなどと言ったようにです。

Instead of thinking of themselves as a community that could leverage their expertise to transform how data is used, they maintained focus on building specific analytical tools and products for their own particular domains of expertise. This went on for years.

But then something really tragic happened: the financial crisis of 2008, which delivered a huge blow to the city of New York; to both its denizens and its businesses. However, out of this calamity came an opportunity. The crisis created a perfect storm of talent exiting afflicted institutions and investment money fleeing the public sector markets.

それが2008年の金融危機がすべてを変えます。これはニューヨーク市には大きな一撃でした、特に現実を否定してきた人たち、そしてビジネスにとってです。しかし、こうした中でいい機会も芽生えます。つまりこの危機は、才能のある人たちがそれまで関わっていた組織から出てくるという意味でも、投資のお金が市場から出てくるという意味でも、パーフェィクな嵐を生み出しました。

Most significantly, New York’s data scientists started coming together to talk about their work and ideas. This gathering of diverse backgrounds and experiences spawned a unique, cohesive data science community that, quite frankly, doesn’t exist anywhere else in the world.

これを気に、ニューヨークのデータサイエンティストたちは彼らの仕事やアイデアを一緒に話し始めるのです。こうしたさまざまなバックグランドと経験を持った人たちはユニークで特別なデータサイエンスのコミュニティーを生み出すわけです。正直言って世界中見渡してもこんなコミュニティーは他に存在しません。

Diversity of talent and of thought

“As a diverse group comprised of skeptical academics, social sector employees, and public and municipal organizations, data scientists in NYC deal with the question of how data is really serving people on a daily basis.”

そして、こうした人達が一緒に集まって色々とアイデアを出し合うために頻繁に集まり始めます。

One of the reasons New York’s data community stands out from the rest is that it is the best at recognizing the need for both natural sciences and social sciences to come together to do truly great and innovative data work. Part of our job as data scientists is to be good at math and modeling complex systems, while also incorporating a deep understanding of human decision making, the most complex system there is. New York’s data science community is a diverse collection of talented data scientists who are uniquely able to balance and implement both of these components into their work.

ニューヨークのデータサイエンス・コミュニティーは自然サイエンスと社会サイエンスの重要性を認識していることです。 データサイエンティストのしごとというのは数学であり、複雑なシステムをモデル化することですが、それと同時に人間がどのように意思決定を下すのか、実はこれが最も複雑なシステムであります。)を深く理解する必要があるわけです。

New York’s data scientists have not only helped to build many innovative and successful businesses (AppNexus, Bitly, Tumblr, Kickstarter, Jet.com, Vimeo, Oscar Health, Enigma, Greenhouse, MongoDB, ZocDoc, OnDeck, Etsy, Venmo, Blue Apron, Fast Forward Labs, Clarifai, etc. etc.) but the Data for Good movement started here too. There are numerous New York-based organizations that have put using data for social good at the core of what they do, such as DataKind, Crisis Text Line, Murmuration, Mt. Sinai’s Arnhold Institute for Global Health, and Teachers Pay Teachers, as well as the NYC Mayor’s Office for Data & Analytics, founded in 2013 under Mayor Bloomberg.

ニューヨ−クのデータサイエンティストたちは多くのイノベーティブで成功していくビジネス(AppNexus, Bitly, Tumblr, Kickstarter, Jet.com, Vimeo, Oscar Health, Enigma, Greenhouse, MongoDB, ZocDoc, OnDeck, Etsy, Venmo, Blue Apron, Fast Forward Labs, Clarifai, 等) を作り出しただけではなく、世の中をよくするためにデータを使うというムーブメントも生み出しました。DataKind, Crisis Text Line, Murmuration, Mt. Sinai’s Arnhold Institute for Global Health, and Teachers Pay Teachersのように組織です。さらに、ニューヨーク市もデータに関する取り組みは先進的で、NYC Mayor’s Office for Data & Analyticsという専属の部署がブルームバーグ市長のもとに2013に作られています。

As a diverse group comprised of skeptical academics, social sector employees, and public and municipal organizations, data scientists in NYC deal with the question of how data is really serving people on a daily basis. They also take the time to step back and ask “Okay, there’s lots of good work happening, but what are the limits?” New York City’s density and diversity support this kind of questioning, by keeping all of us in direct contact with the users and consumers we’re hoping to serve.

Density as a forcing function

“If you work at a software firm where you sit by yourself and imagine what your customer needs or wants are, you’ll never be as successful as you could if you’re able to walk down the street from your office and talk directly to your customers.”

Bustling sidewalks and crowded subways aside, New Yorkers living in close proximity to one another has benefits for folks in enterprise businesses as well. A common challenge for many startups is the constant need to better understand their users. Who is using our product? How are they using it? What issues are they having? If you work at a software firm where you sit by yourself and imagine what your customer needs or wants are, you’ll never be as successful as you could if you’re able to walk down the street from your office and talk directly to your customers. New York City has more Fortune 500 companies than any other city in the US. It’s HQ central for so many industries: media, advertising, financial services, banking, fashion, large-scale retail… the list goes on and on.

スタートアップに共通するチャレンジはとにかくユーザーを理解することです。誰が使っているのか、どうやって使っているのか、どんな問題に直面しているのかなど。ニューヨークは多くのフォーチュン500にリストされるような大きな企業の本社がたくさんあります。そして、そういった会社に地理的に簡単にアクセスすることができますし、そういった会社でデータと関わっている人たちと知り合い、コラボレーションの機会を見つけるのは比較的簡単なことです。

In New York, we almost take it for granted that on any given day, whether it’s at Data & Society, at Insight Data Science, or at Civic Hall, there are conversations going on about what it means to be a professional data scientist. Instead of staying buried in a text editor all day, many of us are grappling with the ethical and social challenges that come with data science. And in New York City, there is an appetite to discuss and share the latest trends and topics in data science.

The community’s diversity and willingness to ask the “hard questions” about what we’re capable of are reflected in the ecosystem of companies that have emerged in New York. One of the biggest challenges currently facing all data scientists is a lack of a clear career trajectory. What does it mean to be a “Head of Data Science” or “Chief Data Officer”? At the moment there are now a lot of data scientists but not a lot of data science managers. What does it mean to develop leadership inside this community? What are the things that we need to do to create the next generation of data science leaders from all the people sitting in our big tent?

そして、ほとんど毎日のように多くのデータサイエンスに関するミートアップのイベントが毎晩のように行われ、そこで熱心にデータサイエンスのトピックが議論されています。現在最も大きな議論は、データサイエンティストとしてのキャリアパスです。データサイエンティストという職種はありますが、チーフデータサイエンス・オフィサー、データサイエンティストのマネージャーなどといった仕事というのはまだあいまいです。

The good news for the world’s future data scientists and managers is that building an innovative data team in New York is not only possible, but their best bet for opportunity and growth. The community’s diversity will allow them to combine methodologies that work well from fields with more established pathways like software engineering, scientific research careers, or product management, and mesh them with less obvious systems modeled after those in finance, healthcare, design, and media. Our ability to foster conversation and collaboration across these areas is what will eventually allow those of us in NYC to shape the trajectory of data science careers well into the future.

Interested in transitioning to a career in data science? Find out more about the Insight Data Science Fellows Program in Boston, New York, Seattle, and Silicon Valley, apply today, or sign up for program updates.

このニューヨークのデータサイエンスコミュニティーにとって、この様々なバックグランドを持つ人たちの集まりそのものが強みです。これが業界を超えて通用するデータサイエンスのメソドロジーを生み出すでしょうし、さらには成長と多くの機会を生み出すデータサイエンスのキャリアパスの創造につながるのではないでしょうか。


(訳ここまで)

ニューヨークには活発なデータサイエンスシーンがあって多くのデータ先進企業(MongoDB, Stackoverflow, Etsy等)が出て来ていますが、実はそれは2008年の金融危機(リーマンショック)がきっかけだったんですね。そして、そこにニューヨークの地理的、経済的利点、さらにコロンビア大学やニューヨーク市立大学といったデータサイエンスへの取り組みが先進的なアカデミアの協力が重なって、シリコンバレーを除けば他の地域には見られないほどのデータサイエンスシーンの盛り上がりを見せるほどになったわけですね。

話を日本に移すと、特に東京のような大都市はニューヨークといっしょで様々な業界の企業の本社がありますし、今はデータサイエンティストという肩書を持っていなくとも実は思った以上にそのポテンシャルを持った方がたくさんいらっしゃいます。ですので、今こそ、こうした力を結集させ、日本ならではのデータサイエンス、データ分析のメソドロジー、新しい手法、ベストプラクティス、などを共有できる場をもっと作っていく必要があるなのだなと強く思いました。

最後になりますが、今月の終わりにこのシリーズ最後の日本でのデータサイエンス・ブートキャンプ・トレーニングを開催します。もし周りに興味のある方などいらっしゃいましたら、ぜひお声をかけていただければと思います。よろしくお願いします!