[データ入門]データサイエンティストって?

ネット社会に生きる私たちは情報にあふれたこの社会に見慣れてしまっていますが、一般へのインターネットの普及は1990年代とさほど遠い過去ではありません。私たちはまだ情報の海から価値を取り出すことを完全に熟しきれてはいないのです。

というわけで、日々加速度的に増加し続けるデータから価値を創出する、データサイエンティストという職業について今回は知っていきましょう。

インターネットを介した大規模なデータの収集・活用の研究が進んだのは計算機の処理性能が大きく向上した21世紀。
データサイエンスという単語がより広く使われるようになったのはここ十数年のことです。

情報化社会の生み出す定型のない膨大なデータ(ビッグデータ)をそのまま解析にかけることは難しく、それを利用しやすい形式へと変換し分析する、図形やグラフを用いて視覚化する、などといった課題を担うのがデータサイエンティストです。
人間にはわからないデータに潜む傾向やパターンの特定のため、機械学習や深層学習などのモデルを作成することもあります。

AIの定義同様、データサイエンティストも役割や仕事内容がはっきりとは定まっていないのが現状ではありますが、データサイエンティスト協会では必要な能力を以下のように定義しています。

・ビジネス(business problem solving)力:課題背景を理解した上で、ビジネス課題を整理し、解決する力

・データサイエンス(data science)力:情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力

・データエンジニアリング(data engineering)力:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力

データサイエンティスト協会

これらの能力を育むために数学や統計学、計算機科学と幅広い見識が求められます。

データサイエンティストに求められる知識
・ビジネス知識 ・ITセキュリティ知識 ・データベースに関する知識
・統計学、数学 ・プログラミング ・データの可視化に関する知識
・機械学習 ・深層学習 etc.

その中でも小規模データの分析のためにも必須となる統計学の基本から学んでいくことにしましょう。

「AI」や「ディープラーニング」と比べると「データサイエンス」は耳にする機会は少ないかもしれませんが、「21世紀で最もセクシーな職業」とも呼ばれるデータサイエンティストという職業を支える知識を基礎レベルでも身に着けておくと、これからも増え続けるデータの海に溺れずにいられるかもしれません。

データサイエンティスト協会の定義するデータサイエンティストに必要な能力ではないのは?
データ入門1
{{quiz}} {{maxScore}}問中{{userScore}}問正解!
{{title}}
{{image}}
{{content}}

ライター:H.I