さくらインターネットの提供するクラウドサービスの特徴やメリットをご紹介
>>資料のダウンロードはこちらから
ニュースや新聞、あるいは、職場や学校などで、データサイエンスという言葉に触れたことがある人は多いのではないでしょうか。
情報化社会の発展とスマートフォンの普及によって、日々さまざまな情報が集められています。蓄積された膨大な情報はビッグデータと呼ばれ、ビッグデータを活用したデータサイエンスが注目されています。
この記事では、データサイエンスの概要と活用事例を解説しています。データサイエンスで使われるプログラミング言語やデータサイエンスが学べる教育機関についても解説していますので、興味のある人は、参考にしてみてください。
データサイエンスとはビッグデータを活用した学問分野のこと
データサイエンスとは、ビッグデータの中から新たに有益となる知見を導き出す学問分野のことです。情報科学、統計学や、AI(人工知能)、機械学習などの技術を駆使して、データの分析や解析をおこなうデータサイエンスは、課題解決の手段として注目されています。
データサイエンスが注目される理由として、内閣府が2016年に提唱した「Society5.0(ソサエティー5.0)」があります。この計画は、サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立した新たな社会の実現を目標としています。
この Society5.0 を実現するためのキーワードが、IoT(モノのインターネット)、ビッグデータ、AI、ロボットであり、Society5.0 の積極的な取り組みが、データサイエンスが注目される理由の1つとなっています。
データサイエンスの活用事例
コンピューター性能の進化や学術的研究の進歩によって、導き出されるデータの信頼度が向上し、ビッグデータ分析の需要は年々高まっています。
そして、データサイエンスは、日常生活における不便の改善、社会活動の活性化など、さまざまな分野や業種において幅広く活用されているのです。
【データサイエンスの身近な活用事例】
分野 |
活用事例 |
気象・災害 |
・各地の気象や気候を観測データや衛星データから予測して案内 ・紫外線や花粉、黄砂、PM2.5などの分布を予測して注意喚起 ・ゲリラ豪雨や台風、地震や火山などの観測データを監視し、対策強化 |
防災 |
・個人のスマートフォンに被害状況を踏まえた安全な避難情報を提供 ・アシストスーツや救助ロボットによる迅速な救助 ・ドローンや自動配送車などによる救援物資の最適配送 |
交通 |
・観光ルートの提供、天候や渋滞の予測案内 ・カーシェアや公共交通の併用でGHG(温室効果ガス)削減 ・自立型車いすで高齢者や障がい者の移動支援 |
データサイエンスを活用した身近な例として、気象や災害予測、防災、交通などへの活用が挙げられます。
天気予報を確認し、雨が降りそうなら傘を持って出かける。日差しが強そうなら紫外線対策をする。そういった日常生活の何気ない場面で、人々は自然とデータサイエンスに左右された行動をとっているのです。
社会問題における活用事例
データサイエンスは、社会問題の解決にも活用できます。IT化や DX(デジタルトランスフォーメーション)が進み、データサイエンスが社会に根付いたことから、これまで解決が難しかった社会問題に対し、新たなアプローチが可能となっているためです。
【各分野におけるデータサイエンスの活用事例】
分野 |
活用事例 |
医療・介護 |
・データ共有による最適治療で健康寿命を延伸 ・リアルタイムの自動健康診断、病気の早期発見で治療費削減 ・ロボットによる生活支援で本人や家族の負担を軽減、社会コスト削減 |
ものづくり |
・AI やロボット活用、工場間連携による生産効率化、省人化 ・異業種協調配送やトラックの隊列走行による物流効率化 ・ニーズに応じた品物を納期通り入手し、顧客満足度向上、消費活性化 |
農業 |
・ロボットトラクタやドローンなどによる農作業の自動化、省略化 ・ニーズに応じた収穫量の設定と天候を予測した最適な作業計画 ・自動配送車などにより、農作物を消費者が求めるタイミングで配送 |
食品 |
・アレルギー情報や健康状態、個人の嗜好に合わせた食品の提案 ・冷蔵庫の食材管理で食品ロス削減 ・生産者や店舗の顧客ニーズに合った生産、発注、在庫管理で経営改善 |
エネルギー |
・需要予測や気象予測を踏まえた多様なエネルギー使用による安定供給 ・水素製造や電気自動車(EV)によるエネルギーの地産地消と地域間融通 ・供給予測を踏まえた使用率の最適提案で各家庭への省エネを要請 |
参照:内閣府 Society 5.0「各分野における新たな価値の事例」
データサイエンスが活用される前の社会では、各分野において知識や情報が共有されず、連携が不十分となる課題がありました。また、人がこなせる仕事量や内容には限界があり、少子高齢化や地方過疎化の進行によって、労働人口の減少や地場産業の衰退といった新たな課題が生まれました。
しかし近年では、データサイエンスの活用、IoT やビッグデータなどの新たな技術の複合によって、あらゆる情報がつながっています。そして、ロボットや AI が人の仕事を補うことで、能力や年齢、場所による制約を解消できるのです。
これまで難しいと思われていた経済発展と社会問題解決の両立が、データサイエンスによって現実に近づいているのです。
企業や自治体などの組織における活用事例
企業や自治体などの組織において、データサイエンスを活用する事例が増えています。
業務効率化や商品開発、マーケティング戦略などでデータサイエンスを活用した結果、業績向上や社会貢献につながり、実績としてデータサイエンスの有効性が評価されるようになったためです。
【データサイエンスの組織別の活用事例】
組織 |
活用事例 |
飲食サービス業 |
・AIチャットボット(自動会話プログラム)で受注を簡略化 ・AIカメラによる商品チェックで品質を向上 ・自動運転車で宅配を自動化 |
化粧品メーカー |
AI-OCR(人工知能による光学文字認識)を導入して商品や顧客のチェックを自動化し、業務負担や経費を削減 |
鉄道業 |
防犯カメラの映像から特定の動きを検知する AI技術を導入 [ナイフを振り回す行動を検知して迅速に対処する] [白杖や車いすを検知してスムーズにサポートする] [人が倒れ込むのを検知していち早く救護する] |
自治体 |
・行政情報を誰もがダウンロードでき、加工も可能なオープンデータとして公開し、経済活性化・行政効率化を実現 ・行政データや公的統計データを分析・可視化し、ダッシュボード(各種データの一覧)を全庁で共有する仕組みを構築 |
高校の部活動 |
理数教育重点校「スーパーサイエンスハイスクール」の支援制度を利用し、データサイエンスを取り入れた練習メニューを実施。研究結果を発表 |
大学の 問題解決型学習 |
学生が飲食店の運営に携わり、AIカメラや AIサイネージ(電子看板)を用いた DX による店舗運営を展開 |
大学の 研究チーム |
相対的に老朽化が進んでいる施設から順に、効率よく点検や修繕をおこなうため、ビッグデータからインフラの劣化曲線を統計的に予測し、社会インフラの寿命を割り出す |
病院 |
医療ビッグデータを活用したドラッグリポジショニング(既存薬再開発)により、既存薬から新たな治療薬・予防薬を見出す |
スポーツ施設に設置する自動販売機の商品を AI が分析した結果、人間には思いつかなかった商品が売れると予測した事例があります。この事例で AI が予測した商品は、スポーツ施設内で子どもの習い事が終わるのを待つ保護者からの需要が高いことが追加調査でわかりました。
このように、データサイエンスは、情報が網羅されたビッグデータの中から、人間の思考を超えた高度な分析によって、新たな価値の創造を実現しています。
データサイエンティストの育成が推進されている
データサイエンスの需要の高まりを受けて、データサイエンティストの育成が推進されています。
データサイエンティストは、求められるスキルが高い一方、経験者や学びの場は少なく、現場においてビッグデータを正しく活用できる人材が不足しているためです。
かつて、データサイエンティストの定義は不明確であり、 スキルレベルにも大きな差がありました。この問題を受けて、データサイエンティストの支援機関である「データサイエンティスト協会」は、2014年、その定義を明確に定めました。
【データサイエンティスト協会によるデータサイエンティストの定義】
データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル
参照:一般社団法人データサイエンティスト協会 プレスリリース P3(PDF)
この定義を基に、データサイエンティストのスキルレベルが標準化され、企業とデータサイエンティストとのミスマッチ解消と人材定着が促されるようになりました。
また、総務省は、2014年にビジネスパーソン向けの無料統計学習サイト「データサイエンス・スクール」をオンライン上に開設。データサイエンス力の高い人材を求め、国を挙げてデータサイエンティストの育成を推進しています。
総合的なスキルセットが求められる
データサイエンティストには、総合的なスキルセットが求められます。
データサイエンスでは、ビッグデータの分析・解析に加え、新しい価値の創造と課題解決力が必要となるためです。
データサイエンティスト協会が打ち出した、データサイエンティストに求められるスキルセットは、「ビジネス力」「データサイエンス力」「データエンジニアリング力」です。
「ビジネス力」「データサイエンス力」「データエンジニアリング力」は、課題解決の局面によって、中心となるスキルが変化します。それぞれのスキルに優位性はなく、どれか1つが欠けてもいけないとされています。
「データサイエンス力」で求められる情報処理系の知恵には、プログラミングスキルが含まれます。データ解析に必要なデータの前処理やモデルの実装に、プログラミング言語が使われているためです。
プログラミング言語を使い分けている
プログラミング言語によって特徴や強みが異なるため、データサイエンスでは、用途に応じてプログラミング言語を使い分けています。
機械学習や AI開発には「Python(パイソン)」、データの統計や解析には「R言語(アール言語)」が広く使われています。
【データサイエンスで使うプログラミング言語】
プログラミング言語の種類 |
特徴 |
Python(パイソン) |
少ないコードで簡潔にプログラムが書け、専門的なライブラリが豊富にある。AI や機械学習、ゲームなども開発でき、汎用性がある。 |
R言語(アール言語) |
データ解析に特化し、機械学習や統計分析に強い。さまざまな形式のグラフを出力する機能がある。汎用性は高くない。 |
Scala(スカラ) |
オブジェクト指向言語と関数型言語の両方を実行できるハイブリッド言語。Java との互換性が高い。 |
SQL(エスキューエル) |
データベース言語の1つで、データベースの定義や操作をおこなう。ISO(国際標準化機構)で規格が統一されており、一度覚えればデータベースが変わっても同じように操作できる。 |
Julia(ジュリア) |
機械学習との相性がよく、高等数学ができる関数が実装されている。Python や R言語などに比べて実行速度が速い。ライブラリは少ない。 |
C++(シープラスプラス) |
C言語にオブジェクト指向を追加した上位互換言語。C言語と同等の実行速度を持ち、より効率よくプログラミングできるように作られている。 |
Go(ゴー) |
エンジニアの生産性を向上するために開発されたオープンソースのプログラミング言語。シンプルな構文構造で理解しやすく可読性が高いことから、複数人のエンジニアが関わっても記述がぶれにくい。 |
幅広い用途で使用される「Java」の次世代言語として、昨今では「Scala(スカラ)」が注目されているように、プログラミング言語は日進月歩です。
データサイエンティストは、データサイエンスの動向を広い視野と長い視点で捉えながら、プログラミング言語の知識をつねにアップデートしていく必要があります。
プログラミング言語を選ぶ際は、開発環境が整いやすく将来性があることを前提に、サポート情報やライブラリ(部品)・フレームワーク(枠組み)が豊富なものを選ぶようにしましょう。
データサイエンスが学べる環境の整備が進められている
データサイエンティストの需要の高まりを受けて、データサイエンスを学べる環境の整備が進められています。
2019年に経済産業省「IT 人材需給に関する調査」で公表された試算では、企業のシステム部門や IT関連の業務にあたる人材は、2030年時点で最大約79万人不足するといわれており、データサイエンティストの育成が急務となっているためです。
文部科学省は、デジタル社会を担う人材育成において、「文理を問わず全ての大学・高専生が初級レベルの能力を習得すること」「大学・高専生が自らの専門分野への応用基礎力を習得すること」を目標に掲げています。
数理・データサイエンス・AI教育の基本的考え方、学修目標・スキルセット、教育方法などを体系化したモデルカリキュラムを策定・活用するとともに、教材などの開発や教育に活用可能な社会の実課題・実データの収集・整備を通じて、全国の大学などへの普及・展開を推進しています。
また、総務省統計局による「データサイエンス・スクール」や、データサイエンティスト協会による「データサイエンティスト養成講座」、各企業による受講イベント・セミナーなども積極的に開催され、幅広い人材に向けてデータサイエンスの普及活動がおこなわれています。