「ビッグデータ」という言葉を最近よく耳にするようになりました。
「よく分からないけど大量のデータが扱われている。」「データを集められると個人の本性が丸裸にされてしまうって本当?」そんなふんわりしたイメージや漠然とした不安をお持ちの方も多いと思います。
今回はそんな正確にはつかめていないビッグデータについて、その定義や特徴、活用例についてまとめていきます。
ビッグデータとは
ビッグデータとは「分析することで経済的価値が生み出せるデータ」のことです。
直訳すると「大量のデータ」となるのですが、ただ量が多いだけだはビッグデータとは言えません。
例えば役所には大量の個人情報が保管されていますが、それらは分析されたり、経済的価値を生み出すような利用をされたりしないため、ビッグデータとは言われません。
ビッグデータは量や内容と同時に、「有効に利用され、価値を生み出すか」という視点が大切になってくるのです。
ビッグデータの特徴
ビッグデータと呼ばれるものは3つの特徴を持ちます。
それが「多様性」「速度・頻度」「容量」です。
- 多様性:文章だけでなく。画像・音声といった多様な情報
- 速度・頻度:リアルタイムなデータなど、時間的に解像度の高い情報
- 容量:数十テラ~数ペタバイトほどの膨大なデータ
ビッグデータとは何?と聞かれたとき、「分析することで経済的に価値のある、様々な形式の膨大なデータだよ」と答えられたら完璧ですね!
発展の背景
ビッグデータが躍進する原因となったのが人工知能・インターネット・情報処理技術の発展です。
人工知能
今までもデータを蓄えることはあったのですが、それを有効に利用することはできませんでした。
しかし機械学習する人工知能の登場でこの状況が変わります。
上図のようにディープラーニングによる機械学習では、データを入力するだけで、機械がひとりで学習し、最適解を提出してくれます。
詳しく知りたい方は「AI 人工知能について」をご覧ください。
これにより処理できるデータ量が大幅に増え、またAIの制度を上げるためのツールとしてビッグデータの重要性が増加しました。
インターネット
インターネットの普及によりデータの収集がとても簡単になりました。
現在はインターネットやSNSの利用者の情報が自動的にビッグデータとして保存されているため、何もしなくても毎秒膨大なデータを入手することができます。
またPC・スマホだけでなくIoT機器が増加することで、更に多様なデータが得られるようになっていくでしょう。
IoTとは「モノのインターネット」といい、様々なものがインターネットに繋がっている状態です。あらゆるものからの情報収集が可能になるため、IoTはビッグデータと切っても切れない関わりを持ちます。IoTについて詳しく知りたい方は「IoTとは 1人1000台のデバイスを持つ時代」をご覧ください。
情報処理技術の発展
かつてはハードウェアの性能がデータ量の増大に追いついていませんでした。
ここで登場したHadoopはデータ処理を複数のコンピューターに分散して、並列に行うことを可能にし、膨大なデータの処理能力の向上に寄与しました。
ビッグデータ活用の分類
ビッグデータはその利用のされ方から4つに分類されています。
オープンデータ(国・自治体)
オープンデータとは国や自治体が所有する公共情報です。総務省のサイトからアクセスすることができ、誰でも利用することができます。
その内容は幅広く、政府機関、医療・健康、 金融・経済、ビジネス・企業、ジャーナリズム・メディア、不動産・観光、文化・教育まで多岐にわたります。
2016年に官民データ活用推進基本法ができ、より活発なデータの利用を促しています。
ノウハウを構造化したデータ(企業)
企業や農業の経験やノウハウをデータ化したものです。
これにより一握りのプロの経験に任せていた従来の状況を脱して、人事異動や引退に左右されない状況を作ることができます。
後世のためのデータ利用といえます。
M2Mデータ(企業)
M2M(Machine to Machine)データは機械に取り付けられたセンサーからのデータです。
例えば工場等の生産現場や橋梁、道路に設置されたIoT機器からのデータなどがそれにあたります。
これらのデータを分析することで、売上情報や作業情報、在庫データがリアルタイムで分かり、より効率的な運営を行うことができます。
パーソナルデータ(個人)
個人の属性情報、移動・行動・購買履歴、ウェアラブル機器から収集された個人情報のことです。
またSNSの利用から判明する交友関係など、個人と関係性が見出される広範囲の情報もここに入ります。
ビッグデータ活用例
ここではビッグデータを活用している取り組みの中で、回転すしチェーンの「スシロー」を取り上げて紹介していきます。
スシローでは寿司皿にICチップをつけたデータの収集が行われています。
これによりどこの店で、何の寿司ネタが、いつ、どのテーブルで注文されたかという情報が膨大に積みあがっていきます。
来店客の層や、ニーズを把握し、どの寿司をどれくらい作るかが最適化されたため、食品の廃棄量が四分の一に減少しました。
スシローによると「これらはほんの一握り」とのことです。
企業がM2Mデータを利用して業務の最適化を図った有効な一例だと考えます。
ビッグデータのハイプサイクル
ハイプサイクルとはガードナーという会社が毎年発表する、「テクノロジーの地図」のようなものです。ハイプサイクルについて詳しくはハイプサイクルとは? ~現在のテクノロジーが一目で分かる~をご覧ください。
ビッグデータのハイプサイクルはこちらです。
2018年に「安定期に達する前に陳腐化」すると判断されたため、それ以降のデータは出されていません。
これはビッグデータをテクノロジーとして追うのをやめるというだけで、その重要性が失われたわけではありません。
現在の状況を推定するに、普及はしてきているもののIoT機器の発展によりもう一段階の変化が予測されるため、啓蒙活動期と生産の安定期の狭間ぐらいなのかなと私は考えます。
まとめ
ビッグデータは「分析することで経済的価値が生み出せる大量のデータ」です。
そしてこれはAIやIoTと抜群の相性を持っており、協調することで大きな変化をもたらすでしょう。
私はビッグデータというとGAFAのパーソナルデータの扱いに目が行きがちでしたが、M2Mデータやノウハウのビッグデータ化などの概念に触れ、その幅広さを改めて認識することができました。
テクノロジーの掛け算の持つ無限の可能性を考えるとわくわくしますね!
コメント