スポンサーリンク
ビッグデータってなに?
AI(人工知能)、IoT(モノのインターネット)、RPA(ロボティック・プロセス・オートメーション)、クラウドなどと同じように、近年よくニュースで見かけるビッグデータ。
ビッグデータとは、名前の通り巨大なデータの集まりのことをいいます。
またビッグデータを定義する要素として「3V」があげられます。
- Variety:データ多様性
- Volume:データ容量
- Velocity:データ処理頻度
Variety(データ多様性)
3Vのうち「Variety」はデータの種類。規則性のある構造化データ(CSVファイルや固定長ファイルなど)だけではなく、テキスト、音声、画像などの非構造化データも扱うことができるようになりました。
音声や画像、動画などを扱うことで、音声や画像分析などを行うことが可能となります。
Volume(データ容量)
3Vのうち「Volume」はデータの容量。「Variety(データ多様性)」で説明した通り、様々なデータを扱うようになり、その結果データ自体の増加に加え、動画のようにサイズの大きいものや、センサー/SNSのように発生頻度の高いものがあり、必然的にデータ容量は大きくなります。
Velocity(データ処理頻度)
3Vのうち「Velocity」は膨大なデータを高頻度で高速に処理すること。「Variety(データ多様性)」で扱うデータの種類が増え、「Volume(データ容量)」でデータの容量が増えました。
ただしこの膨大なデータを高頻度で高速に処理できなければ意味がありません。リアルタイムで処理するという要素が加わることで、ビッグデータが有用なモノになるのです。
スポンサーリンク
なぜ"ビッグデータ"が注目されているの?
近年、ビッグデータは注目を集めています。なぜ今更ビッグデータが注目を集めているのでしょうか。
それはテクノロジーの発展に理由があります。
これまでの技術では、以下の大きな壁が存在していました。
- ビッグデータの収集ができない
- ビッグデータの収集ができても、データを保存する容量がない
- ビッグデータを高速に処理する技術がない
このように従来はビッグデータを扱うための、テクノロジーが発展していなかったのです。
しかし、近年テクノロジーが発展し今まで「大きな壁だった」"容量"と"速度"の問題が解消されビッグデータを扱うことが可能になってきたのです。
膨大なデータである「ビッグデータ」を高頻度で高速に処理できるようになり、AI(人工知能)やIoT(モノのインターネット)でもビッグデータを活用するケースが増えてきました。
例えば、現在注目される「車の自動運転」も、走行シーンの膨大なデータを蓄積し、ビッグデータとして活用しています。
このようにビッグデータは様々なケースで活用されてきているのです。
ポイント
ビッグデータが注目されている理由は、テクノロジーの発展により今まで「大きな壁だった」"容量"と"速度"の問題が解消されビッグデータを扱うことが可能になったからである。