ビッグデータの分析に関する記述として、最も適切なものはどれか。
- ア. 大量のデータから未知の状況を予測するためには、統計学的な分析手法に加え,機械学習を用いた分析も有効である。
- イ. テキストデータ以外の、動画や画像, 音声データは、分析の対象として扱うことができない。
- ウ. 電子掲示板のコメントや SNS のメッセージ, Web サイトの検索履歴など、人間の発信する情報だけが、人間の行動を分析することに用いられる。
- エ. ブログの書き込みのような、分析されることを前提としていないデータについては、分析の目的にかかわらず、対象から除外する。
【答え】ア
【解説】
ビッグデータとは、大量・多様・高速生成されるデータを指します(いわゆる「3V」:Volume, Variety, Velocity)。このようなデータを活用して、行動の予測・傾向の発見・意思決定の支援を行うためには、単純な集計や統計だけでは足りず、AI・機械学習・ディープラーニングなどの高度な手法も使われます。
各選択肢の解説
ア. 大量のデータから未知の状況を予測するためには、統計学的な分析手法に加え,機械学習を用いた分析も有効である。
→ ⭕ 機械学習は、パターン抽出や将来予測に非常に有効で、ビッグデータ分析に広く活用されています(例:購買予測、異常検知、レコメンドなど)。
イ. テキストデータ以外の、動画や画像, 音声データは、分析の対象として扱うことができない。
→ビッグデータには非構造データ(動画・画像・音声など)も含まれます。AIを活用すれば、これらのデータも音声認識・画像認識・映像解析などで分析可能です。
ウ. 電子掲示板のコメントや SNS のメッセージ, Web サイトの検索履歴など、人間の発信する情報だけが、人間の行動を分析することに用いられる。
→センサーデータ、GPSログ、購買履歴、IoT機器のログなど、人間が明示的に発信していないデータも人間行動の分析に活用されます(例:スマートフォンの位置情報からの行動パターン分析)。
エ. ブログの書き込みのような、分析されることを前提としていないデータについては、分析の目的にかかわらず、対象から除外する。
→多くのビッグデータは分析目的で収集されたものではありません(例:ブログ、SNS、レビュー投稿など)。しかし、利用目的に応じて、適法かつ適切な手順で分析対象にすることは可能です。
以上より、正解はア.となります。

