ITパスポート模擬試験~令和7年度【問8】~

AI の機械学習で利用するデータの取扱いに関する記述のうち、バイアスの低減やデータの品質を確保するために考えられる対策として、適切なものだけを全て挙げたものはどれか。

a 学習の目的に適したデータであることを確認する。
b データの入手元・作成来歴を確認する。
c データへのアノテーションの付与は学習目的に合わせて実施する。
d 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。

  • ア. a, b
  • イ. a, b, c, d
  • ウ. a, d
  • エ. b, c, d

【答え】イ

【解説】

AI・機械学習においての「バイアス低減」「データ品質確保」の観点から、適切な対応だけを選ぶ問題です。

各選択肢の解説

a. 学習の目的に適したデータであることを確認する。

→データが目的に合っていなければ、正確な学習は行えず、バイアスや精度低下の原因になる(例:医療用診断AIに、関係ない画像データを学習させると正しく学習できない)。

→ ⭕ 適切

b. データの入手元・作成来歴を確認する。

→出所が不明なデータは、不正確・不偏性の欠如・倫理的問題を引き起こす可能性があり、信頼性や偏りの有無を確認するにはデータの透明性が重要

→ ⭕ 適切

c. データへのアノテーションの付与は学習目的に合わせて実施する。

→学習目的に即したタグ付けをすることで、不要な情報や誤ラベルを排除できる

→ ⭕ 適切

MEMO

アノテーション(annotation)とは、機械学習(特にAIの教師あり学習)で使用するデータに、人間が「意味づけ」や「ラベル(タグ)」を付ける作業のことです。

例:画像認識の場合は猫の画像に「猫」というラベルを付ける、音声認識の場合は音声データに「発話内容」や「話者」などの情報を付ける。

d. 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。

→ノイズやゴミデータとして判断されるケースを除去することで、データの品質・精度を向上させることができる。

→ ⭕ 適切

MEMO

ただし、これを除外するとAIが実運用で遭遇するパターンを学べず、偏った学習結果になるため不適切と考えることもできますが、選択肢には「a,b,c」がないため、d.を適切と考えています。

以上より、正解はイ.となります。

間違えた人はこちらで復習

ビジネスシステム2~AI(人工知能)の利活用~

※この問題は自分で考えて解くような応用的な問題なので、用語の丸暗記では対応できません。