AI の機械学習で利用するデータの取扱いに関する記述のうち、バイアスの低減やデータの品質を確保するために考えられる対策として、適切なものだけを全て挙げたものはどれか。
a 学習の目的に適したデータであることを確認する。
b データの入手元・作成来歴を確認する。
c データへのアノテーションの付与は学習目的に合わせて実施する。
d 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。
- ア. a, b
- イ. a, b, c, d
- ウ. a, d
- エ. b, c, d
【答え】イ
【解説】
AI・機械学習においての「バイアス低減」「データ品質確保」の観点から、適切な対応だけを選ぶ問題です。
各選択肢の解説
a. 学習の目的に適したデータであることを確認する。
→データが目的に合っていなければ、正確な学習は行えず、バイアスや精度低下の原因になる(例:医療用診断AIに、関係ない画像データを学習させると正しく学習できない)。
→ ⭕ 適切
b. データの入手元・作成来歴を確認する。
→出所が不明なデータは、不正確・不偏性の欠如・倫理的問題を引き起こす可能性があり、信頼性や偏りの有無を確認するにはデータの透明性が重要。
→ ⭕ 適切
c. データへのアノテーションの付与は学習目的に合わせて実施する。
→学習目的に即したタグ付けをすることで、不要な情報や誤ラベルを排除できる。
→ ⭕ 適切
d. 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。
→ノイズやゴミデータとして判断されるケースを除去することで、データの品質・精度を向上させることができる。
→ ⭕ 適切
以上より、正解はイ.となります。

※この問題は自分で考えて解くような応用的な問題なので、用語の丸暗記では対応できません。