令和7年試験問題 問8

AIの機械学習で利用するデータの取扱いに関する記述のうち,バイアスの低減やデータの品質を確保するために考えられる対策として,適切なものだけを全て挙げたものはどれか。
  1. 学習の目的に適したデータであることを確認する。
  2. データの入手元・作成来歴を確認する。
  3. データへのアノテーションの付与は学習目的に合わせて実施する。
  4. 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。

  • a,b
  • a,b,c,d
  • a,d
  • b,c,d
正解 問題へ
分野 :ストラテジ系
中分類:企業活動
小分類:業務分析・データ利活用
解説
  1. 適切。学習目的に合致しないデータで訓練すると、モデルが不適切な特徴を学習してしまい、データセットバイアスが起こる可能性があります。データの内容と学習タスクとの整合を確認することは基本的な事項です。
  2. 適切。出所が不透明なデータは、偏った情報が含まれていたり、倫理的または法的な問題を抱えていたりする可能性があります。モデルに信頼性のあるデータを学習させるためには、入手経路や作成背景の確認が重要です。
  3. 適切。アノテーションとは、AIがデータから学習できるように、対象データに意味づける情報(ラベル)を付与する作業を指します。学習させるのが同じデータであっても、学習目的が変わればアノテーションの内容も変わります。例えば、画像分類では犬の画像に「dog」と付けますが、行動認識では「running」や「sitting」といった動作を示すラベルを付与する必要があります。
  4. 適切。モデルが正確に学習するためには、明確な特徴を持つデータが必要です。人間でも識別が困難な曖昧なデータはノイズとなり、誤ったパターンを学習する原因となるため、データ品質の観点からは除外することが適切です。
「a,b,c,d」すべてが適切なので、正しい組合せは「イ」です。

Pagetop