データクレンジングは、AI開発ライフサイクルにおける基礎的な作業です。AAIA™学習ガイドでは、データ品質(完全性、正確性、一貫性、妥当性を確保すること)が、効果的で偏りのないAIシステムを構築する上で不可欠であると指摘しています。データクレンジングには、重複データの削除、エラーの修正、欠損値の処理、フォーマットの標準化などが含まれます。 「データクリーニングは、効果的なトレーニングと評価の前提条件です。質の低いデータは、不正確または誤解を招くモデル出力につながり、運用上および倫理上のリスクを高めます。」トレーニング(D)は不可欠ですが、データが適切に準備された後にのみ実施する必要があります。層別化(A)は特定のモデリング手法をサポートしますが、データの整合性に比べれば二次的なものです。したがって、データ収集段階ではCが最も重要なタスクとなります。 参考資料:ISACA Advanced in AI Audit™ (AAIA™) 学習ガイド、セクション:「AIの基礎と技術」、サブセクション:「データ収集と準備」