A. 特徴選択 特徴選択は、データから最も関連性の高い特徴を選択するプロセスです。重要ではありますが、余分なデータを直接処理するものではありません。 B. データサンプリング データ サンプリングでは、トレーニング用にデータの代表的なサブセットを選択します。必要以上のデータがある場合は、サンプリングを使用して、データセット全体の統計特性を維持する管理しやすいデータセットを作成できます。 C. データのラベル付け データ ラベリングには、教師あり学習のためのデータへの注釈付けが含まれます。これはモデルのトレーニングに必要ですが、過剰なデータの問題には対処しません。 D. データ拡張 データ拡張は、既存のデータの修正バージョンを作成してトレーニング データセットのサイズを増やすために使用されます。これは、データが過剰にあるときではなく、データが不足しているときに役立ちます。 したがって、トレーニング用に過剰な量のデータを処理する場合に最も関連性の高いアクティビティはデータ サンプリングであるため、正解は B です。