Azure Machine Learning Studio で実験を作成します。10,000 行を含むトレーニング データセットを追加します。最初の 9,000 行はクラス 0 (90%) を表します。
残りの 1,000 行はクラス 1 (10%) を表します。
トレーニング セットは、2 つのクラス間の不均衡です。5 つのデータ行を使用して、クラス 1 のトレーニング サンプルの数を 4,000 に増やす必要があります。合成マイノリティ オーバーサンプリング手法 (SMOTE) モジュールを実験に追加します。
モジュールを構成する必要があります。
どの値を使用する必要がありますか? 回答するには、回答エリアのダイアログ ボックスで適切なオプションを選択します。
注: それぞれの正しい選択は 1 ポイントの価値があります。

正解:

Explanation:
ボックス 1: 300
300 (%) と入力すると、モジュールは、元のデータセット (1000) と比較して少数派のケース (3000) の割合を 3 倍にします。
ボックス 2: 5
5 つのデータ行を使用する必要があります。
[最近傍数] オプションを使用して、新しいケースを作成するときに SMOTE アルゴリズムが使用する特徴空間のサイズを決定します。最近隣は、あるターゲット ケースに非常によく似たデータの行 (ケース) です。任意の 2 つのケース間の距離は、すべてのフィーチャの加重ベクトルを組み合わせることによって測定されます。
最近隣の数を増やすことで、より多くのケースから特徴を取得できます。
最近隣の数を低く抑えることで、元のサンプルの特徴に似た特徴を使用できます。
参考文献:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/smote