
説明


シナリオ: テスト
Azure Machine Learning Studio のパーティションとサンプル モジュールを使用して、サンプリングに基づいてデータセットの複数のパーティションを生成する必要があります。
ボックス1: 折り目に割り当てる
データセットをデータのサブセットに分割する場合は、「フォールドに割り当てる」オプションを使用します。このオプションは、クロス検証用にカスタムのフォールド数を作成する場合や、行を複数のグループに分割する場合にも便利です。
ヘッドなし: 最初の n 行のみを取得するには、ヘッド モードを使用します。このオプションは、少数の行でパイプラインをテストし、データのバランスを取ったりサンプリングしたりする必要がない場合に便利です。
サンプリングなし: サンプリング オプションは、単純ランダム サンプリングまたは層別ランダム サンプリングをサポートします。これは、テスト用に小規模な代表サンプル データセットを作成する場合に便利です。
ボックス2: 均等に分割する
パーティショナー方法を指定します。次のオプションを使用して、各パーティションにデータをどのように配分するかを指定します。
* 均等にパーティション分割: このオプションを使用すると、各パーティションに同じ数の行を配置できます。出力パーティションの数を指定するには、[均等に分割する折り返しの数を指定] テキスト ボックスに整数を入力します。
参照:
https://docs.microsoft.com/en-us/azure/machine-learning/algorithm-module-reference/partition-and-sample