
説明

ボックス 1: training_data
実験で使用されるトレーニング データ。これには、トレーニング機能とラベル列 (オプションでサンプルの重み列) の両方が含まれている必要があります。training_data が指定されている場合は、label_column_name パラメータも指定する必要があります。
ボックス 2: 検証データ
検証データを提供する: この場合、単一のデータ ファイルから始めてトレーニング セットと検証セットに分割するか、検証セット用に別のデータ ファイルを提供することができます。どちらの方法でも、AutoMLConfig オブジェクトの validation_data パラメーターは、検証セットとして使用するデータを割り当てます。
たとえば、次のコード例では、データセット内の提供されたデータのどの部分をトレーニングと検証に使用するかを明示的に定義しています。
データセット = Dataset.Tabular.from_delimited_files(データ)
training_data, validation_data = dataset.random_split(パーセンテージ=0.8, シード=1) automl_config = AutoMLConfig(compute_target = aml_remote_compute, task = 'classification', primary_metric = 'AUC_weighted', training_data = training_data, validation_data = validation_data, label_column_name = 'Class' )ボックス 3: label_column_name label_column_name:
ラベル列の名前。入力データが列名を持たない pandas.DataFrame からのものである場合、代わりに整数として表される列インデックスを使用できます。
このパラメーターは、training_data および validation_data パラメーターに適用されます。
参照:
https://docs.microsoft.com/en-us/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig.auto