Azure Storage アカウントの BLOB コンテナーを参照する training_data という名前のデータストアを作成します。
BLOB コンテナーには、複数のコンマ区切り値 (CSV) ファイルが格納されている csv_files という名前のフォルダーが含まれています。
./script という名前のローカル フォルダーに train.py という名前のスクリプトがあり、推定器を使用して実験として実行する予定です。スクリプトには、csv_files フォルダーからデータを読み取るための次のコードが含まれています。

次のスクリプトがあります。

スクリプトが、training_data データストアの csv_files フォルダーを参照する data_ref という名前のデータ参照からデータを読み取ることができるように、実験用の推定器を構成する必要があります。
エスティメータを構成するには、どのコードを使用する必要がありますか?
正解:B
estimator の入力パラメーターを介してデータセットを渡すだけでなく、script_params を介してデータセットを渡し、引数を介してトレーニング スクリプトでデータ パス (マウント ポイント) を取得することもできます。このようにして、トレーニング スクリプトを azureml-sdk から独立した状態に保つことができます。つまり、任意のクラウド プラットフォームでローカル デバッグとリモート トレーニングに同じトレーニング スクリプトを使用できます。
例:
azureml.train.sklearn インポート SKLearn から
script_params = {
# データセットをリモート コンピューティングにマウントし、マウントされたパスを引数としてトレーニング スクリプトに渡します
'--data-folder': mnist_ds.as_named_input('mnist').as_mount(),
'--正則化': 0.5
}
est = SKLearn(source_directory=script_folder,
script_params=script_params,
計算対象 = 計算対象、
環境定義=env、
entry_script='train_mnist.py')
# 実験を実行する
実行 = 実験.送信 (エスト)
run.wait_for_completion(show_output=True)
不正解:
A: Pandas DataFrame は使用されていません。
参照:
https://docs.microsoft.com/es-es/azure/machine-learning/how-to-train-with-datasets