CSV ファイルのセットには販売記録が含まれています。すべての CSV ファイルのデータ スキーマは同じです。
各 CSV ファイルには特定の月の販売記録が含まれており、ファイル名は sales.csv です。
各ファイルは、データが記録された月と年を示すフォルダーに保存されます。フォルダーは、Azure Machine Learning ワークスペースでデータストアが定義されている Azure BLOB コンテナー内にあります。フォルダーは、sales という名前の親フォルダーに整理され、次の階層構造が作成されます。

毎月末に、その月の売上ファイルを含む新しいフォルダが売上フォルダに追加されます。
次の要件に基づいて、販売データを使用して機械学習モデルをトレーニングする予定です。
- これまでのすべての販売データを読み込むデータセットを定義する必要があります
簡単にデータフレームに変換できる構造に変換します。
- 収集されたデータのみを使用する実験を作成できる必要があります。
特定の前月以前に作成されたデータを無視し、
その月以降に追加されました。
- 可能な限り最小限の数のデータセットを登録する必要があります。
販売データを Azure Machine Learning サービス ワークスペースのデータセットとして登録する必要があります。
何をすべきでしょうか?
正解:B
Specify the path.
Example:
The following code gets the workspace existing workspace and the desired datastore by name.
And then passes the datastore and file locations to the path parameter to create a new TabularDataset, weather_ds.
from azureml.core import Workspace, Datastore, Dataset
datastore_name = 'your datastore name'
# get existing workspace
workspace = Workspace.from_config()
# retrieve an existing datastore in the workspace by name datastore = Datastore.get(workspace, datastore_name)
# create a TabularDataset from 3 file paths in datastore datastore_paths = [(datastore,
'weather/2018/11.csv'),
(datastore, 'weather/2018/12.csv'),
(datastore, 'weather/2019/*.csv')]
weather_ds = Dataset.Tabular.from_delimited_files(path=datastore_paths)