
説明

ボックス 1: k 分割
ボックス2: 3
K-Folds クロスバリデーターは、トレーニング/テスト セット内のデータを分割するためのトレーニング/テスト インデックスを提供します。データセットを k 個の連続するフォールドに分割します (デフォルトではシャッフルなし)。
パラメータ n_splits ( int、デフォルト = 3) は折り返しの数です。少なくとも 2 である必要があります。
ボックス3: データ
例: 例:
>>>
>>> sklearn.model_selection から KFold をインポートします
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([1, 2, 3, 4])
>>> kf = KFold(n_splits=2)
>>> kf.get_n_splits(X)
2
>>> 印刷(kf)
KFold(n_splits=2、random_state=なし、shuffle=False)
>>> kf.split(X) の train_index、test_index の場合:
print("TRAIN:", train_index, "TEST:", test_index)
X_train、X_test = X[train_index]、X[test_index]
y_train、y_test = y[train_index]、y[test_index]
トレーニング: [2 3] テスト: [0 1]
トレーニング: [0 1] テスト: [2 3]
参考文献:
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.KFold.html