
Explanation:
ボックス 1: k 倍
ボックス 2: 3
K-Folds クロスバリデーターは、トレーニング/テスト セットのデータを分割するためのトレーニング/テスト インデックスを提供します。データセットを k 個の連続したフォールドに分割します (デフォルトではシャッフルなし)。
パラメータ n_splits ( int、デフォルト = 3) は折り畳みの数です。少なくとも 2 である必要があります。
ボックス 3: データ
例: 例:
>>>
>>> sklearn.model_selectionインポートKFoldから
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([1, 2, 3, 4])
>>> kf = KFold(n_splits=2)
>>> kf.get_n_splits(X)
2
>>> プリント(kf)
KFold(n_splits=2, random_state=None, shuffle=False)
>>> kf.split(X) の train_index、test_index の場合:
... print("TRAIN:", train_index, "TEST:", test_index)
... X_train, X_test = X[train_index], X[test_index]
... y_train, y_test = y[train_index], y[test_index]
トレーニング: [2 3] テスト: [0 1]
トレーニング: [0 1] テスト: [2 3]
参考文献:
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.KFold.html