RepeatedStratifiedKFold#

class sklearn.model_selection.RepeatedStratifiedKFold(*, n_splits=5, n_repeats=10, random_state=None)[source]#

Wiederholter klassenweiser stratifizierter K-Fold Kreuzvalidierer.

Wiederholt Stratified K-Fold n Mal mit unterschiedlicher Randomisierung in jeder Wiederholung.

Lesen Sie mehr im Benutzerhandbuch.

Hinweis

Stratifizierung nach dem Klassenlabel löst eher ein technisches als ein statistisches Problem. Weitere Details finden Sie unter Cross-Validation-Iteratoren mit Stratifizierung basierend auf Klassenlabels.

Parameter:

n_splitsint, default=5: Anzahl der Folds. Muss mindestens 2 sein.
n_repeatsint, default=10: Anzahl der Wiederholungen des Kreuzvalidierers.
random_stateint, RandomState-Instanz oder None, default=None: Steuert die Erzeugung der Zufallszustände für jede Wiederholung. Übergeben Sie eine Ganzzahl für reproduzierbare Ausgaben über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Siehe auch

RepeatedKFold: Wiederholt K-Fold n Mal.

Anmerkungen

Randomisierte CV-Splitter können bei jedem Aufruf von split unterschiedliche Ergebnisse liefern. Sie können die Ergebnisse identisch machen, indem Sie random_state auf eine Ganzzahl setzen.

Beispiele

>>> import numpy as np
>>> from sklearn.model_selection import RepeatedStratifiedKFold
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> rskf = RepeatedStratifiedKFold(n_splits=2, n_repeats=2,
...     random_state=36851234)
>>> rskf.get_n_splits()
4
>>> print(rskf)
RepeatedStratifiedKFold(n_repeats=2, n_splits=2, random_state=36851234)
>>> for i, (train_index, test_index) in enumerate(rskf.split(X, y)):
...     print(f"Fold {i}:")
...     print(f"  Train: index={train_index}")
...     print(f"  Test:  index={test_index}")
...
Fold 0:
  Train: index=[1 2]
  Test:  index=[0 3]
Fold 1:
  Train: index=[0 3]
  Test:  index=[1 2]
Fold 2:
  Train: index=[1 3]
  Test:  index=[0 2]
Fold 3:
  Train: index=[0 2]
  Test:  index=[1 3]

get_metadata_routing()[source]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:

routingMetadataRequest: Ein MetadataRequest, der Routing-Informationen kapselt.

get_n_splits(X=None, y=None, groups=None)[source]#

Gibt die Anzahl der Splitting-Iterationen zurück, die mit dem Parameter n_splits bei der Instanziierung des Kreuzvalidierers festgelegt wurden.

Parameter:

Xarray-like von Shape (n_samples, n_features), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
yarray-like mit Form (n_samples,), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
groupsarray-like of shape (n_samples,), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt zurück:

n_splitsint: Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.

split(X, y, groups=None)[source]#

Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.

Parameter:

Xarray-like der Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

Beachten Sie, dass die Angabe von y ausreicht, um die Splits zu generieren, und daher np.zeros(n_samples) als Platzhalter für X anstelle der tatsächlichen Trainingsdaten verwendet werden kann.

yarray-like von Form (n_samples,)

Die Zielvariable für Probleme des überwachten Lernens. Die Stratifizierung erfolgt basierend auf den y-Labels.

groupsarray-like of shape (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt:

trainndarray: Die Trainingsset-Indizes für diese Teilung.
testndarray: Die Testset-Indizes für diese Teilung.

Anmerkungen

Randomisierte CV-Splitter können bei jedem Aufruf von split unterschiedliche Ergebnisse liefern. Sie können die Ergebnisse identisch machen, indem Sie random_state auf eine Ganzzahl setzen.

Galeriebeispiele#

Statistischer Vergleich von Modellen mittels Gitter-Suche

Post-hoc-Anpassung des Cut-off-Punkts der Entscheidungskfunktion

Übersicht über Multiklassen-Training Meta-Estimator

RepeatedStratifiedKFold#

Galeriebeispiele#

Diese Seite