LeaveOneOut#

class sklearn.model_selection.LeaveOneOut[Quelle]#

Leave-One-Out Kreuzvalidierer.

Stellt Trainings-/Test-Indizes zum Aufteilen von Daten in Trainings-/Test-Sets bereit. Jede Stichprobe wird einmal als Test-Set (Singleton) verwendet, während die verbleibenden Stichproben das Trainings-Set bilden.

Hinweis: LeaveOneOut() ist äquivalent zu KFold(n_splits=n) und LeavePOut(p=1), wobei n die Anzahl der Stichproben ist.

Aufgrund der hohen Anzahl von Test-Sets (die gleich der Anzahl der Stichproben ist) kann diese Kreuzvalidierungsmethode sehr kostspielig sein. Für große Datensätze sollte KFold, ShuffleSplit oder StratifiedKFold bevorzugt werden.

Lesen Sie mehr im Benutzerhandbuch.

Siehe auch

LeaveOneGroupOut

Zum Aufteilen der Daten gemäß expliziter, domänenspezifischer Schichtung des Datensatzes.

GroupKFold

K-Fold Iterator-Variante mit nicht überlappenden Gruppen.

Beispiele

>>> import numpy as np
>>> from sklearn.model_selection import LeaveOneOut
>>> X = np.array([[1, 2], [3, 4]])
>>> y = np.array([1, 2])
>>> loo = LeaveOneOut()
>>> loo.get_n_splits(X)
2
>>> print(loo)
LeaveOneOut()
>>> for i, (train_index, test_index) in enumerate(loo.split(X)):
...     print(f"Fold {i}:")
...     print(f"  Train: index={train_index}")
...     print(f"  Test:  index={test_index}")
Fold 0:
  Train: index=[1]
  Test:  index=[0]
Fold 1:
  Train: index=[0]
  Test:  index=[1]
get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:
routingMetadataRequest

Ein MetadataRequest, der Routing-Informationen kapselt.

get_n_splits(X, y=None, groups=None)[Quelle]#

Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.

Parameter:
Xarray-like der Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

yarray-like mit Form (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

groupsarray-like of shape (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt zurück:
n_splitsint

Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.

split(X, y=None, groups=None)[Quelle]#

Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.

Parameter:
Xarray-like der Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

yarray-like mit Form (n_samples,), default=None

Die Zielvariable für überwachte Lernprobleme.

groupsarray-like of shape (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt:
trainndarray

Die Trainingsset-Indizes für diese Teilung.

testndarray

Die Testset-Indizes für diese Teilung.