LeavePOut#

class sklearn.model_selection.LeavePOut(p)[Quelle]#

Leave-P-Out Kreuzvalidierer.

Stellt Trainings-/Testindices zum Aufteilen von Daten in Trainings-/Testsets bereit. Dies führt in jeder Iteration dazu, dass alle unterschiedlichen Stichproben der Größe p getestet werden, während die verbleibenden n - p Stichproben den Trainingssatz bilden.

Hinweis: LeavePOut(p) ist NICHT äquivalent zu KFold(n_splits=n_samples // p), das sich nicht überlappende Testsets erstellt.

Aufgrund der hohen Anzahl von Iterationen, die kombinatorisch mit der Anzahl der Stichproben wächst, kann diese Kreuzvalidierungsmethode sehr kostspielig sein. Bei großen Datensätzen sollte man KFold, StratifiedKFold oder ShuffleSplit bevorzugen.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
pint

Größe der Testsets. Muss strikt kleiner sein als die Anzahl der Stichproben.

Beispiele

>>> import numpy as np
>>> from sklearn.model_selection import LeavePOut
>>> X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
>>> y = np.array([1, 2, 3, 4])
>>> lpo = LeavePOut(2)
>>> lpo.get_n_splits(X)
6
>>> print(lpo)
LeavePOut(p=2)
>>> for i, (train_index, test_index) in enumerate(lpo.split(X)):
...     print(f"Fold {i}:")
...     print(f"  Train: index={train_index}")
...     print(f"  Test:  index={test_index}")
Fold 0:
  Train: index=[2 3]
  Test:  index=[0 1]
Fold 1:
  Train: index=[1 3]
  Test:  index=[0 2]
Fold 2:
  Train: index=[1 2]
  Test:  index=[0 3]
Fold 3:
  Train: index=[0 3]
  Test:  index=[1 2]
Fold 4:
  Train: index=[0 2]
  Test:  index=[1 3]
Fold 5:
  Train: index=[0 1]
  Test:  index=[2 3]
get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:
routingMetadataRequest

Ein MetadataRequest, der Routing-Informationen kapselt.

get_n_splits(X, y=None, groups=None)[Quelle]#

Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.

Parameter:
Xarray-like der Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

yarray-like mit Form (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

groupsarray-like of shape (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

split(X, y=None, groups=None)[Quelle]#

Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.

Parameter:
Xarray-like der Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

yarray-like mit Form (n_samples,), default=None

Die Zielvariable für überwachte Lernprobleme.

groupsarray-like of shape (n_samples,), default=None

Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt:
trainndarray

Die Trainingsset-Indizes für diese Teilung.

testndarray

Die Testset-Indizes für diese Teilung.