LeavePOut#

class sklearn.model_selection.LeavePOut(p)[Quelle]#

Leave-P-Out Kreuzvalidierer.

Stellt Trainings-/Testindices zum Aufteilen von Daten in Trainings-/Testsets bereit. Dies führt in jeder Iteration dazu, dass alle unterschiedlichen Stichproben der Größe p getestet werden, während die verbleibenden n - p Stichproben den Trainingssatz bilden.

Hinweis: LeavePOut(p) ist NICHT äquivalent zu KFold(n_splits=n_samples // p), das sich nicht überlappende Testsets erstellt.

Aufgrund der hohen Anzahl von Iterationen, die kombinatorisch mit der Anzahl der Stichproben wächst, kann diese Kreuzvalidierungsmethode sehr kostspielig sein. Bei großen Datensätzen sollte man KFold, StratifiedKFold oder ShuffleSplit bevorzugen.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

pint: Größe der Testsets. Muss strikt kleiner sein als die Anzahl der Stichproben.

Beispiele

>>> import numpy as np
>>> from sklearn.model_selection import LeavePOut
>>> X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
>>> y = np.array([1, 2, 3, 4])
>>> lpo = LeavePOut(2)
>>> lpo.get_n_splits(X)
6
>>> print(lpo)
LeavePOut(p=2)
>>> for i, (train_index, test_index) in enumerate(lpo.split(X)):
...     print(f"Fold {i}:")
...     print(f"  Train: index={train_index}")
...     print(f"  Test:  index={test_index}")
Fold 0:
  Train: index=[2 3]
  Test:  index=[0 1]
Fold 1:
  Train: index=[1 3]
  Test:  index=[0 2]
Fold 2:
  Train: index=[1 2]
  Test:  index=[0 3]
Fold 3:
  Train: index=[0 3]
  Test:  index=[1 2]
Fold 4:
  Train: index=[0 2]
  Test:  index=[1 3]
Fold 5:
  Train: index=[0 1]
  Test:  index=[2 3]

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:

routingMetadataRequest: Ein MetadataRequest, der Routing-Informationen kapselt.

get_n_splits(X, y=None, groups=None)[Quelle]#

Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.

Parameter:

Xarray-like der Form (n_samples, n_features): Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.
yarray-like mit Form (n_samples,), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
groupsarray-like of shape (n_samples,), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

split(X, y=None, groups=None)[Quelle]#

Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.

Parameter:

Xarray-like der Form (n_samples, n_features): Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.
yarray-like mit Form (n_samples,), default=None: Die Zielvariable für überwachte Lernprobleme.
groupsarray-like of shape (n_samples,), default=None: Immer ignoriert, existiert aus API-Kompatibilitätsgründen.

Gibt:

trainndarray: Die Trainingsset-Indizes für diese Teilung.
testndarray: Die Testset-Indizes für diese Teilung.

LeavePOut#

Diese Seite