LeavePOut#
- class sklearn.model_selection.LeavePOut(p)[Quelle]#
Leave-P-Out Kreuzvalidierer.
Stellt Trainings-/Testindices zum Aufteilen von Daten in Trainings-/Testsets bereit. Dies führt in jeder Iteration dazu, dass alle unterschiedlichen Stichproben der Größe p getestet werden, während die verbleibenden n - p Stichproben den Trainingssatz bilden.
Hinweis:
LeavePOut(p)ist NICHT äquivalent zuKFold(n_splits=n_samples // p), das sich nicht überlappende Testsets erstellt.Aufgrund der hohen Anzahl von Iterationen, die kombinatorisch mit der Anzahl der Stichproben wächst, kann diese Kreuzvalidierungsmethode sehr kostspielig sein. Bei großen Datensätzen sollte man
KFold,StratifiedKFoldoderShuffleSplitbevorzugen.Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- pint
Größe der Testsets. Muss strikt kleiner sein als die Anzahl der Stichproben.
Beispiele
>>> import numpy as np >>> from sklearn.model_selection import LeavePOut >>> X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]]) >>> y = np.array([1, 2, 3, 4]) >>> lpo = LeavePOut(2) >>> lpo.get_n_splits(X) 6 >>> print(lpo) LeavePOut(p=2) >>> for i, (train_index, test_index) in enumerate(lpo.split(X)): ... print(f"Fold {i}:") ... print(f" Train: index={train_index}") ... print(f" Test: index={test_index}") Fold 0: Train: index=[2 3] Test: index=[0 1] Fold 1: Train: index=[1 3] Test: index=[0 2] Fold 2: Train: index=[1 2] Test: index=[0 3] Fold 3: Train: index=[0 3] Test: index=[1 2] Fold 4: Train: index=[0 2] Test: index=[1 3] Fold 5: Train: index=[0 1] Test: index=[2 3]
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_n_splits(X, y=None, groups=None)[Quelle]#
Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.- yarray-like mit Form (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- groupsarray-like of shape (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- split(X, y=None, groups=None)[Quelle]#
Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.- yarray-like mit Form (n_samples,), default=None
Die Zielvariable für überwachte Lernprobleme.
- groupsarray-like of shape (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- Gibt:
- trainndarray
Die Trainingsset-Indizes für diese Teilung.
- testndarray
Die Testset-Indizes für diese Teilung.