LeaveOneOut#
- class sklearn.model_selection.LeaveOneOut[Quelle]#
Leave-One-Out Kreuzvalidierer.
Stellt Trainings-/Test-Indizes zum Aufteilen von Daten in Trainings-/Test-Sets bereit. Jede Stichprobe wird einmal als Test-Set (Singleton) verwendet, während die verbleibenden Stichproben das Trainings-Set bilden.
Hinweis:
LeaveOneOut()ist äquivalent zuKFold(n_splits=n)undLeavePOut(p=1), wobeindie Anzahl der Stichproben ist.Aufgrund der hohen Anzahl von Test-Sets (die gleich der Anzahl der Stichproben ist) kann diese Kreuzvalidierungsmethode sehr kostspielig sein. Für große Datensätze sollte
KFold,ShuffleSplitoderStratifiedKFoldbevorzugt werden.Lesen Sie mehr im Benutzerhandbuch.
Siehe auch
LeaveOneGroupOutZum Aufteilen der Daten gemäß expliziter, domänenspezifischer Schichtung des Datensatzes.
GroupKFoldK-Fold Iterator-Variante mit nicht überlappenden Gruppen.
Beispiele
>>> import numpy as np >>> from sklearn.model_selection import LeaveOneOut >>> X = np.array([[1, 2], [3, 4]]) >>> y = np.array([1, 2]) >>> loo = LeaveOneOut() >>> loo.get_n_splits(X) 2 >>> print(loo) LeaveOneOut() >>> for i, (train_index, test_index) in enumerate(loo.split(X)): ... print(f"Fold {i}:") ... print(f" Train: index={train_index}") ... print(f" Test: index={test_index}") Fold 0: Train: index=[1] Test: index=[0] Fold 1: Train: index=[0] Test: index=[1]
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_n_splits(X, y=None, groups=None)[Quelle]#
Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.- yarray-like mit Form (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- groupsarray-like of shape (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- Gibt zurück:
- n_splitsint
Gibt die Anzahl der Teilungsschritte im Kreuzvalidierer zurück.
- split(X, y=None, groups=None)[Quelle]#
Generiert Indizes zum Aufteilen von Daten in Trainings- und Testsets.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.- yarray-like mit Form (n_samples,), default=None
Die Zielvariable für überwachte Lernprobleme.
- groupsarray-like of shape (n_samples,), default=None
Immer ignoriert, existiert aus API-Kompatibilitätsgründen.
- Gibt:
- trainndarray
Die Trainingsset-Indizes für diese Teilung.
- testndarray
Die Testset-Indizes für diese Teilung.