validate_data#

sklearn.utils.validation.validate_data(_estimator, /, X='no_validation', y='no_validation', reset=True, validate_separately=False, skip_check_array=False, **check_params)[Quelle]#

Validiert Eingabedaten und setzt oder prüft die Merkmalsnamen und die Anzahl der Eingaben.

Diese Hilfsfunktion sollte in einem Schätzer verwendet werden, der eine Eingabevalidierung erfordert. Sie verändert den Schätzer und setzt die Attribute n_features_in_ und feature_names_in_, wenn reset=True.

Hinzugefügt in Version 1.6.

Parameter:
_estimatorSchätzerinstanz

Der Schätzer, für den die Eingabe validiert werden soll.

X{array-ähnlich, dünne Matrix, DataFrame} der Form (n_samples, n_features), Standard=’no validation’

Die Eingabestichproben. Wenn 'no_validation', wird keine Validierung für X durchgeführt. Dies ist nützlich für Meta-Schätzer, die die Eingabevalidierung an ihre zugrunde liegenden Schätzer delegieren können. In diesem Fall muss y übergeben werden und die einzig akzeptierten check_params sind multi_output und y_numeric.

yarray-ähnlich der Form (n_samples,), Standard=’no_validation’

Die Zielwerte.

  • Wenn None, wird check_array auf X angewendet. Wenn das requires_y Tag des Schätzers True ist, wird ein Fehler ausgelöst.

  • Wenn 'no_validation', wird check_array auf X angewendet und das requires_y Tag des Schätzers wird ignoriert. Dies ist ein Standardplatzhalter und sollte niemals explizit gesetzt werden. In diesem Fall muss X übergeben werden.

  • Andernfalls werden nur y mit _check_y oder sowohl X als auch y mit entweder check_array oder check_X_y validiert, abhängig von validate_separately.

resetbool, Standard=True

Ob das Attribut n_features_in_ zurückgesetzt werden soll. Wenn False, wird die Eingabe auf Konsistenz mit Daten geprüft, die bereitgestellt wurden, als reset zuletzt True war.

Hinweis

Es wird empfohlen, reset=True in fit und beim ersten Aufruf von partial_fit aufzurufen. Alle anderen Methoden, die X validieren, sollten reset=False setzen.

validate_separatelyFalse oder Tupel von Dictionaries, Standard=False

Wird nur verwendet, wenn y nicht None ist. Wenn False, wird check_X_y aufgerufen. Andernfalls muss es ein Tupel von kwargs sein, das zum Aufrufen von check_array für X bzw. y verwendet wird.

estimator=self wird automatisch zu diesen Dictionaries hinzugefügt, um bei ungültigen Eingabedaten aussagekräftigere Fehlermeldungen zu generieren.

skip_check_arraybool, Standard=False

Wenn True, bleiben X und y unverändert und nur feature_names_in_ und n_features_in_ werden geprüft. Andernfalls wird check_array auf X und y angewendet.

**check_paramskwargs

Parameter, die an check_array oder check_X_y übergeben werden. Ignoriert, wenn validate_separately nicht False ist.

estimator=self wird automatisch zu diesen Parametern hinzugefügt, um bei ungültigen Eingabedaten aussagekräftigere Fehlermeldungen zu generieren.

Gibt zurück:
out{ndarray, dünne Matrix} oder Tupel davon

Die validierte Eingabe. Ein Tupel wird zurückgegeben, wenn sowohl X als auch y validiert werden.