check_array#
- sklearn.utils.check_array(array, accept_sparse=False, *, accept_large_sparse=True, dtype='numeric', order=None, copy=False, force_writeable=False, ensure_all_finite=True, ensure_non_negative=False, ensure_2d=True, allow_nd=False, ensure_min_samples=1, ensure_min_features=1, estimator=None, input_name='')[Quelle]#
Eingabevalidierung für ein Array, eine Liste, eine spärliche Matrix oder ähnliches.
Standardmäßig wird die Eingabe auf ein nicht-leeres 2D-Array mit ausschließlich endlichen Werten überprüft. Wenn der dtype des Arrays object ist, wird versucht, in float zu konvertieren, wobei bei Fehlschlag ein Fehler ausgelöst wird.
- Parameter:
- arrayobject
Zu überprüfendes / zu konvertierendes Eingabeobjekt.
- accept_sparsestr, bool oder list/tuple von str, default=False
Zeichenkette(n), die erlaubte sparse Matrix-Formate darstellen, wie z.B. ‘csc’, ‘csr’ usw. Wenn die Eingabe sparse, aber nicht im erlaubten Format ist, wird sie in das erste gelistete Format konvertiert. True erlaubt, dass die Eingabe jedes Format hat. False bedeutet, dass eine sparse Matrix-Eingabe einen Fehler auslöst.
- accept_large_sparsebool, default=True
Wenn eine CSR-, CSC-, COO- oder BSR-sparse Matrix bereitgestellt und von accept_sparse akzeptiert wird, führt accept_large_sparse=False dazu, dass sie nur akzeptiert wird, wenn ihre Indizes mit einem 32-Bit-dtype gespeichert sind.
Hinzugefügt in Version 0.20.
- dtype‘numeric’, type, list von type oder None, default=’numeric’
Datentyp des Ergebnisses. Wenn None, wird der dtype der Eingabe beibehalten. Wenn “numeric”, wird der dtype beibehalten, es sei denn, array.dtype ist object. Wenn dtype eine Liste von Typen ist, wird die Konvertierung auf den ersten Typ nur dann durchgeführt, wenn der dtype der Eingabe nicht in der Liste enthalten ist.
- order{‘F’, ‘C’} oder None, default=None
Ob ein Array zu fortran- oder c-style gezwungen wird. Wenn order None (Standard) ist, dann wird bei copy=False nichts über das Speicherlayout des Ausgabearrays sichergestellt; andernfalls (copy=True) wird das Speicherlayout des zurückgegebenen Arrays so nah wie möglich am ursprünglichen Array gehalten.
- copybool, default=False
Ob eine erzwungene Kopie ausgelöst wird. Wenn copy=False, kann eine Konvertierung eine Kopie auslösen.
- force_writeablebool, default=False
Ob das Ausgabearray schreibbar erzwungen werden soll. Wenn True, wird garantiert, dass das zurückgegebene Array schreibbar ist, was möglicherweise eine Kopie erfordert. Andernfalls wird die Schreibbarkeit des Eingabearrays beibehalten.
Hinzugefügt in Version 1.6.
- ensure_all_finitebool oder ‘allow-nan’, Standard=True
Ob ein Fehler bei np.inf, np.nan, pd.NA im Array ausgelöst werden soll. Die Möglichkeiten sind
True: Alle Werte des Arrays werden zu endlichen Werten gezwungen.
False: Akzeptiert np.inf, np.nan, pd.NA im Array.
‘allow-nan’: Akzeptiert nur np.nan und pd.NA Werte im Array. Werte dürfen nicht unendlich sein.
Hinzugefügt in Version 1.6:
force_all_finitewurde inensure_all_finiteumbenannt.- ensure_non_negativebool, default=False
Stellen Sie sicher, dass das Array nur nicht-negative Werte enthält. Wenn True, löst ein Array, das negative Werte enthält, einen ValueError aus.
Hinzugefügt in Version 1.6.
- ensure_2dbool, default=True
Ob ein ValueError ausgelöst werden soll, wenn das Array nicht 2D ist.
- allow_ndbool, default=False
Ob array.ndim > 2 zugelassen werden soll.
- ensure_min_samplesint, default=1
Stellen Sie sicher, dass das Array eine minimale Anzahl von Samples in seiner ersten Achse hat (Zeilen für ein 2D-Array). Die Einstellung auf 0 deaktiviert diese Überprüfung.
- ensure_min_featuresint, default=1
Stellen Sie sicher, dass das 2D-Array eine minimale Anzahl von Merkmalen (Spalten) hat. Der Standardwert von 1 lehnt leere Datensätze ab. Diese Überprüfung wird nur dann durchgesetzt, wenn die Eingabedaten effektiv 2 Dimensionen haben oder ursprünglich 1D sind und
ensure_2dTrue ist. Die Einstellung auf 0 deaktiviert diese Überprüfung.- estimatorstr oder Estimator-Instanz, default=None
Wenn übergeben, schließen Sie den Namen des Estimators in Warnmeldungen ein.
- input_namestr, Standard=””
Der Datenname, der zur Erstellung der Fehlermeldung verwendet wird. Insbesondere wenn
input_name"X" ist und die Daten NaN-Werte enthalten und allow_nan False ist, verweist die Fehlermeldung auf die Dokumentation des Imputers.Hinzugefügt in Version 1.1.0.
- Gibt zurück:
- array_convertedobject
Das konvertierte und validierte Array.
Beispiele
>>> from sklearn.utils.validation import check_array >>> X = [[1, 2, 3], [4, 5, 6]] >>> X_checked = check_array(X) >>> X_checked array([[1, 2, 3], [4, 5, 6]])