sklearn.preprocessing#

Methoden zum Skalieren, Zentrieren, Normalisieren, Binarisieren und mehr.

Benutzerhandbuch. Weitere Details finden Sie im Abschnitt Datenvorverarbeitung.

Binarizer

Binarisiert Daten (Setzt Merkmalswerte auf 0 oder 1) gemäß einer Schwelle.

FunctionTransformer

Konstruiert einen Transformator aus einer beliebigen aufrufbaren Funktion.

KBinsDiscretizer

Teilt kontinuierliche Daten in Intervalle auf.

KernelCenterer

Zentriert eine beliebige Kernelmatrix \(K\).

LabelBinarizer

Binarisiert Labels im One-vs-all-Verfahren.

LabelEncoder

Kodiert Ziel-Labels mit Werten zwischen 0 und n_classes-1.

MaxAbsScaler

Skaliert jedes Merkmal nach seinem maximalen absoluten Wert.

MinMaxScaler

Transformiert Merkmale durch Skalierung jedes Merkmals auf einen gegebenen Bereich.

MultiLabelBinarizer

Transformiert zwischen iterierbaren von iterierbaren und einem Multilabel-Format.

Normalizer

Normalisiert Stichproben einzeln auf Norm 1.

OneHotEncoder

Kodiert kategoriale Merkmale als eine One-Hot-numerische Matrix.

OrdinalEncoder

Kodiert kategoriale Merkmale als eine Ganzzahlmatrix.

PolynomialFeatures

Generiert Polynom- und Interaktionsmerkmale.

PowerTransformer

Wendet eine Potenztransformation merkmalweise an, um Daten mehr Gauss'sche Eigenschaften zu verleihen.

QuantileTransformer

Transformiert Merkmale mithilfe von Quantilinformationen.

RobustScaler

Skaliert Merkmale unter Verwendung von Statistiken, die robust gegenüber Ausreißern sind.

SplineTransformer

Generiert univariaten B-Spline-Basis für Merkmale.

StandardScaler

Standardisiert Merkmale durch Entfernen des Mittelwerts und Skalierung auf Einheitsvarianz.

TargetEncoder

Ziel-Encoder für Regressions- und Klassifikationsziele.

add_dummy_feature

Erweitert den Datensatz um ein zusätzliches Dummy-Merkmal.

binarize

Boolesches Thresholding von Array-ähnlichen oder Scipy.sparse Matrizen.

label_binarize

Binarisiert Labels im One-vs-all-Verfahren.

maxabs_scale

Skaliert jedes Merkmal auf den Bereich [-1, 1], ohne die Sparsity zu brechen.

minmax_scale

Transformiert Merkmale durch Skalierung jedes Merkmals auf einen gegebenen Bereich.

normalize

Skaliert Eingabevektoren einzeln auf Einheitsnorm (Vektorlänge).

power_transform

Parametrische, monotone Transformation, um Daten mehr Gauss'sche Eigenschaften zu verleihen.

quantile_transform

Transformiert Merkmale mithilfe von Quantilinformationen.

robust_scale

Standardisiert einen Datensatz entlang einer beliebigen Achse.

scale

Standardisiert einen Datensatz entlang einer beliebigen Achse.