MaxAbsScaler#

class sklearn.preprocessing.MaxAbsScaler(*, copy=True, clip=False)[Quelle]#

Skaliert jedes Merkmal nach seinem maximalen absoluten Wert.

Dieser Schätzer skaliert und verschiebt jede Merkmal individuell so, dass der maximale absolute Wert jedes Merkmals im Trainingsdatensatz 1,0 beträgt. Er verschiebt/zentriert die Daten nicht und zerstört daher keine Spärlichkeit.

Dieser Scaler kann auch auf spärliche CSR- oder CSC-Matrizen angewendet werden.

MaxAbsScaler reduziert die Auswirkung von Ausreißern nicht; er skaliert sie nur linear herunter. Eine Beispielvisualisierung finden Sie unter MaxAbsScaler mit anderen Scalern vergleichen.

Hinzugefügt in Version 0.17.

Parameter:

copybool, Standard=True: Auf False setzen, um eine Skalierung inplace durchzuführen und eine Kopie zu vermeiden (wenn die Eingabe bereits ein Numpy-Array ist).
clipbool, Standard=False: Auf True setzen, um transformierte Werte von zurückgehaltenen Daten auf [-1, 1] zu beschneiden. Da dieser Parameter Werte beschneidet, kann inverse_transform die ursprünglichen Daten möglicherweise nicht wiederherstellen.

Hinweis

Das Setzen von clip=True verhindert keine Merkmalsdrift (eine Verteilungsverschiebung zwischen Trainings- und Testdaten). Die transformierten Werte werden auf den Bereich [-1, 1] beschnitten, was unerwünschte Verhaltensweisen in Modellen, die empfindlich auf Eingaben außerhalb des Bereichs reagieren (z. B. lineare Modelle), vermeidet. Mit Vorsicht verwenden, da das Beschneiden die Verteilung von Testdaten verzerren kann.

Attribute:

scale_ndarray der Form (n_features,): Relative Skalierung der Daten pro Merkmal.

Hinzugefügt in Version 0.17: scale_ Attribut.
max_abs_ndarray der Form (n_features,): Maximaler absoluter Wert pro Merkmal.
n_features_in_int: Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.
feature_names_in_ndarray mit Form (n_features_in_,): Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.
n_samples_seen_int: Die Anzahl der vom Schätzer verarbeiteten Stichproben. Wird bei neuen Aufrufen von fit zurückgesetzt, inkrementiert aber über partial_fit-Aufrufe hinweg.

Siehe auch

maxabs_scale: Äquivalente Funktion ohne die Estimator-API.

Anmerkungen

NaNs werden als fehlende Werte behandelt: bei fit ignoriert und bei transform beibehalten.

Beispiele

>>> from sklearn.preprocessing import MaxAbsScaler
>>> X = [[ 1., -1.,  2.],
...      [ 2.,  0.,  0.],
...      [ 0.,  1., -1.]]
>>> transformer = MaxAbsScaler().fit(X)
>>> transformer
MaxAbsScaler()
>>> transformer.transform(X)
array([[ 0.5, -1. ,  1. ],
       [ 1. ,  0. ,  0. ],
       [ 0. ,  1. , -0.5]])

fit(X, y=None)[Quelle]#

Berechnet den maximalen absoluten Wert, der für die spätere Skalierung verwendet wird.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Die Daten, die zur Berechnung des pro Merkmal minimalen und maximalen Werts für die spätere Skalierung entlang der Merkmalsachse verwendet werden.
yNone: Ignoriert.

Gibt zurück:

selfobject: Gefitteter Scaler.

fit_transform(X, y=None, **fit_params)[Quelle]#

An Daten anpassen, dann transformieren.

Passt den Transformer an X und y mit optionalen Parametern fit_params an und gibt eine transformierte Version von X zurück.

Parameter:

Xarray-like der Form (n_samples, n_features): Eingabestichproben.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None: Zielwerte (None für unüberwachte Transformationen).
**fit_paramsdict: Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner fit-Methode akzeptiert.

Gibt zurück:

X_newndarray array der Form (n_samples, n_features_new): Transformiertes Array.

get_feature_names_out(input_features=None)[Quelle]#

Holt die Ausgabemerkmale für die Transformation.

Parameter:

input_featuresarray-like von str oder None, default=None

Eingabemerkmale.

Wenn input_features None ist, werden feature_names_in_ als Merkmalnamen verwendet. Wenn feature_names_in_ nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert: ["x0", "x1", ..., "x(n_features_in_ - 1)"].
Wenn input_features ein Array-ähnliches Objekt ist, muss input_features mit feature_names_in_ übereinstimmen, wenn feature_names_in_ definiert ist.

Gibt zurück:

feature_names_outndarray von str-Objekten: Gleich wie Eingabemerkmale.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:

routingMetadataRequest: Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:

deepbool, default=True: Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:

paramsdict: Parameternamen, zugeordnet ihren Werten.

inverse_transform(X)[Quelle]#

Skaliert die Daten zurück in die ursprüngliche Darstellung.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Die Daten, die zurücktransformiert werden sollen.

Gibt zurück:

X_original{ndarray, sparse matrix} der Form (n_samples, n_features): Transformiertes Array.

partial_fit(X, y=None)[Quelle]#

Online-Berechnung des maximalen absoluten Werts von X für die spätere Skalierung.

Alle von X werden als eine einzige Charge verarbeitet. Dies ist für Fälle gedacht, in denen fit aufgrund einer sehr großen Anzahl von n_samples nicht durchführbar ist oder weil X aus einem kontinuierlichen Stream gelesen wird.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Die Daten, die zur Berechnung des Mittelwerts und der Standardabweichung für die spätere Skalierung entlang der Merkmalachse verwendet werden.
yNone: Ignoriert.

Gibt zurück:

selfobject: Gefitteter Scaler.

set_output(*, transform=None)[Quelle]#

Ausgabecontainer festlegen.

Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.

Parameter:

transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

"default": Standardausgabeformat eines Transformers
"pandas": DataFrame-Ausgabe
"polars": Polars-Ausgabe
None: Die Transformationskonfiguration bleibt unverändert

Hinzugefügt in Version 1.4: Die Option "polars" wurde hinzugefügt.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:

**paramsdict: Schätzer-Parameter.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

transform(X)[Quelle]#

Skaliert die Daten.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Die Daten, die skaliert werden sollen.

Gibt zurück:

X_tr{ndarray, sparse matrix} mit der Form (n_samples, n_features): Transformiertes Array.

Galeriebeispiele#

Vergleich der Auswirkungen verschiedener Skalierer auf Daten mit Ausreißern

MaxAbsScaler#

Galeriebeispiele#

Diese Seite