MaxAbsScaler#
- class sklearn.preprocessing.MaxAbsScaler(*, copy=True, clip=False)[Quelle]#
Skaliert jedes Merkmal nach seinem maximalen absoluten Wert.
Dieser Schätzer skaliert und verschiebt jede Merkmal individuell so, dass der maximale absolute Wert jedes Merkmals im Trainingsdatensatz 1,0 beträgt. Er verschiebt/zentriert die Daten nicht und zerstört daher keine Spärlichkeit.
Dieser Scaler kann auch auf spärliche CSR- oder CSC-Matrizen angewendet werden.
MaxAbsScalerreduziert die Auswirkung von Ausreißern nicht; er skaliert sie nur linear herunter. Eine Beispielvisualisierung finden Sie unter MaxAbsScaler mit anderen Scalern vergleichen.Hinzugefügt in Version 0.17.
- Parameter:
- copybool, Standard=True
Auf False setzen, um eine Skalierung inplace durchzuführen und eine Kopie zu vermeiden (wenn die Eingabe bereits ein Numpy-Array ist).
- clipbool, Standard=False
Auf True setzen, um transformierte Werte von zurückgehaltenen Daten auf [-1, 1] zu beschneiden. Da dieser Parameter Werte beschneidet, kann
inverse_transformdie ursprünglichen Daten möglicherweise nicht wiederherstellen.Hinweis
Das Setzen von
clip=Trueverhindert keine Merkmalsdrift (eine Verteilungsverschiebung zwischen Trainings- und Testdaten). Die transformierten Werte werden auf den Bereich [-1, 1] beschnitten, was unerwünschte Verhaltensweisen in Modellen, die empfindlich auf Eingaben außerhalb des Bereichs reagieren (z. B. lineare Modelle), vermeidet. Mit Vorsicht verwenden, da das Beschneiden die Verteilung von Testdaten verzerren kann.
- Attribute:
- scale_ndarray der Form (n_features,)
Relative Skalierung der Daten pro Merkmal.
Hinzugefügt in Version 0.17: scale_ Attribut.
- max_abs_ndarray der Form (n_features,)
Maximaler absoluter Wert pro Merkmal.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
- n_samples_seen_int
Die Anzahl der vom Schätzer verarbeiteten Stichproben. Wird bei neuen Aufrufen von fit zurückgesetzt, inkrementiert aber über
partial_fit-Aufrufe hinweg.
Siehe auch
maxabs_scaleÄquivalente Funktion ohne die Estimator-API.
Anmerkungen
NaNs werden als fehlende Werte behandelt: bei fit ignoriert und bei transform beibehalten.
Beispiele
>>> from sklearn.preprocessing import MaxAbsScaler >>> X = [[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]] >>> transformer = MaxAbsScaler().fit(X) >>> transformer MaxAbsScaler() >>> transformer.transform(X) array([[ 0.5, -1. , 1. ], [ 1. , 0. , 0. ], [ 0. , 1. , -0.5]])
- fit(X, y=None)[Quelle]#
Berechnet den maximalen absoluten Wert, der für die spätere Skalierung verwendet wird.
- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_features)
Die Daten, die zur Berechnung des pro Merkmal minimalen und maximalen Werts für die spätere Skalierung entlang der Merkmalsachse verwendet werden.
- yNone
Ignoriert.
- Gibt zurück:
- selfobject
Gefitteter Scaler.
- fit_transform(X, y=None, **fit_params)[Quelle]#
An Daten anpassen, dann transformieren.
Passt den Transformer an
Xundymit optionalen Parameternfit_paramsan und gibt eine transformierte Version vonXzurück.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Eingabestichproben.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- **fit_paramsdict
Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner
fit-Methode akzeptiert.
- Gibt zurück:
- X_newndarray array der Form (n_samples, n_features_new)
Transformiertes Array.
- get_feature_names_out(input_features=None)[Quelle]#
Holt die Ausgabemerkmale für die Transformation.
- Parameter:
- input_featuresarray-like von str oder None, default=None
Eingabemerkmale.
Wenn
input_featuresNoneist, werdenfeature_names_in_als Merkmalnamen verwendet. Wennfeature_names_in_nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert:["x0", "x1", ..., "x(n_features_in_ - 1)"].Wenn
input_featuresein Array-ähnliches Objekt ist, mussinput_featuresmitfeature_names_in_übereinstimmen, wennfeature_names_in_definiert ist.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Gleich wie Eingabemerkmale.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- inverse_transform(X)[Quelle]#
Skaliert die Daten zurück in die ursprüngliche Darstellung.
- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_features)
Die Daten, die zurücktransformiert werden sollen.
- Gibt zurück:
- X_original{ndarray, sparse matrix} der Form (n_samples, n_features)
Transformiertes Array.
- partial_fit(X, y=None)[Quelle]#
Online-Berechnung des maximalen absoluten Werts von X für die spätere Skalierung.
Alle von X werden als eine einzige Charge verarbeitet. Dies ist für Fälle gedacht, in denen
fitaufgrund einer sehr großen Anzahl vonn_samplesnicht durchführbar ist oder weil X aus einem kontinuierlichen Stream gelesen wird.- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_features)
Die Daten, die zur Berechnung des Mittelwerts und der Standardabweichung für die spätere Skalierung entlang der Merkmalachse verwendet werden.
- yNone
Ignoriert.
- Gibt zurück:
- selfobject
Gefitteter Scaler.
- set_output(*, transform=None)[Quelle]#
Ausgabecontainer festlegen.
Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.
- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
Hinzugefügt in Version 1.4: Die Option
"polars"wurde hinzugefügt.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
Galeriebeispiele#
Vergleich der Auswirkungen verschiedener Skalierer auf Daten mit Ausreißern