FeatureUnion#

class sklearn.pipeline.FeatureUnion(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False, verbose_feature_names_out=True)[Quelle]#

Verkettet die Ergebnisse mehrerer Transformer-Objekte.

Dieser Estimator wendet parallel eine Liste von Transformer-Objekten auf die Eingabedaten an und verkettet dann die Ergebnisse. Dies ist nützlich, um mehrere Merkmalsextraktionsmechanismen zu einem einzigen Transformer zu kombinieren.

Parameter der Transformer können über ihren Namen und den Parameternamen, getrennt durch ein „__“, eingestellt werden. Ein Transformer kann vollständig ersetzt werden, indem der Parameter mit seinem Namen auf einen anderen Transformer gesetzt wird, entfernt wird, indem er auf „drop“ gesetzt wird, oder deaktiviert wird, indem er auf „passthrough“ gesetzt wird (Merkmale werden ohne Transformation weitergegeben).

Lesen Sie mehr im Benutzerhandbuch.

Hinzugefügt in Version 0.13.

Parameter:
transformer_listListe von (str, transformer) Tupeln

Liste der auf die Daten anzuwendenden Transformer-Objekte. Die erste Hälfte jedes Tupels ist der Name des Transformers. Der Transformer kann „drop“ sein, um ihn zu ignorieren, oder „passthrough“, damit die Merkmale unverändert weitergegeben werden.

Hinzugefügt in Version 1.1: Option "passthrough" hinzugefügt.

Geändert in Version 0.22: None als Transformer zugunsten von ‚drop‘ veraltet.

n_jobsint, default=None

Anzahl der parallel auszuführenden Jobs. None bedeutet 1, es sei denn, es befindet sich in einem joblib.parallel_backend Kontext. -1 bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.

Geändert in Version v0.20: Standardwert von n_jobs von 1 auf None geändert

transformer_weightsdict, Standardwert=None

Multiplikative Gewichte für Merkmale pro Transformer. Schlüssel sind Transformer-Namen, Werte sind die Gewichte. Löst einen ValueError aus, wenn ein Schlüssel nicht in transformer_list vorhanden ist.

verbosebool, default=False

Wenn True, wird die Zeit, die für das Anpassen jedes Transformers benötigt wird, während seiner Fertigstellung ausgegeben.

verbose_feature_names_outbool, Standardwert=True

Wenn True, wird get_feature_names_out allen Merkmalsnamen das Präfix des Namens des Transformers voranstellen, der dieses Merkmal generiert hat. Wenn False, wird get_feature_names_out keine Merkmalsnamen voranstellen und einen Fehler auslösen, wenn die Merkmalsnamen nicht eindeutig sind.

Hinzugefügt in Version 1.5.

Attribute:
named_transformersBunch

Wörterbuchähnliches Objekt mit den folgenden Attributen. Schreibgeschütztes Attribut zum Zugriff auf jeden Transformer-Parameter über den vom Benutzer angegebenen Namen. Schlüssel sind Transformer-Namen und Werte sind Transformer-Parameter.

Hinzugefügt in Version 1.2.

n_features_in_int

Anzahl der während des fits gesehenen Merkmale.

feature_names_in_ndarray der Form (n_features_in_,)

Namen der während fit gesehenen Merkmale.

Siehe auch

make_union

Bequemlichkeitsfunktion für die vereinfachte Konstruktion von Feature Unions.

Beispiele

>>> from sklearn.pipeline import FeatureUnion
>>> from sklearn.decomposition import PCA, TruncatedSVD
>>> union = FeatureUnion([("pca", PCA(n_components=1)),
...                       ("svd", TruncatedSVD(n_components=2))])
>>> X = [[0., 1., 3], [2., 2., 5]]
>>> union.fit_transform(X)
array([[-1.5       ,  3.04, -0.872],
       [ 1.5       ,  5.72,  0.463]])
>>> # An estimator's parameter can be set using '__' syntax
>>> union.set_params(svd__n_components=1).fit_transform(X)
array([[-1.5       ,  3.04],
       [ 1.5       ,  5.72]])

Ein detaillierteres Anwendungsbeispiel finden Sie unter Verketten mehrerer Merkmalsextraktionsmethoden.

fit(X, y=None, **fit_params)[Quelle]#

Alle Transformer mit X anpassen.

Parameter:
Xiterable oder array-ähnlich, abhängig von den Transformern

Eingabedaten, die zum Anpassen der Transformer verwendet werden.

yarray-ähnlich der Form (n_samples, n_outputs), Standardwert=None

Ziele für überwachtes Lernen.

**fit_paramsdict, Standardwert=None
  • Wenn enable_metadata_routing=False (Standard): Parameter, die direkt an die fit Methoden der Unter-Transformer übergeben werden.

  • Wenn enable_metadata_routing=True: Sicher an die fit Methoden der Unter-Transformer weitergeleitete Parameter. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Geändert in Version 1.5: **fit_params können über die Metadaten-Routing-API weitergeleitet werden.

Gibt zurück:
selfobject

FeatureUnion-Klasseninstanz.

fit_transform(X, y=None, **params)[Quelle]#

Alle Transformer anpassen, die Daten transformieren und die Ergebnisse verketten.

Parameter:
Xiterable oder array-ähnlich, abhängig von den Transformern

Zu transformierende Eingabedaten.

yarray-ähnlich der Form (n_samples, n_outputs), Standardwert=None

Ziele für überwachtes Lernen.

**paramsdict, default=None
  • Wenn enable_metadata_routing=False (Standard): Parameter, die direkt an die fit Methoden der Unter-Transformer übergeben werden.

  • Wenn enable_metadata_routing=True: Sicher an die fit Methoden der Unter-Transformer weitergeleitete Parameter. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Geändert in Version 1.5: **params können jetzt über die Metadaten-Routing-API weitergeleitet werden.

Gibt zurück:
X_tarray-ähnlich oder spärrige Matrix der Form (n_samples, sum_n_components)

Die hstack der Ergebnisse der Transformer. sum_n_components ist die Summe von n_components (Ausgabedimension) über die Transformer.

get_feature_names_out(input_features=None)[Quelle]#

Holt die Ausgabemerkmale für die Transformation.

Parameter:
input_featuresarray-like von str oder None, default=None

Eingabemerkmale.

Gibt zurück:
feature_names_outndarray von str-Objekten

Transformierte Merkmalnamen.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Hinzugefügt in Version 1.5.

Gibt zurück:
routingMetadataRouter

Ein MetadataRouter, der die Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Gibt die im Konstruktor übergebenen Parameter sowie die im transformer_list von FeatureUnion enthaltenen Estimators zurück.

Parameter:
deepbool, default=True

Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:
paramsMapping von string zu any

Parameternamen, zugeordnet ihren Werten.

set_output(*, transform=None)[Quelle]#

Setzt den Ausgabebereich, wenn "transform" und "fit_transform" aufgerufen werden.

set_output setzt die Ausgabe aller Estimators in transformer_list.

Parameter:
transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

  • "default": Standardausgabeformat eines Transformers

  • "pandas": DataFrame-Ausgabe

  • "polars": Polars-Ausgabe

  • None: Die Transformationskonfiguration bleibt unverändert

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

set_params(**kwargs)[Quelle]#

Setzt die Parameter dieses Schätzers.

Gültige Parameternamen können mit get_params() aufgelistet werden. Beachten Sie, dass Sie die Parameter der in transformer_list enthaltenen Estimators direkt einstellen können.

Parameter:
**kwargsdict

Parameter dieses Estimators oder Parameter von in transform_list enthaltenen Estimators. Parameter der Transformer können über ihren Namen und den Parameternamen, getrennt durch ein „__“, eingestellt werden.

Gibt zurück:
selfobject

FeatureUnion-Klasseninstanz.

transform(X, **params)[Quelle]#

Transformiert X separat durch jeden Transformer, verkettet die Ergebnisse.

Parameter:
Xiterable oder array-ähnlich, abhängig von den Transformern

Zu transformierende Eingabedaten.

**paramsdict, default=None

Parameter, die über die Metadaten-Routing-API an die transform Methode der Unter-Transformer weitergeleitet werden. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Hinzugefügt in Version 1.5.

Gibt zurück:
X_tarray-ähnlich oder spärrige Matrix der Form (n_samples, sum_n_components)

Die hstack der Ergebnisse der Transformer. sum_n_components ist die Summe von n_components (Ausgabedimension) über die Transformer.