FeatureUnion#
- class sklearn.pipeline.FeatureUnion(transformer_list, *, n_jobs=None, transformer_weights=None, verbose=False, verbose_feature_names_out=True)[Quelle]#
Verkettet die Ergebnisse mehrerer Transformer-Objekte.
Dieser Estimator wendet parallel eine Liste von Transformer-Objekten auf die Eingabedaten an und verkettet dann die Ergebnisse. Dies ist nützlich, um mehrere Merkmalsextraktionsmechanismen zu einem einzigen Transformer zu kombinieren.
Parameter der Transformer können über ihren Namen und den Parameternamen, getrennt durch ein „__“, eingestellt werden. Ein Transformer kann vollständig ersetzt werden, indem der Parameter mit seinem Namen auf einen anderen Transformer gesetzt wird, entfernt wird, indem er auf „drop“ gesetzt wird, oder deaktiviert wird, indem er auf „passthrough“ gesetzt wird (Merkmale werden ohne Transformation weitergegeben).
Lesen Sie mehr im Benutzerhandbuch.
Hinzugefügt in Version 0.13.
- Parameter:
- transformer_listListe von (str, transformer) Tupeln
Liste der auf die Daten anzuwendenden Transformer-Objekte. Die erste Hälfte jedes Tupels ist der Name des Transformers. Der Transformer kann „drop“ sein, um ihn zu ignorieren, oder „passthrough“, damit die Merkmale unverändert weitergegeben werden.
Hinzugefügt in Version 1.1: Option
"passthrough"hinzugefügt.Geändert in Version 0.22:
Noneals Transformer zugunsten von ‚drop‘ veraltet.- n_jobsint, default=None
Anzahl der parallel auszuführenden Jobs.
Nonebedeutet 1, es sei denn, es befindet sich in einemjoblib.parallel_backendKontext.-1bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.Geändert in Version v0.20: Standardwert von
n_jobsvon 1 auf None geändert- transformer_weightsdict, Standardwert=None
Multiplikative Gewichte für Merkmale pro Transformer. Schlüssel sind Transformer-Namen, Werte sind die Gewichte. Löst einen ValueError aus, wenn ein Schlüssel nicht in
transformer_listvorhanden ist.- verbosebool, default=False
Wenn True, wird die Zeit, die für das Anpassen jedes Transformers benötigt wird, während seiner Fertigstellung ausgegeben.
- verbose_feature_names_outbool, Standardwert=True
Wenn True, wird
get_feature_names_outallen Merkmalsnamen das Präfix des Namens des Transformers voranstellen, der dieses Merkmal generiert hat. Wenn False, wirdget_feature_names_outkeine Merkmalsnamen voranstellen und einen Fehler auslösen, wenn die Merkmalsnamen nicht eindeutig sind.Hinzugefügt in Version 1.5.
- Attribute:
- named_transformers
Bunch Wörterbuchähnliches Objekt mit den folgenden Attributen. Schreibgeschütztes Attribut zum Zugriff auf jeden Transformer-Parameter über den vom Benutzer angegebenen Namen. Schlüssel sind Transformer-Namen und Werte sind Transformer-Parameter.
Hinzugefügt in Version 1.2.
n_features_in_intAnzahl der während des fits gesehenen Merkmale.
feature_names_in_ndarray der Form (n_features_in_,)Namen der während fit gesehenen Merkmale.
- named_transformers
Siehe auch
make_unionBequemlichkeitsfunktion für die vereinfachte Konstruktion von Feature Unions.
Beispiele
>>> from sklearn.pipeline import FeatureUnion >>> from sklearn.decomposition import PCA, TruncatedSVD >>> union = FeatureUnion([("pca", PCA(n_components=1)), ... ("svd", TruncatedSVD(n_components=2))]) >>> X = [[0., 1., 3], [2., 2., 5]] >>> union.fit_transform(X) array([[-1.5 , 3.04, -0.872], [ 1.5 , 5.72, 0.463]]) >>> # An estimator's parameter can be set using '__' syntax >>> union.set_params(svd__n_components=1).fit_transform(X) array([[-1.5 , 3.04], [ 1.5 , 5.72]])
Ein detaillierteres Anwendungsbeispiel finden Sie unter Verketten mehrerer Merkmalsextraktionsmethoden.
- fit(X, y=None, **fit_params)[Quelle]#
Alle Transformer mit X anpassen.
- Parameter:
- Xiterable oder array-ähnlich, abhängig von den Transformern
Eingabedaten, die zum Anpassen der Transformer verwendet werden.
- yarray-ähnlich der Form (n_samples, n_outputs), Standardwert=None
Ziele für überwachtes Lernen.
- **fit_paramsdict, Standardwert=None
Wenn
enable_metadata_routing=False(Standard): Parameter, die direkt an diefitMethoden der Unter-Transformer übergeben werden.Wenn
enable_metadata_routing=True: Sicher an diefitMethoden der Unter-Transformer weitergeleitete Parameter. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.
Geändert in Version 1.5:
**fit_paramskönnen über die Metadaten-Routing-API weitergeleitet werden.
- Gibt zurück:
- selfobject
FeatureUnion-Klasseninstanz.
- fit_transform(X, y=None, **params)[Quelle]#
Alle Transformer anpassen, die Daten transformieren und die Ergebnisse verketten.
- Parameter:
- Xiterable oder array-ähnlich, abhängig von den Transformern
Zu transformierende Eingabedaten.
- yarray-ähnlich der Form (n_samples, n_outputs), Standardwert=None
Ziele für überwachtes Lernen.
- **paramsdict, default=None
Wenn
enable_metadata_routing=False(Standard): Parameter, die direkt an diefitMethoden der Unter-Transformer übergeben werden.Wenn
enable_metadata_routing=True: Sicher an diefitMethoden der Unter-Transformer weitergeleitete Parameter. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.
Geändert in Version 1.5:
**paramskönnen jetzt über die Metadaten-Routing-API weitergeleitet werden.
- Gibt zurück:
- X_tarray-ähnlich oder spärrige Matrix der Form (n_samples, sum_n_components)
Die
hstackder Ergebnisse der Transformer.sum_n_componentsist die Summe vonn_components(Ausgabedimension) über die Transformer.
- get_feature_names_out(input_features=None)[Quelle]#
Holt die Ausgabemerkmale für die Transformation.
- Parameter:
- input_featuresarray-like von str oder None, default=None
Eingabemerkmale.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Transformierte Merkmalnamen.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
Hinzugefügt in Version 1.5.
- Gibt zurück:
- routingMetadataRouter
Ein
MetadataRouter, der die Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
Gibt die im Konstruktor übergebenen Parameter sowie die im
transformer_listvonFeatureUnionenthaltenen Estimators zurück.- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsMapping von string zu any
Parameternamen, zugeordnet ihren Werten.
- set_output(*, transform=None)[Quelle]#
Setzt den Ausgabebereich, wenn
"transform"und"fit_transform"aufgerufen werden.set_outputsetzt die Ausgabe aller Estimators intransformer_list.- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**kwargs)[Quelle]#
Setzt die Parameter dieses Schätzers.
Gültige Parameternamen können mit
get_params()aufgelistet werden. Beachten Sie, dass Sie die Parameter der intransformer_listenthaltenen Estimators direkt einstellen können.- Parameter:
- **kwargsdict
Parameter dieses Estimators oder Parameter von in
transform_listenthaltenen Estimators. Parameter der Transformer können über ihren Namen und den Parameternamen, getrennt durch ein „__“, eingestellt werden.
- Gibt zurück:
- selfobject
FeatureUnion-Klasseninstanz.
- transform(X, **params)[Quelle]#
Transformiert X separat durch jeden Transformer, verkettet die Ergebnisse.
- Parameter:
- Xiterable oder array-ähnlich, abhängig von den Transformern
Zu transformierende Eingabedaten.
- **paramsdict, default=None
Parameter, die über die Metadaten-Routing-API an die
transformMethode der Unter-Transformer weitergeleitet werden. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.Hinzugefügt in Version 1.5.
- Gibt zurück:
- X_tarray-ähnlich oder spärrige Matrix der Form (n_samples, sum_n_components)
Die
hstackder Ergebnisse der Transformer.sum_n_componentsist die Summe vonn_components(Ausgabedimension) über die Transformer.