make_column_selector#
- class sklearn.compose.make_column_selector(pattern=None, *, dtype_include=None, dtype_exclude=None)[source]#
Erzeugt ein aufrufbares Objekt zur Auswahl von Spalten, die mit
ColumnTransformerverwendet werden sollen.make_column_selectorkann Spalten anhand ihres Datentyps oder ihres Namens mit einem Regex auswählen. Bei Verwendung mehrerer Auswahlkriterien müssen **alle** Kriterien übereinstimmen, damit eine Spalte ausgewählt wird.Ein Beispiel für die Verwendung von
make_column_selectorinnerhalb einesColumnTransformerzur Auswahl von Spalten basierend auf dem Datentyp (d.h.dtype) finden Sie unter Column Transformer mit gemischten Typen.- Parameter:
- patternstr, Standard=None
Spaltennamen, die dieses Regex-Muster enthalten, werden einbezogen. Wenn None, erfolgt die Spaltenauswahl nicht basierend auf dem Muster.
- dtype_includeSpaltentyp oder Liste von Spaltentypen, Standard=None
Eine Auswahl von Datentypen, die einbezogen werden sollen. Weitere Details finden Sie unter
pandas.DataFrame.select_dtypes.- dtype_excludeSpaltentyp oder Liste von Spaltentypen, Standard=None
Eine Auswahl von Datentypen, die ausgeschlossen werden sollen. Weitere Details finden Sie unter
pandas.DataFrame.select_dtypes.
- Gibt zurück:
- selectorcallable
Aufrufbares Objekt zur Spaltenauswahl, das von einem
ColumnTransformerverwendet wird.
Siehe auch
ColumnTransformerKlasse, die es ermöglicht, die Ausgaben mehrerer Transformer-Objekte, die auf Teilmengen der Daten angewendet werden, zu einem einzigen Merkmalsraum zu kombinieren.
Beispiele
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> from sklearn.compose import make_column_selector >>> import numpy as np >>> import pandas as pd >>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'], ... 'rating': [5, 3, 4, 5]}) >>> ct = make_column_transformer( ... (StandardScaler(), ... make_column_selector(dtype_include=np.number)), # rating ... (OneHotEncoder(), ... make_column_selector(dtype_include=[object, "string"]))) # city >>> ct.fit_transform(X) array([[ 0.90453403, 1. , 0. , 0. ], [-1.50755672, 1. , 0. , 0. ], [-0.30151134, 0. , 1. , 0. ], [ 0.90453403, 0. , 0. , 1. ]])
- __call__(df)[source]#
Aufrufbares Objekt zur Spaltenauswahl, das von einem
ColumnTransformerverwendet wird.- Parameter:
- dfDataFrame der Form (n_features, n_samples)
DataFrame, aus dem Spalten ausgewählt werden sollen.
Galeriebeispiele#
Unterstützung für kategorische Merkmale in Gradient Boosting