make_column_selector#

class sklearn.compose.make_column_selector(pattern=None, *, dtype_include=None, dtype_exclude=None)[source]#

Erzeugt ein aufrufbares Objekt zur Auswahl von Spalten, die mit ColumnTransformer verwendet werden sollen.

make_column_selector kann Spalten anhand ihres Datentyps oder ihres Namens mit einem Regex auswählen. Bei Verwendung mehrerer Auswahlkriterien müssen **alle** Kriterien übereinstimmen, damit eine Spalte ausgewählt wird.

Ein Beispiel für die Verwendung von make_column_selector innerhalb eines ColumnTransformer zur Auswahl von Spalten basierend auf dem Datentyp (d.h. dtype) finden Sie unter Column Transformer mit gemischten Typen.

Parameter:
patternstr, Standard=None

Spaltennamen, die dieses Regex-Muster enthalten, werden einbezogen. Wenn None, erfolgt die Spaltenauswahl nicht basierend auf dem Muster.

dtype_includeSpaltentyp oder Liste von Spaltentypen, Standard=None

Eine Auswahl von Datentypen, die einbezogen werden sollen. Weitere Details finden Sie unter pandas.DataFrame.select_dtypes.

dtype_excludeSpaltentyp oder Liste von Spaltentypen, Standard=None

Eine Auswahl von Datentypen, die ausgeschlossen werden sollen. Weitere Details finden Sie unter pandas.DataFrame.select_dtypes.

Gibt zurück:
selectorcallable

Aufrufbares Objekt zur Spaltenauswahl, das von einem ColumnTransformer verwendet wird.

Siehe auch

ColumnTransformer

Klasse, die es ermöglicht, die Ausgaben mehrerer Transformer-Objekte, die auf Teilmengen der Daten angewendet werden, zu einem einzigen Merkmalsraum zu kombinieren.

Beispiele

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> from sklearn.compose import make_column_selector
>>> import numpy as np
>>> import pandas as pd
>>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'],
...                   'rating': [5, 3, 4, 5]})
>>> ct = make_column_transformer(
...       (StandardScaler(),
...        make_column_selector(dtype_include=np.number)),  # rating
...       (OneHotEncoder(),
...        make_column_selector(dtype_include=[object, "string"])))  # city
>>> ct.fit_transform(X)
array([[ 0.90453403,  1.        ,  0.        ,  0.        ],
       [-1.50755672,  1.        ,  0.        ,  0.        ],
       [-0.30151134,  0.        ,  1.        ,  0.        ],
       [ 0.90453403,  0.        ,  0.        ,  1.        ]])
__call__(df)[source]#

Aufrufbares Objekt zur Spaltenauswahl, das von einem ColumnTransformer verwendet wird.

Parameter:
dfDataFrame der Form (n_features, n_samples)

DataFrame, aus dem Spalten ausgewählt werden sollen.