SelectFwe#
- class sklearn.feature_selection.SelectFwe(score_func=<function f_classif>, *, alpha=0.05)[Quelle]#
Filter: Wählt die p-Werte, die der Family-wise Error Rate entsprechen.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- score_funccallable, Standardwert=f_classif
Funktion, die zwei Arrays X und y entgegennimmt und ein Paar von Arrays (Scores, p-Werte) zurückgibt. Standardmäßig f_classif (siehe unten „Siehe auch“). Die Standardfunktion funktioniert nur mit Klassifizierungsaufgaben.
- alphafloat, Standard=5e-2
Der höchste unkorrigierte p-Wert für zu behaltende Merkmale.
- Attribute:
- scores_array-like mit der Form (n_features,)
Scores der Merkmale.
- pvalues_array-like mit der Form (n_features,)
p-Werte der Merkmals-Scores.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
Siehe auch
f_classifANOVA F-Wert zwischen Label/Merkmal für Klassifizierungsaufgaben.
chi2Chi-Quadrat-Statistiken nicht-negativer Merkmale für Klassifizierungsaufgaben.
f_regressionF-Wert zwischen Label/Merkmal für Regressionsaufgaben.
SelectPercentileWählt Merkmale basierend auf dem Perzentil der höchsten Scores aus.
SelectKBestWählt Merkmale basierend auf den k höchsten Scores aus.
SelectFprWählt Merkmale basierend auf einem Test der falschen positiven Rate aus.
SelectFdrWählt Merkmale basierend auf einer geschätzten Rate falsch entdeckter Fälle aus.
GenericUnivariateSelectUnivariater Merkmalsselektor mit konfigurierbarem Modus.
Beispiele
>>> from sklearn.datasets import load_breast_cancer >>> from sklearn.feature_selection import SelectFwe, chi2 >>> X, y = load_breast_cancer(return_X_y=True) >>> X.shape (569, 30) >>> X_new = SelectFwe(chi2, alpha=0.01).fit_transform(X, y) >>> X_new.shape (569, 15)
- fit(X, y=None)[Quelle]#
Führt die Score-Funktion auf (X, y) aus und ermittelt die entsprechenden Merkmale.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Die Trainings-Eingabebeispiele.
- yarray-like mit der Form (n_samples,) oder None
Die Zielwerte (Klassenlabels bei Klassifizierung, reelle Zahlen bei Regression). Wenn der Selektor unüberwacht ist, kann
yaufNonegesetzt werden.
- Gibt zurück:
- selfobject
Gibt die Instanz selbst zurück.
- fit_transform(X, y=None, **fit_params)[Quelle]#
An Daten anpassen, dann transformieren.
Passt den Transformer an
Xundymit optionalen Parameternfit_paramsan und gibt eine transformierte Version vonXzurück.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Eingabestichproben.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- **fit_paramsdict
Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner
fit-Methode akzeptiert.
- Gibt zurück:
- X_newndarray array der Form (n_samples, n_features_new)
Transformiertes Array.
- get_feature_names_out(input_features=None)[Quelle]#
Maskiert die Namen der Merkmale gemäß den ausgewählten Merkmalen.
- Parameter:
- input_featuresarray-like von str oder None, default=None
Eingabemerkmale.
Wenn
input_featuresNoneist, werdenfeature_names_in_als Merkmalnamen verwendet. Wennfeature_names_in_nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert:["x0", "x1", ..., "x(n_features_in_ - 1)"].Wenn
input_featuresein Array-ähnliches Objekt ist, mussinput_featuresmitfeature_names_in_übereinstimmen, wennfeature_names_in_definiert ist.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Transformierte Merkmalnamen.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- get_support(indices=False)[Quelle]#
Gibt eine Maske oder einen ganzzahligen Index der ausgewählten Merkmale zurück.
- Parameter:
- indicesbool, Standardwert=False
Wenn True, ist der Rückgabewert ein Array von ganzen Zahlen anstelle einer booleschen Maske.
- Gibt zurück:
- supportarray
Ein Index, der die beibehaltenen Merkmale aus einem Merkmalsvektor auswählt. Wenn
indicesFalse ist, ist dies ein boolesches Array der Form [# Eingabemerkmale], bei dem ein Element True ist, wenn sein entsprechendes Merkmal zur Beibehaltung ausgewählt wurde. WennindicesTrue ist, ist dies ein ganzzahliges Array der Form [# Ausgabemerkmale], dessen Werte Indizes in den Eingabemerkmalsvektor sind.
- inverse_transform(X)[Quelle]#
Kehrt die Transformationsoperation um.
- Parameter:
- Xarray der Form [n_samples, n_selected_features]
Die Eingabestichproben.
- Gibt zurück:
- X_originalarray der Form [n_samples, n_original_features]
Xmit Spalten aus Nullen, die dort eingefügt wurden, wo Merkmale durchtransformentfernt worden wären.
- set_output(*, transform=None)[Quelle]#
Ausgabecontainer festlegen.
Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.
- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
Hinzugefügt in Version 1.4: Die Option
"polars"wurde hinzugefügt.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.