SelectFdr#
- class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)[Quelle]#
Filter: Wählt die p-Werte für eine geschätzte False Discovery Rate.
Dies verwendet das Benjamini-Hochberg-Verfahren.
alphaist eine Obergrenze für die erwartete False Discovery Rate.Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- score_funccallable, Standardwert=f_classif
Funktion, die zwei Arrays X und y entgegennimmt und ein Paar von Arrays (Scores, p-Werte) zurückgibt. Standardmäßig f_classif (siehe unten „Siehe auch“). Die Standardfunktion funktioniert nur mit Klassifizierungsaufgaben.
- alphafloat, Standard=5e-2
Der höchste unkorrigierte p-Wert für beizubehaltende Merkmale.
- Attribute:
- scores_array-like mit der Form (n_features,)
Scores der Merkmale.
- pvalues_array-like mit der Form (n_features,)
p-Werte der Merkmals-Scores.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
Siehe auch
f_classifANOVA F-Wert zwischen Label/Merkmal für Klassifizierungsaufgaben.
mutual_info_classifGegenseitige Information für ein diskretes Ziel.
chi2Chi-Quadrat-Statistiken nicht-negativer Merkmale für Klassifizierungsaufgaben.
f_regressionF-Wert zwischen Label/Merkmal für Regressionsaufgaben.
mutual_info_regressionGegenseitige Information für ein kontinuierliches Ziel.
SelectPercentileWählt Merkmale basierend auf dem Perzentil der höchsten Scores aus.
SelectKBestWählt Merkmale basierend auf den k höchsten Scores aus.
SelectFprWählt Merkmale basierend auf einem Test der falschen positiven Rate aus.
SelectFweWählt Merkmale basierend auf der familiären Fehlerrate aus.
GenericUnivariateSelectUnivariater Merkmalsselektor mit konfigurierbarem Modus.
Referenzen
https://en.wikipedia.org/wiki/False_discovery_rate
Beispiele
>>> from sklearn.datasets import load_breast_cancer >>> from sklearn.feature_selection import SelectFdr, chi2 >>> X, y = load_breast_cancer(return_X_y=True) >>> X.shape (569, 30) >>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y) >>> X_new.shape (569, 16)
- fit(X, y=None)[Quelle]#
Führt die Score-Funktion auf (X, y) aus und ermittelt die entsprechenden Merkmale.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Die Trainings-Eingabebeispiele.
- yarray-like mit der Form (n_samples,) oder None
Die Zielwerte (Klassenlabels bei Klassifizierung, reelle Zahlen bei Regression). Wenn der Selektor unüberwacht ist, kann
yaufNonegesetzt werden.
- Gibt zurück:
- selfobject
Gibt die Instanz selbst zurück.
- fit_transform(X, y=None, **fit_params)[Quelle]#
An Daten anpassen, dann transformieren.
Passt den Transformer an
Xundymit optionalen Parameternfit_paramsan und gibt eine transformierte Version vonXzurück.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Eingabestichproben.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- **fit_paramsdict
Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner
fit-Methode akzeptiert.
- Gibt zurück:
- X_newndarray array der Form (n_samples, n_features_new)
Transformiertes Array.
- get_feature_names_out(input_features=None)[Quelle]#
Maskiert die Namen der Merkmale gemäß den ausgewählten Merkmalen.
- Parameter:
- input_featuresarray-like von str oder None, default=None
Eingabemerkmale.
Wenn
input_featuresNoneist, werdenfeature_names_in_als Merkmalnamen verwendet. Wennfeature_names_in_nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert:["x0", "x1", ..., "x(n_features_in_ - 1)"].Wenn
input_featuresein Array-ähnliches Objekt ist, mussinput_featuresmitfeature_names_in_übereinstimmen, wennfeature_names_in_definiert ist.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Transformierte Merkmalnamen.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- get_support(indices=False)[Quelle]#
Gibt eine Maske oder einen ganzzahligen Index der ausgewählten Merkmale zurück.
- Parameter:
- indicesbool, Standardwert=False
Wenn True, ist der Rückgabewert ein Array von ganzen Zahlen anstelle einer booleschen Maske.
- Gibt zurück:
- supportarray
Ein Index, der die beibehaltenen Merkmale aus einem Merkmalsvektor auswählt. Wenn
indicesFalse ist, ist dies ein boolesches Array der Form [# Eingabemerkmale], bei dem ein Element True ist, wenn sein entsprechendes Merkmal zur Beibehaltung ausgewählt wurde. WennindicesTrue ist, ist dies ein ganzzahliges Array der Form [# Ausgabemerkmale], dessen Werte Indizes in den Eingabemerkmalsvektor sind.
- inverse_transform(X)[Quelle]#
Kehrt die Transformationsoperation um.
- Parameter:
- Xarray der Form [n_samples, n_selected_features]
Die Eingabestichproben.
- Gibt zurück:
- X_originalarray der Form [n_samples, n_original_features]
Xmit Spalten von Nullen, eingefügt dort, wo Merkmale durchtransformentfernt worden wären.
- set_output(*, transform=None)[Quelle]#
Ausgabecontainer festlegen.
Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.
- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
Hinzugefügt in Version 1.4: Die Option
"polars"wurde hinzugefügt.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.