SelectFdr#

class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)[Quelle]#

Filter: Wählt die p-Werte für eine geschätzte False Discovery Rate.

Dies verwendet das Benjamini-Hochberg-Verfahren. alpha ist eine Obergrenze für die erwartete False Discovery Rate.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
score_funccallable, Standardwert=f_classif

Funktion, die zwei Arrays X und y entgegennimmt und ein Paar von Arrays (Scores, p-Werte) zurückgibt. Standardmäßig f_classif (siehe unten „Siehe auch“). Die Standardfunktion funktioniert nur mit Klassifizierungsaufgaben.

alphafloat, Standard=5e-2

Der höchste unkorrigierte p-Wert für beizubehaltende Merkmale.

Attribute:
scores_array-like mit der Form (n_features,)

Scores der Merkmale.

pvalues_array-like mit der Form (n_features,)

p-Werte der Merkmals-Scores.

n_features_in_int

Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.

feature_names_in_ndarray mit Form (n_features_in_,)

Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

f_classif

ANOVA F-Wert zwischen Label/Merkmal für Klassifizierungsaufgaben.

mutual_info_classif

Gegenseitige Information für ein diskretes Ziel.

chi2

Chi-Quadrat-Statistiken nicht-negativer Merkmale für Klassifizierungsaufgaben.

f_regression

F-Wert zwischen Label/Merkmal für Regressionsaufgaben.

mutual_info_regression

Gegenseitige Information für ein kontinuierliches Ziel.

SelectPercentile

Wählt Merkmale basierend auf dem Perzentil der höchsten Scores aus.

SelectKBest

Wählt Merkmale basierend auf den k höchsten Scores aus.

SelectFpr

Wählt Merkmale basierend auf einem Test der falschen positiven Rate aus.

SelectFwe

Wählt Merkmale basierend auf der familiären Fehlerrate aus.

GenericUnivariateSelect

Univariater Merkmalsselektor mit konfigurierbarem Modus.

Referenzen

https://en.wikipedia.org/wiki/False_discovery_rate

Beispiele

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)
fit(X, y=None)[Quelle]#

Führt die Score-Funktion auf (X, y) aus und ermittelt die entsprechenden Merkmale.

Parameter:
Xarray-like der Form (n_samples, n_features)

Die Trainings-Eingabebeispiele.

yarray-like mit der Form (n_samples,) oder None

Die Zielwerte (Klassenlabels bei Klassifizierung, reelle Zahlen bei Regression). Wenn der Selektor unüberwacht ist, kann y auf None gesetzt werden.

Gibt zurück:
selfobject

Gibt die Instanz selbst zurück.

fit_transform(X, y=None, **fit_params)[Quelle]#

An Daten anpassen, dann transformieren.

Passt den Transformer an X und y mit optionalen Parametern fit_params an und gibt eine transformierte Version von X zurück.

Parameter:
Xarray-like der Form (n_samples, n_features)

Eingabestichproben.

yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None

Zielwerte (None für unüberwachte Transformationen).

**fit_paramsdict

Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner fit-Methode akzeptiert.

Gibt zurück:
X_newndarray array der Form (n_samples, n_features_new)

Transformiertes Array.

get_feature_names_out(input_features=None)[Quelle]#

Maskiert die Namen der Merkmale gemäß den ausgewählten Merkmalen.

Parameter:
input_featuresarray-like von str oder None, default=None

Eingabemerkmale.

  • Wenn input_features None ist, werden feature_names_in_ als Merkmalnamen verwendet. Wenn feature_names_in_ nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert: ["x0", "x1", ..., "x(n_features_in_ - 1)"].

  • Wenn input_features ein Array-ähnliches Objekt ist, muss input_features mit feature_names_in_ übereinstimmen, wenn feature_names_in_ definiert ist.

Gibt zurück:
feature_names_outndarray von str-Objekten

Transformierte Merkmalnamen.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:
routingMetadataRequest

Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:
deepbool, default=True

Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:
paramsdict

Parameternamen, zugeordnet ihren Werten.

get_support(indices=False)[Quelle]#

Gibt eine Maske oder einen ganzzahligen Index der ausgewählten Merkmale zurück.

Parameter:
indicesbool, Standardwert=False

Wenn True, ist der Rückgabewert ein Array von ganzen Zahlen anstelle einer booleschen Maske.

Gibt zurück:
supportarray

Ein Index, der die beibehaltenen Merkmale aus einem Merkmalsvektor auswählt. Wenn indices False ist, ist dies ein boolesches Array der Form [# Eingabemerkmale], bei dem ein Element True ist, wenn sein entsprechendes Merkmal zur Beibehaltung ausgewählt wurde. Wenn indices True ist, ist dies ein ganzzahliges Array der Form [# Ausgabemerkmale], dessen Werte Indizes in den Eingabemerkmalsvektor sind.

inverse_transform(X)[Quelle]#

Kehrt die Transformationsoperation um.

Parameter:
Xarray der Form [n_samples, n_selected_features]

Die Eingabestichproben.

Gibt zurück:
X_originalarray der Form [n_samples, n_original_features]

X mit Spalten von Nullen, eingefügt dort, wo Merkmale durch transform entfernt worden wären.

set_output(*, transform=None)[Quelle]#

Ausgabecontainer festlegen.

Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.

Parameter:
transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

  • "default": Standardausgabeformat eines Transformers

  • "pandas": DataFrame-Ausgabe

  • "polars": Polars-Ausgabe

  • None: Die Transformationskonfiguration bleibt unverändert

Hinzugefügt in Version 1.4: Die Option "polars" wurde hinzugefügt.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:
**paramsdict

Schätzer-Parameter.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

transform(X)[Quelle]#

Reduziert X auf die ausgewählten Merkmale.

Parameter:
Xarray der Form [n_samples, n_features]

Die Eingabestichproben.

Gibt zurück:
X_rarray der Form [n_samples, n_selected_features]

Die Eingabebeispiele nur mit den ausgewählten Merkmalen.