SelectFdr#

class sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, *, alpha=0.05)[Quelle]#

Filter: Wählt die p-Werte für eine geschätzte False Discovery Rate.

Dies verwendet das Benjamini-Hochberg-Verfahren. alpha ist eine Obergrenze für die erwartete False Discovery Rate.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

score_funccallable, Standardwert=f_classif: Funktion, die zwei Arrays X und y entgegennimmt und ein Paar von Arrays (Scores, p-Werte) zurückgibt. Standardmäßig f_classif (siehe unten „Siehe auch“). Die Standardfunktion funktioniert nur mit Klassifizierungsaufgaben.
alphafloat, Standard=5e-2: Der höchste unkorrigierte p-Wert für beizubehaltende Merkmale.

Attribute:

scores_array-like mit der Form (n_features,): Scores der Merkmale.
pvalues_array-like mit der Form (n_features,): p-Werte der Merkmals-Scores.
n_features_in_int: Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.
feature_names_in_ndarray mit Form (n_features_in_,): Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

f_classif: ANOVA F-Wert zwischen Label/Merkmal für Klassifizierungsaufgaben.
mutual_info_classif: Gegenseitige Information für ein diskretes Ziel.
chi2: Chi-Quadrat-Statistiken nicht-negativer Merkmale für Klassifizierungsaufgaben.
f_regression: F-Wert zwischen Label/Merkmal für Regressionsaufgaben.
mutual_info_regression: Gegenseitige Information für ein kontinuierliches Ziel.
SelectPercentile: Wählt Merkmale basierend auf dem Perzentil der höchsten Scores aus.
SelectKBest: Wählt Merkmale basierend auf den k höchsten Scores aus.
SelectFpr: Wählt Merkmale basierend auf einem Test der falschen positiven Rate aus.
SelectFwe: Wählt Merkmale basierend auf der familiären Fehlerrate aus.
GenericUnivariateSelect: Univariater Merkmalsselektor mit konfigurierbarem Modus.

Referenzen

https://en.wikipedia.org/wiki/False_discovery_rate

Beispiele

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)

fit(X, y=None)[Quelle]#

Führt die Score-Funktion auf (X, y) aus und ermittelt die entsprechenden Merkmale.

Parameter:

Xarray-like der Form (n_samples, n_features): Die Trainings-Eingabebeispiele.
yarray-like mit der Form (n_samples,) oder None: Die Zielwerte (Klassenlabels bei Klassifizierung, reelle Zahlen bei Regression). Wenn der Selektor unüberwacht ist, kann y auf None gesetzt werden.

Gibt zurück:

selfobject: Gibt die Instanz selbst zurück.

fit_transform(X, y=None, **fit_params)[Quelle]#

An Daten anpassen, dann transformieren.

Passt den Transformer an X und y mit optionalen Parametern fit_params an und gibt eine transformierte Version von X zurück.

Parameter:

Xarray-like der Form (n_samples, n_features): Eingabestichproben.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None: Zielwerte (None für unüberwachte Transformationen).
**fit_paramsdict: Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner fit-Methode akzeptiert.

Gibt zurück:

X_newndarray array der Form (n_samples, n_features_new): Transformiertes Array.

get_feature_names_out(input_features=None)[Quelle]#

Maskiert die Namen der Merkmale gemäß den ausgewählten Merkmalen.

Parameter:

input_featuresarray-like von str oder None, default=None

Eingabemerkmale.

Wenn input_features None ist, werden feature_names_in_ als Merkmalnamen verwendet. Wenn feature_names_in_ nicht definiert ist, werden die folgenden Eingabemerkmalsnamen generiert: ["x0", "x1", ..., "x(n_features_in_ - 1)"].
Wenn input_features ein Array-ähnliches Objekt ist, muss input_features mit feature_names_in_ übereinstimmen, wenn feature_names_in_ definiert ist.

Gibt zurück:

feature_names_outndarray von str-Objekten: Transformierte Merkmalnamen.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:

routingMetadataRequest: Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:

deepbool, default=True: Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:

paramsdict: Parameternamen, zugeordnet ihren Werten.

get_support(indices=False)[Quelle]#

Gibt eine Maske oder einen ganzzahligen Index der ausgewählten Merkmale zurück.

Parameter:

indicesbool, Standardwert=False: Wenn True, ist der Rückgabewert ein Array von ganzen Zahlen anstelle einer booleschen Maske.

Gibt zurück:

supportarray: Ein Index, der die beibehaltenen Merkmale aus einem Merkmalsvektor auswählt. Wenn indices False ist, ist dies ein boolesches Array der Form [# Eingabemerkmale], bei dem ein Element True ist, wenn sein entsprechendes Merkmal zur Beibehaltung ausgewählt wurde. Wenn indices True ist, ist dies ein ganzzahliges Array der Form [# Ausgabemerkmale], dessen Werte Indizes in den Eingabemerkmalsvektor sind.

inverse_transform(X)[Quelle]#

Kehrt die Transformationsoperation um.

Parameter:

Xarray der Form [n_samples, n_selected_features]: Die Eingabestichproben.

Gibt zurück:

X_originalarray der Form [n_samples, n_original_features]: X mit Spalten von Nullen, eingefügt dort, wo Merkmale durch transform entfernt worden wären.

set_output(*, transform=None)[Quelle]#

Ausgabecontainer festlegen.

Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.

Parameter:

transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

"default": Standardausgabeformat eines Transformers
"pandas": DataFrame-Ausgabe
"polars": Polars-Ausgabe
None: Die Transformationskonfiguration bleibt unverändert

Hinzugefügt in Version 1.4: Die Option "polars" wurde hinzugefügt.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:

**paramsdict: Schätzer-Parameter.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

transform(X)[Quelle]#

Reduziert X auf die ausgewählten Merkmale.

Parameter:

Xarray der Form [n_samples, n_features]: Die Eingabestichproben.

Gibt zurück:

X_rarray der Form [n_samples, n_selected_features]: Die Eingabebeispiele nur mit den ausgewählten Merkmalen.

SelectFdr#

Diese Seite