f_classif#
- sklearn.feature_selection.f_classif(X, y)[Quelle]#
Berechnet den ANOVA F-Wert für die gegebene Stichprobe.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_features)
Die Menge der Regressoren, die sequenziell getestet werden.
- yarray-like von Form (n_samples,)
Der Zielvektor.
- Gibt zurück:
- f_statisticndarray der Form (n_features,)
F-Statistik für jedes Merkmal.
- p_valuesndarray der Form (n_features,)
P-Werte, die mit der F-Statistik verbunden sind.
Siehe auch
chi2Chi-Quadrat-Statistiken nicht-negativer Merkmale für Klassifizierungsaufgaben.
f_regressionF-Wert zwischen Label/Merkmal für Regressionsaufgaben.
Beispiele
>>> from sklearn.datasets import make_classification >>> from sklearn.feature_selection import f_classif >>> X, y = make_classification( ... n_samples=100, n_features=10, n_informative=2, n_clusters_per_class=1, ... shuffle=False, random_state=42 ... ) >>> f_statistic, p_values = f_classif(X, y) >>> f_statistic array([2.21e+02, 7.02e-01, 1.70e+00, 9.31e-01, 5.41e+00, 3.25e-01, 4.71e-02, 5.72e-01, 7.54e-01, 8.90e-02]) >>> p_values array([7.14e-27, 4.04e-01, 1.96e-01, 3.37e-01, 2.21e-02, 5.70e-01, 8.29e-01, 4.51e-01, 3.87e-01, 7.66e-01])