make_hastie_10_2#
- sklearn.datasets.make_hastie_10_2(n_samples=12000, *, random_state=None)[Quelle]#
Generiert Daten für binäre Klassifikation, wie in Hastie et al. 2009, Beispiel 10.2.
Die zehn Merkmale sind standardmäßige unabhängige Gaußverteilungen und das Ziel
yist definiert durchy[i] = 1 if np.sum(X[i] ** 2) > 9.34 else -1
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- n_samplesint, Standard=12000
Die Anzahl der Stichproben.
- random_stateint, RandomState-Instanz oder None, default=None
Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.
- Gibt zurück:
- Xndarray der Form (n_samples, 10)
Die Eingabestichproben.
- yndarray der Form (n_samples,)
Die Ausgabewerte.
Siehe auch
make_gaussian_quantilesEine Verallgemeinerung dieses Datensatzansatzes.
Referenzen
[1]T. Hastie, R. Tibshirani und J. Friedman, „Elements of Statistical Learning Ed. 2“, Springer, 2009.
Beispiele
>>> from sklearn.datasets import make_hastie_10_2 >>> X, y = make_hastie_10_2(n_samples=24000, random_state=42) >>> X.shape (24000, 10) >>> y.shape (24000,) >>> list(y[:5]) [np.float64(-1.0), np.float64(1.0), np.float64(-1.0), np.float64(1.0), np.float64(-1.0)]
Galeriebeispiele#
Demonstration von Multi-Metrik-Bewertung auf cross_val_score und GridSearchCV
Demonstration von Multi-Metrik-Bewertung auf cross_val_score und GridSearchCV