make_hastie_10_2#

sklearn.datasets.make_hastie_10_2(n_samples=12000, *, random_state=None)[Quelle]#

Generiert Daten für binäre Klassifikation, wie in Hastie et al. 2009, Beispiel 10.2.

Die zehn Merkmale sind standardmäßige unabhängige Gaußverteilungen und das Ziel y ist definiert durch

y[i] = 1 if np.sum(X[i] ** 2) > 9.34 else -1

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
n_samplesint, Standard=12000

Die Anzahl der Stichproben.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Gibt zurück:
Xndarray der Form (n_samples, 10)

Die Eingabestichproben.

yndarray der Form (n_samples,)

Die Ausgabewerte.

Siehe auch

make_gaussian_quantiles

Eine Verallgemeinerung dieses Datensatzansatzes.

Referenzen

[1]

T. Hastie, R. Tibshirani und J. Friedman, „Elements of Statistical Learning Ed. 2“, Springer, 2009.

Beispiele

>>> from sklearn.datasets import make_hastie_10_2
>>> X, y = make_hastie_10_2(n_samples=24000, random_state=42)
>>> X.shape
(24000, 10)
>>> y.shape
(24000,)
>>> list(y[:5])
[np.float64(-1.0), np.float64(1.0), np.float64(-1.0), np.float64(1.0),
np.float64(-1.0)]