make_gaussian_quantiles#

sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)[Quelle]#

Generiert isotrope Gaußsche und beschriftete Stichproben nach Quantilen.

Dieser Klassifikationsdatensatz wird konstruiert, indem eine mehrdimensionale Standardnormalverteilung genommen und Klassen definiert werden, die durch verschachtelte konzentrische mehrdimensionale Kugeln getrennt sind, so dass ungefähr gleich viele Samples in jeder Klasse vorhanden sind (Quantile der \(\chi^2\)-Verteilung).

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
meanarray-like von Shape (n_features,), default=None

Der Mittelwert der mehrdimensionalen Normalverteilung. Wenn None, dann wird der Ursprung (0, 0, …) verwendet.

covfloat, default=1.0

Die Kovarianzmatrix ist dieser Wert mal die Einheitsmatrix. Dieser Datensatz erzeugt nur symmetrische Normalverteilungen.

n_samplesint, Standard=100

Die Gesamtzahl der Punkte, die gleichmäßig auf die Klassen aufgeteilt sind.

n_featuresint, default=2

Die Anzahl der Features für jedes Sample.

n_classesint, default=3

Die Anzahl der Klassen.

shufflebool, Standard=True

Mische die Samples.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Gibt zurück:
Xndarray der Form (n_samples, n_features)

Die generierten Samples.

yndarray der Form (n_samples,)

Die ganzzahligen Labels für die Quantilszugehörigkeit jedes Samples.

Anmerkungen

Der Datensatz stammt von Zhu et al. [1].

Referenzen

Beispiele

>>> from sklearn.datasets import make_gaussian_quantiles
>>> X, y = make_gaussian_quantiles(random_state=42)
>>> X.shape
(100, 2)
>>> y.shape
(100,)
>>> list(y[:5])
[np.int64(2), np.int64(0), np.int64(1), np.int64(0), np.int64(2)]