make_gaussian_quantiles#
- sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, shuffle=True, random_state=None)[Quelle]#
Generiert isotrope Gaußsche und beschriftete Stichproben nach Quantilen.
Dieser Klassifikationsdatensatz wird konstruiert, indem eine mehrdimensionale Standardnormalverteilung genommen und Klassen definiert werden, die durch verschachtelte konzentrische mehrdimensionale Kugeln getrennt sind, so dass ungefähr gleich viele Samples in jeder Klasse vorhanden sind (Quantile der \(\chi^2\)-Verteilung).
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- meanarray-like von Shape (n_features,), default=None
Der Mittelwert der mehrdimensionalen Normalverteilung. Wenn None, dann wird der Ursprung (0, 0, …) verwendet.
- covfloat, default=1.0
Die Kovarianzmatrix ist dieser Wert mal die Einheitsmatrix. Dieser Datensatz erzeugt nur symmetrische Normalverteilungen.
- n_samplesint, Standard=100
Die Gesamtzahl der Punkte, die gleichmäßig auf die Klassen aufgeteilt sind.
- n_featuresint, default=2
Die Anzahl der Features für jedes Sample.
- n_classesint, default=3
Die Anzahl der Klassen.
- shufflebool, Standard=True
Mische die Samples.
- random_stateint, RandomState-Instanz oder None, default=None
Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.
- Gibt zurück:
- Xndarray der Form (n_samples, n_features)
Die generierten Samples.
- yndarray der Form (n_samples,)
Die ganzzahligen Labels für die Quantilszugehörigkeit jedes Samples.
Anmerkungen
Der Datensatz stammt von Zhu et al. [1].
Referenzen
Beispiele
>>> from sklearn.datasets import make_gaussian_quantiles >>> X, y = make_gaussian_quantiles(random_state=42) >>> X.shape (100, 2) >>> y.shape (100,) >>> list(y[:5]) [np.int64(2), np.int64(0), np.int64(1), np.int64(0), np.int64(2)]