make_blobs#

sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None, return_centers=False)[Quelle]#

Generiert isotrope Gaußsche Klumpen für das Clustering.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
n_samplesint oder array-ähnlich, Standard=100

Wenn int, ist dies die Gesamtzahl der Punkte, die gleichmäßig auf die Cluster aufgeteilt werden. Wenn array-ähnlich, gibt jedes Element der Sequenz die Anzahl der Samples pro Cluster an.

Geändert in Version v0.20: man kann jetzt ein Array-ähnliches Objekt an den Parameter n_samples übergeben

n_featuresint, Standard=2

Die Anzahl der Merkmale für jedes Sample.

centersint oder array-ähnlich der Form (n_centers, n_features), Standard=None

Die Anzahl der zu generierenden Zentren oder die festen Mittelpunktskoordinaten. Wenn n_samples ein int und centers None ist, werden 3 Zentren generiert. Wenn n_samples array-ähnlich ist, muss centers entweder None oder ein Array mit der Länge gleich der Länge von n_samples sein.

cluster_stdfloat oder array-ähnlich von float, Standard=1.0

Die Standardabweichung der Cluster.

center_boxtuple von float (min, max), Standard=(-10.0, 10.0)

Die Bounding Box für jedes Clusterzentrum, wenn Zentren zufällig generiert werden.

shufflebool, Standard=True

Mische die Samples.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

return_centersbool, Standard=False

Wenn True, werden die Zentren jedes Clusters zurückgegeben.

Hinzugefügt in Version 0.23.

Gibt zurück:
Xndarray der Form (n_samples, n_features)

Die generierten Samples.

yndarray der Form (n_samples,)

Die ganzzahligen Labels für die Clusterzugehörigkeit jedes Samples.

centersndarray der Form (n_centers, n_features)

Die Zentren jedes Clusters. Nur zurückgegeben, wenn return_centers=True.

Siehe auch

make_classification

Eine komplexere Variante.

Beispiele

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])