make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[Quelle]#

Generiert ein Array mit Block-Schachbrettstruktur für Biclustering.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
shapetuple von Shape (n_rows, n_cols)

Die Form des Ergebnisses.

n_clustersint oder array-ähnlich oder Shape (n_row_clusters, n_column_clusters)

Die Anzahl der Zeilen- und Spaltencluster.

noisefloat, Standard=0.0

Die Standardabweichung des Gaußschen Rauschens.

minvalfloat, Standard=10

Minimalwert eines Biclusters.

maxvalfloat, Standard=100

Maximalwert eines Biclusters.

shufflebool, Standard=True

Mische die Samples.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Gibt zurück:
Xndarray von Shape shape

Das generierte Array.

rowsndarray von Shape (n_clusters, X.shape[0])

Die Indikatoren für die Clusterzugehörigkeit jeder Zeile.

colsndarray von Shape (n_clusters, X.shape[1])

Die Indikatoren für die Clusterzugehörigkeit jeder Spalte.

Siehe auch

make_biclusters

Generiert ein Array mit konstanter Blockdiagonalstruktur für Biclustering.

Referenzen

[1]

Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.

Beispiele

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]