contingency_matrix#

sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=<class 'numpy.int64'>)[Quelle]#

Erstelle eine Kontingenzmatrix, die die Beziehung zwischen Labels beschreibt.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
labels_truearray-like von Form (n_samples,)

Wahre Klassenlabels als Referenz.

labels_predarray-like von Form (n_samples,)

Zu bewertende Clusterlabels.

epsfloat, default=None

Wenn ein Float, wird dieser Wert zu allen Werten in der Kontingenzmatrix addiert. Dies hilft, NaN-Propagation zu stoppen. Wenn None, wird nichts angepasst.

sparsebool, default=False

Wenn True, eine spärliche CSR-Kontingenzmatrix zurückgeben. Wenn eps nicht None ist und sparse True ist, wird ein ValueError ausgelöst.

Hinzugefügt in Version 0.18.

dtypenumerischer Typ, default=np.int64

Ausgabetyp. Wird ignoriert, wenn eps nicht None ist.

Hinzugefügt in Version 0.24.

Gibt zurück:
contingency{array-like, sparse}, shape=[n_klassen_true, n_klassen_pred]

Matrix \(C\), so dass \(C_{i, j}\) die Anzahl der Stichproben in der wahren Klasse \(i\) und in der vorhergesagten Klasse \(j\) ist. Wenn eps is None, ist der Datentyp dieses Arrays ganzzahlig, es sei denn, er wird mit dem dtype Argument anders gesetzt. Wenn eps angegeben ist, ist der Datentyp float. Ist eine sklearn.sparse.csr_matrix, wenn sparse=True.

Beispiele

>>> from sklearn.metrics.cluster import contingency_matrix
>>> labels_true = [0, 0, 1, 1, 2, 2]
>>> labels_pred = [1, 0, 2, 1, 0, 2]
>>> contingency_matrix(labels_true, labels_pred)
array([[1, 1, 0],
       [0, 1, 1],
       [1, 0, 1]])