rand_score#

sklearn.metrics.rand_score(labels_true, labels_pred)[Quelle]#

Rand-Index.

Der Rand-Index berechnet ein Ähnlichkeitsmaß zwischen zwei Clusterings, indem alle Stichprobenpaare betrachtet und Paare gezählt werden, die in den vorhergesagten und wahren Clusterings in denselben oder unterschiedlichen Clustern zugewiesen sind [1] [2].

Der rohe RI-Score [3] lautet

RI = (number of agreeing pairs) / (number of pairs)

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
labels_truearray-like von der Form (n_samples,), dtype=integral

Wahre Klassenlabels als Referenz.

labels_predarray-like von der Form (n_samples,), dtype=integral

Zu bewertende Clusterlabels.

Gibt zurück:
RIfloat

Ähnlichkeits-Score zwischen 0,0 und 1,0, einschließlich, 1,0 bedeutet perfekte Übereinstimmung.

Siehe auch

adjusted_rand_score

Angepasster Rand-Score.

adjusted_mutual_info_score

Bereinigte gegenseitige Information.

Referenzen

Beispiele

Perfekt übereinstimmende Beschriftungen haben sogar einen Score von 1

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Beschriftungen, die allen Klassenmitgliedern denselben Clustern zuweisen, sind vollständig, aber möglicherweise nicht immer rein, daher werden sie bestraft

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
0.83