rand_score#
- sklearn.metrics.rand_score(labels_true, labels_pred)[Quelle]#
Rand-Index.
Der Rand-Index berechnet ein Ähnlichkeitsmaß zwischen zwei Clusterings, indem alle Stichprobenpaare betrachtet und Paare gezählt werden, die in den vorhergesagten und wahren Clusterings in denselben oder unterschiedlichen Clustern zugewiesen sind [1] [2].
Der rohe RI-Score [3] lautet
RI = (number of agreeing pairs) / (number of pairs)
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- labels_truearray-like von der Form (n_samples,), dtype=integral
Wahre Klassenlabels als Referenz.
- labels_predarray-like von der Form (n_samples,), dtype=integral
Zu bewertende Clusterlabels.
- Gibt zurück:
- RIfloat
Ähnlichkeits-Score zwischen 0,0 und 1,0, einschließlich, 1,0 bedeutet perfekte Übereinstimmung.
Siehe auch
adjusted_rand_scoreAngepasster Rand-Score.
adjusted_mutual_info_scoreBereinigte gegenseitige Information.
Referenzen
Beispiele
Perfekt übereinstimmende Beschriftungen haben sogar einen Score von 1
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
Beschriftungen, die allen Klassenmitgliedern denselben Clustern zuweisen, sind vollständig, aber möglicherweise nicht immer rein, daher werden sie bestraft
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) 0.83
Galeriebeispiele#
Anpassung für Zufälligkeit in der Clusterleistungsbewertung