fowlkes_mallows_score#
- sklearn.metrics.fowlkes_mallows_score(labels_true, labels_pred, *, sparse='deprecated')[Quelle]#
Messe die Ähnlichkeit von zwei Clusterings eines Punktesets.
Hinzugefügt in Version 0.18.
Der Fowlkes-Mallows-Index (FMI) ist definiert als das geometrische Mittel von Präzision und Recall
FMI = TP / sqrt((TP + FP) * (TP + FN))
Wobei
TPdie Anzahl der True Positive ist (d. h. die Anzahl der Paare von Punkten, die in beidenlabels_trueundlabels_predzum selben Cluster gehören),FPdie Anzahl der False Positive ist (d. h. die Anzahl der Paare von Punkten, die inlabels_predzum selben Cluster gehören, aber nicht inlabels_true) undFNdie Anzahl der False Negative ist (d. h. die Anzahl der Paare von Punkten, die inlabels_truezum selben Cluster gehören, aber nicht inlabels_pred).Der Score reicht von 0 bis 1. Ein hoher Wert zeigt eine gute Ähnlichkeit zwischen zwei Clustern an.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- labels_truearray-ähnlich mit Form (n_samples,), dtype=int
Eine Clusterbildung der Daten in disjunkte Teilmengen.
- labels_predarray-ähnlich mit Form (n_samples,), dtype=int
Eine Clusterbildung der Daten in disjunkte Teilmengen.
- sparsebool, default=False
Berechnet die Kontingenzmatrix intern mit einer sparsen Matrix.
Veraltet seit Version 1.7: Der Parameter
sparseist veraltet und wird in Version 1.9 entfernt. Er hat keine Auswirkung.
- Gibt zurück:
- scorefloat
Der resultierende Fowlkes-Mallows-Score.
Referenzen
Beispiele
Perfekte Labellings sind sowohl homogen als auch vollständig, daher haben sie einen Score von 1,0
>>> from sklearn.metrics.cluster import fowlkes_mallows_score >>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1]) 1.0 >>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
Wenn Klassenmitglieder vollständig über verschiedene Cluster verteilt sind, ist die Zuordnung rein zufällig, daher ist der FMI null.
>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3]) 0.0