fowlkes_mallows_score#

sklearn.metrics.fowlkes_mallows_score(labels_true, labels_pred, *, sparse='deprecated')[Quelle]#

Messe die Ähnlichkeit von zwei Clusterings eines Punktesets.

Hinzugefügt in Version 0.18.

Der Fowlkes-Mallows-Index (FMI) ist definiert als das geometrische Mittel von Präzision und Recall

FMI = TP / sqrt((TP + FP) * (TP + FN))

Wobei TP die Anzahl der True Positive ist (d. h. die Anzahl der Paare von Punkten, die in beiden labels_true und labels_pred zum selben Cluster gehören), FP die Anzahl der False Positive ist (d. h. die Anzahl der Paare von Punkten, die in labels_pred zum selben Cluster gehören, aber nicht in labels_true) und FN die Anzahl der False Negative ist (d. h. die Anzahl der Paare von Punkten, die in labels_true zum selben Cluster gehören, aber nicht in labels_pred).

Der Score reicht von 0 bis 1. Ein hoher Wert zeigt eine gute Ähnlichkeit zwischen zwei Clustern an.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
labels_truearray-ähnlich mit Form (n_samples,), dtype=int

Eine Clusterbildung der Daten in disjunkte Teilmengen.

labels_predarray-ähnlich mit Form (n_samples,), dtype=int

Eine Clusterbildung der Daten in disjunkte Teilmengen.

sparsebool, default=False

Berechnet die Kontingenzmatrix intern mit einer sparsen Matrix.

Veraltet seit Version 1.7: Der Parameter sparse ist veraltet und wird in Version 1.9 entfernt. Er hat keine Auswirkung.

Gibt zurück:
scorefloat

Der resultierende Fowlkes-Mallows-Score.

Referenzen

Beispiele

Perfekte Labellings sind sowohl homogen als auch vollständig, daher haben sie einen Score von 1,0

>>> from sklearn.metrics.cluster import fowlkes_mallows_score
>>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1])
1.0
>>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Wenn Klassenmitglieder vollständig über verschiedene Cluster verteilt sind, ist die Zuordnung rein zufällig, daher ist der FMI null.

>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3])
0.0