completeness_score#

sklearn.metrics.completeness_score(labels_true, labels_pred)[Quelle]#

Berechne die Vollständigkeitsmetrik einer Cluster-Beschriftung gegeben eine Grundwahrheit.

Ein Clustering-Ergebnis erfüllt Vollständigkeit, wenn alle Datenpunkte, die zu einer bestimmten Klasse gehören, Elemente desselben Clusters sind.

Diese Metrik ist unabhängig von den absoluten Werten der Labels: eine Permutation der Klassen- oder Cluster-Labelwerte ändert den Score-Wert in keiner Weise.

Diese Metrik ist nicht symmetrisch: Das Vertauschen von label_true mit label_pred gibt die homogeneity_score zurück, die im Allgemeinen unterschiedlich sein wird.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

labels_truearray-like von Form (n_samples,): Wahre Klassenlabels als Referenz.
labels_predarray-like von Form (n_samples,): Zu bewertende Clusterlabels.

Gibt zurück:

completenessfloat: Score zwischen 0.0 und 1.0. 1.0 steht für eine perfekt vollständige Kennzeichnung.

Siehe auch

homogeneity_score: Homogenitätsmetrik der Cluster-Kennzeichnung.
v_measure_score: V-Maß (NMI mit arithmetischem Mittelwert-Option).

Referenzen

[1]

Andrew Rosenberg und Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure

Beispiele

Perfekte Kennzeichnungen sind vollständig

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Nicht perfekte Kennzeichnungen, die alle Klassenmitglieder denselben Clustern zuordnen, sind immer noch vollständig

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999

Wenn Klassenmitglieder auf verschiedene Cluster aufgeteilt sind, kann die Zuordnung nicht vollständig sein

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0

Galeriebeispiele#

Demo des Affinity Propagation Clustering Algorithmus

Demo des DBSCAN Clustering Algorithmus

Eine Demo des K-Means Clusterings auf den handschriftlichen Zifferndaten

Release Highlights für scikit-learn 0.23

Clustering von Textdokumenten mit K-Means

completeness_score#

Galeriebeispiele#

Diese Seite