homogeneity_completeness_v_measure#

sklearn.metrics.homogeneity_completeness_v_measure(labels_true, labels_pred, *, beta=1.0)[Quelle]#

Berechne gleichzeitig Homogenitäts-, Vollständigkeits- und V-Measure-Scores.

Diese Metriken basieren auf normalisierten bedingten Entropie-Maßen der Cluster-Label, um sie anhand des Wissens über die Ground-Truth-Klassenlabels derselben Stichproben zu bewerten.

Eine Clusterbildung erfüllt Homogenität, wenn alle ihre Cluster nur Datenpunkte enthalten, die zu einer einzigen Klasse gehören.

Eine Clusterbildung erfüllt Vollständigkeit, wenn alle Datenpunkte, die zu einer bestimmten Klasse gehören, Elemente desselben Clusters sind.

Beide Werte sind positive Werte zwischen 0,0 und 1,0, wobei höhere Werte wünschenswert sind.

Diese 3 Metriken sind unabhängig von den absoluten Werten der Labels: Eine Permutation der Klassen- oder Cluster-Label-Werte ändert die Score-Werte in keiner Weise.

V-Measure ist außerdem symmetrisch: Wenn labels_true und label_pred vertauscht werden, ergibt sich derselbe Score. Dies gilt nicht für Homogenität und Vollständigkeit. V-Measure ist identisch mit normalized_mutual_info_score mit der arithmetischen Mittelwertbildungsmethode.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
labels_truearray-like von Form (n_samples,)

Wahre Klassenlabels als Referenz.

labels_predarray-like von Form (n_samples,)

Zu bewertende Clusterlabels.

betafloat, Standard=1.0

Verhältnis des Gewichts, das homogeneity gegenüber completeness zugewiesen wird. Wenn beta größer als 1 ist, wird completeness bei der Berechnung stärker gewichtet. Wenn beta kleiner als 1 ist, wird homogeneity stärker gewichtet.

Gibt zurück:
homogeneityfloat

Score zwischen 0,0 und 1,0. 1,0 bedeutet eine perfekt homogene Labelzuweisung.

completenessfloat

Score zwischen 0.0 und 1.0. 1.0 steht für eine perfekt vollständige Kennzeichnung.

v_measurefloat

Harmonisches Mittel der beiden ersten.

Siehe auch

homogeneity_score

Homogenitätsmetrik der Cluster-Kennzeichnung.

completeness_score

Vollständigkeitsmetrik der Cluster-Beschriftung.

v_measure_score

V-Maß (NMI mit arithmetischem Mittelwert-Option).

Beispiele

>>> from sklearn.metrics import homogeneity_completeness_v_measure
>>> y_true, y_pred = [0, 0, 1, 1, 2, 2], [0, 0, 1, 2, 2, 2]
>>> homogeneity_completeness_v_measure(y_true, y_pred)
(0.71, 0.771, 0.74)