pairwise_distances_argmin#

sklearn.metrics.pairwise_distances_argmin(X, Y, *, axis=1, metric='euclidean', metric_kwargs=None)[Quelle]#

Berechne die minimalen Distanzen zwischen einem Punkt und einer Menge von Punkten.

Diese Funktion berechnet für jede Zeile in X den Index der Zeile in Y, die am nächsten liegt (gemäß der angegebenen Distanz).

Dies ist weitgehend äquivalent zum Aufruf

pairwise_distances(X, Y=Y, metric=metric).argmin(axis=axis)

verbraucht aber deutlich weniger Speicher und ist für große Arrays schneller.

Diese Funktion funktioniert nur mit dichten 2D-Arrays.

Parameter:

X{array-like, sparse matrix} der Form (n_samples_X, n_features)

Array, das Punkte enthält.

Y{array-like, sparse matrix} der Form (n_samples_Y, n_features)

Arrays, die Punkte enthalten.

axisint, Standard=1

Achse, entlang derer argmin und Distanzen berechnet werden sollen.

metricstr oder aufrufbar, Standard=”euclidean”

Metrik, die zur Distanzberechnung verwendet werden soll. Jede Metrik von scikit-learn oder scipy.spatial.distance kann verwendet werden.

Wenn metric eine aufrufbare Funktion ist, wird sie für jedes Paar von Instanzen (Zeilen) aufgerufen und der resultierende Wert aufgezeichnet. Das Aufrufbare sollte zwei Arrays als Eingabe nehmen und einen Wert zurückgeben, der die Distanz zwischen ihnen angibt. Dies funktioniert für Scipys Metriken, ist aber weniger effizient als die Übergabe des Metriknamens als Zeichenkette.

Distanzmatrizen werden nicht unterstützt.

Gültige Werte für metric sind

von scikit-learn: [‘cityblock’, ‘cosine’, ‘euclidean’, ‘l1’, ‘l2’, ‘manhattan’, ‘nan_euclidean’]
von scipy.spatial.distance: [‘braycurtis’, ‘canberra’, ‘chebyshev’, ‘correlation’, ‘dice’, ‘hamming’, ‘jaccard’, ‘kulsinski’, ‘mahalanobis’, ‘minkowski’, ‘rogerstanimoto’, ‘russellrao’, ‘seuclidean’, ‘sokalmichener’, ‘sokalsneath’, ‘sqeuclidean’, ‘yule’]

Siehe die Dokumentation von scipy.spatial.distance für Details zu diesen Metriken.

Hinweis

'kulsinski' ist seit SciPy 1.9 veraltet und wird in SciPy 1.11 entfernt.

Hinweis

'matching' wurde in SciPy 1.9 entfernt (verwenden Sie stattdessen 'hamming').

metric_kwargsdict, Standard=None

Schlüsselwortargumente, die an die angegebene Metrikfunktion übergeben werden sollen.

Gibt zurück:

argminnumpy.ndarray: Y[argmin[i], :] ist die Zeile in Y, die X[i, :] am nächsten liegt.

Siehe auch

pairwise_distances: Distanzen zwischen jedem Paar von Stichproben von X und Y.
pairwise_distances_argmin_min: Ähnlich wie pairwise_distances_argmin, gibt aber auch die Distanzen zurück.

Beispiele

>>> from sklearn.metrics.pairwise import pairwise_distances_argmin
>>> X = [[0, 0, 0], [1, 1, 1]]
>>> Y = [[1, 0, 0], [1, 1, 0]]
>>> pairwise_distances_argmin(X, Y)
array([0, 1])

Galeriebeispiele#

Vergleich der K-Means und MiniBatchKMeans Clustering-Algorithmen

pairwise_distances_argmin#

Galeriebeispiele#

Diese Seite