pairwise_distances_argmin#
- sklearn.metrics.pairwise_distances_argmin(X, Y, *, axis=1, metric='euclidean', metric_kwargs=None)[Quelle]#
Berechne die minimalen Distanzen zwischen einem Punkt und einer Menge von Punkten.
Diese Funktion berechnet für jede Zeile in X den Index der Zeile in Y, die am nächsten liegt (gemäß der angegebenen Distanz).
Dies ist weitgehend äquivalent zum Aufruf
pairwise_distances(X, Y=Y, metric=metric).argmin(axis=axis)
verbraucht aber deutlich weniger Speicher und ist für große Arrays schneller.
Diese Funktion funktioniert nur mit dichten 2D-Arrays.
- Parameter:
- X{array-like, sparse matrix} der Form (n_samples_X, n_features)
Array, das Punkte enthält.
- Y{array-like, sparse matrix} der Form (n_samples_Y, n_features)
Arrays, die Punkte enthalten.
- axisint, Standard=1
Achse, entlang derer argmin und Distanzen berechnet werden sollen.
- metricstr oder aufrufbar, Standard=”euclidean”
Metrik, die zur Distanzberechnung verwendet werden soll. Jede Metrik von scikit-learn oder
scipy.spatial.distancekann verwendet werden.Wenn metric eine aufrufbare Funktion ist, wird sie für jedes Paar von Instanzen (Zeilen) aufgerufen und der resultierende Wert aufgezeichnet. Das Aufrufbare sollte zwei Arrays als Eingabe nehmen und einen Wert zurückgeben, der die Distanz zwischen ihnen angibt. Dies funktioniert für Scipys Metriken, ist aber weniger effizient als die Übergabe des Metriknamens als Zeichenkette.
Distanzmatrizen werden nicht unterstützt.
Gültige Werte für metric sind
von scikit-learn: [‘cityblock’, ‘cosine’, ‘euclidean’, ‘l1’, ‘l2’, ‘manhattan’, ‘nan_euclidean’]
von
scipy.spatial.distance: [‘braycurtis’, ‘canberra’, ‘chebyshev’, ‘correlation’, ‘dice’, ‘hamming’, ‘jaccard’, ‘kulsinski’, ‘mahalanobis’, ‘minkowski’, ‘rogerstanimoto’, ‘russellrao’, ‘seuclidean’, ‘sokalmichener’, ‘sokalsneath’, ‘sqeuclidean’, ‘yule’]
Siehe die Dokumentation von
scipy.spatial.distancefür Details zu diesen Metriken.Hinweis
'kulsinski'ist seit SciPy 1.9 veraltet und wird in SciPy 1.11 entfernt.Hinweis
'matching'wurde in SciPy 1.9 entfernt (verwenden Sie stattdessen'hamming').- metric_kwargsdict, Standard=None
Schlüsselwortargumente, die an die angegebene Metrikfunktion übergeben werden sollen.
- Gibt zurück:
- argminnumpy.ndarray
Y[argmin[i], :] ist die Zeile in Y, die X[i, :] am nächsten liegt.
Siehe auch
pairwise_distancesDistanzen zwischen jedem Paar von Stichproben von X und Y.
pairwise_distances_argmin_minÄhnlich wie
pairwise_distances_argmin, gibt aber auch die Distanzen zurück.
Beispiele
>>> from sklearn.metrics.pairwise import pairwise_distances_argmin >>> X = [[0, 0, 0], [1, 1, 1]] >>> Y = [[1, 0, 0], [1, 1, 0]] >>> pairwise_distances_argmin(X, Y) array([0, 1])
Galeriebeispiele#
Vergleich der K-Means und MiniBatchKMeans Clustering-Algorithmen