incr_mean_variance_axis#
- sklearn.utils.sparsefuncs.incr_mean_variance_axis(X, *, axis, last_mean, last_var, last_n, weights=None)[Quelle]#
Berechnet inkrementell Mittelwert und Varianz entlang einer Achse auf einer CSR- oder CSC-Matrix.
last_mean, last_var sind die Statistiken, die im letzten Schritt von dieser Funktion berechnet wurden. Beide müssen zu 0-Arrays der richtigen Größe initialisiert werden, d. h. der Anzahl der Merkmale in X. last_n ist die bisher gesehene Anzahl von Stichproben.
- Parameter:
- XCSR oder CSC Sparse Matrix der Form (n_samples, n_features)
Eingabedaten.
- axis{0, 1}
Achse, entlang der die Achse berechnet werden soll.
- last_meanndarray der Form (n_features,) oder (n_samples,), dtype=floating
Array von Mittelwerten, die mit den neuen Daten X aktualisiert werden sollen. Sollte die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1.
- last_varndarray der Form (n_features,) oder (n_samples,), dtype=floating
Array von Varianzen, die mit den neuen Daten X aktualisiert werden sollen. Sollte die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1.
- last_nfloat oder ndarray der Form (n_features,) oder (n_samples,), dtype=floating
Summe der bisher gesehenen Gewichte, exklusive der aktuellen Gewichte. Wenn nicht float, sollte es die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1. Wenn float, entspricht dies gleichen Gewichten für alle Stichproben (oder Merkmale).
- weightsndarray der Form (n_samples,) oder (n_features,), default=None
Wenn axis auf 0 gesetzt ist, hat die Form (n_samples,), oder wenn axis auf 1 gesetzt ist, hat die Form (n_features,). Wenn es auf None gesetzt ist, dann werden die Stichproben gleich gewichtet.
Hinzugefügt in Version 0.24.
- Gibt zurück:
- meansndarray der Form (n_features,) oder (n_samples,), dtype=floating
Aktualisierte merkmalsweise Mittelwerte, wenn axis = 0, oder stichprobenweise Mittelwerte, wenn axis = 1.
- variancesndarray der Form (n_features,) oder (n_samples,), dtype=floating
Aktualisierte merkmalsweise Varianzen, wenn axis = 0, oder stichprobenweise Varianzen, wenn axis = 1.
- nndarray der Form (n_features,) oder (n_samples,), dtype=integral
Aktualisierte Anzahl der gesehenen Stichproben pro Merkmal, wenn axis=0, oder Anzahl der gesehenen Merkmale pro Stichprobe, wenn axis=1.
Wenn weights nicht None ist, ist n eine Summe der Gewichte der gesehenen Stichproben oder Merkmale anstelle der tatsächlichen Anzahl der gesehenen Stichproben oder Merkmale.
Anmerkungen
NaNs werden im Algorithmus ignoriert.
Beispiele
>>> from sklearn.utils import sparsefuncs >>> from scipy import sparse >>> import numpy as np >>> indptr = np.array([0, 3, 4, 4, 4]) >>> indices = np.array([0, 1, 2, 2]) >>> data = np.array([8, 1, 2, 5]) >>> scale = np.array([2, 3, 2]) >>> csr = sparse.csr_matrix((data, indices, indptr)) >>> csr.todense() matrix([[8, 1, 2], [0, 0, 5], [0, 0, 0], [0, 0, 0]]) >>> sparsefuncs.incr_mean_variance_axis( ... csr, axis=0, last_mean=np.zeros(3), last_var=np.zeros(3), last_n=2 ... ) (array([1.33, 0.167, 1.17]), array([8.88, 0.139, 3.47]), array([6., 6., 6.]))