incr_mean_variance_axis#

sklearn.utils.sparsefuncs.incr_mean_variance_axis(X, *, axis, last_mean, last_var, last_n, weights=None)[Quelle]#

Berechnet inkrementell Mittelwert und Varianz entlang einer Achse auf einer CSR- oder CSC-Matrix.

last_mean, last_var sind die Statistiken, die im letzten Schritt von dieser Funktion berechnet wurden. Beide müssen zu 0-Arrays der richtigen Größe initialisiert werden, d. h. der Anzahl der Merkmale in X. last_n ist die bisher gesehene Anzahl von Stichproben.

Parameter:
XCSR oder CSC Sparse Matrix der Form (n_samples, n_features)

Eingabedaten.

axis{0, 1}

Achse, entlang der die Achse berechnet werden soll.

last_meanndarray der Form (n_features,) oder (n_samples,), dtype=floating

Array von Mittelwerten, die mit den neuen Daten X aktualisiert werden sollen. Sollte die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1.

last_varndarray der Form (n_features,) oder (n_samples,), dtype=floating

Array von Varianzen, die mit den neuen Daten X aktualisiert werden sollen. Sollte die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1.

last_nfloat oder ndarray der Form (n_features,) oder (n_samples,), dtype=floating

Summe der bisher gesehenen Gewichte, exklusive der aktuellen Gewichte. Wenn nicht float, sollte es die Form (n_features,) haben, wenn axis=0, oder (n_samples,), wenn axis=1. Wenn float, entspricht dies gleichen Gewichten für alle Stichproben (oder Merkmale).

weightsndarray der Form (n_samples,) oder (n_features,), default=None

Wenn axis auf 0 gesetzt ist, hat die Form (n_samples,), oder wenn axis auf 1 gesetzt ist, hat die Form (n_features,). Wenn es auf None gesetzt ist, dann werden die Stichproben gleich gewichtet.

Hinzugefügt in Version 0.24.

Gibt zurück:
meansndarray der Form (n_features,) oder (n_samples,), dtype=floating

Aktualisierte merkmalsweise Mittelwerte, wenn axis = 0, oder stichprobenweise Mittelwerte, wenn axis = 1.

variancesndarray der Form (n_features,) oder (n_samples,), dtype=floating

Aktualisierte merkmalsweise Varianzen, wenn axis = 0, oder stichprobenweise Varianzen, wenn axis = 1.

nndarray der Form (n_features,) oder (n_samples,), dtype=integral

Aktualisierte Anzahl der gesehenen Stichproben pro Merkmal, wenn axis=0, oder Anzahl der gesehenen Merkmale pro Stichprobe, wenn axis=1.

Wenn weights nicht None ist, ist n eine Summe der Gewichte der gesehenen Stichproben oder Merkmale anstelle der tatsächlichen Anzahl der gesehenen Stichproben oder Merkmale.

Anmerkungen

NaNs werden im Algorithmus ignoriert.

Beispiele

>>> from sklearn.utils import sparsefuncs
>>> from scipy import sparse
>>> import numpy as np
>>> indptr = np.array([0, 3, 4, 4, 4])
>>> indices = np.array([0, 1, 2, 2])
>>> data = np.array([8, 1, 2, 5])
>>> scale = np.array([2, 3, 2])
>>> csr = sparse.csr_matrix((data, indices, indptr))
>>> csr.todense()
matrix([[8, 1, 2],
        [0, 0, 5],
        [0, 0, 0],
        [0, 0, 0]])
>>> sparsefuncs.incr_mean_variance_axis(
...     csr, axis=0, last_mean=np.zeros(3), last_var=np.zeros(3), last_n=2
... )
(array([1.33, 0.167, 1.17]), array([8.88, 0.139, 3.47]),
array([6., 6., 6.]))