shuffle#

sklearn.utils.shuffle(*arrays, random_state=None, n_samples=None)[Quelle]#

Mischt Arrays oder spärliche Matrizen auf konsistente Weise.

Dies ist ein praktischer Alias für resample(*arrays, replace=False), um zufällige Permutationen der Sammlungen durchzuführen.

Parameter:
*arraysSequenz von indizierbaren Datenstrukturen

Indizierbare Datenstrukturen können Arrays, Listen, DataFrames oder Scipy-Sparse-Matrizen mit konsistenter erster Dimension sein.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für das Mischen der Daten. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

n_samplesint, default=None

Anzahl der zu generierenden Stichproben. Wenn dies None bleibt, wird es automatisch auf die erste Dimension der Arrays gesetzt. Es sollte nicht größer sein als die Länge der Arrays.

Gibt zurück:
shuffled_arraysSequenz von indizierbaren Datenstrukturen

Sequenz von gemischten Kopien der Sammlungen. Die ursprünglichen Arrays bleiben unverändert.

Siehe auch

resample

Resampelt Arrays oder spärliche Matrizen auf konsistente Weise.

Beispiele

Es ist möglich, Sparse- und Dense-Arrays in demselben Durchlauf zu mischen

>>> import numpy as np
>>> X = np.array([[1., 0.], [2., 1.], [0., 0.]])
>>> y = np.array([0, 1, 2])

>>> from scipy.sparse import coo_matrix
>>> X_sparse = coo_matrix(X)

>>> from sklearn.utils import shuffle
>>> X, X_sparse, y = shuffle(X, X_sparse, y, random_state=0)
>>> X
array([[0., 0.],
       [2., 1.],
       [1., 0.]])

>>> X_sparse
<Compressed Sparse Row sparse matrix of dtype 'float64'
    with 3 stored elements and shape (3, 2)>

>>> X_sparse.toarray()
array([[0., 0.],
       [2., 1.],
       [1., 0.]])

>>> y
array([2, 1, 0])

>>> shuffle(y, n_samples=2, random_state=0)
array([0, 1])