make_sparse_uncorrelated#

sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[Quelle]#

Generiert ein zufälliges Regressionsproblem mit dünnem, unkorreliertem Design.

Dieser Datensatz wird bei Celeux et al. [1] wie folgt beschrieben:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

Nur die ersten 4 Merkmale sind informativ. Die übrigen Merkmale sind nutzlos.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
n_samplesint, Standard=100

Die Anzahl der Stichproben.

n_featuresint, Standard=10

Die Anzahl der Merkmale.

random_stateint, RandomState-Instanz oder None, default=None

Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Gibt zurück:
Xndarray der Form (n_samples, n_features)

Die Eingabestichproben.

yndarray der Form (n_samples,)

Die Ausgabewerte.

Referenzen

[1]

G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, „Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation“, 2009.

Beispiele

>>> from sklearn.datasets import make_sparse_uncorrelated
>>> X, y = make_sparse_uncorrelated(random_state=0)
>>> X.shape
(100, 10)
>>> y.shape
(100,)