make_sparse_uncorrelated#

sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[Quelle]#

Generiert ein zufälliges Regressionsproblem mit dünnem, unkorreliertem Design.

Dieser Datensatz wird bei Celeux et al. [1] wie folgt beschrieben:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

Nur die ersten 4 Merkmale sind informativ. Die übrigen Merkmale sind nutzlos.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

n_samplesint, Standard=100: Die Anzahl der Stichproben.
n_featuresint, Standard=10: Die Anzahl der Merkmale.
random_stateint, RandomState-Instanz oder None, default=None: Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Gibt zurück:

Xndarray der Form (n_samples, n_features): Die Eingabestichproben.
yndarray der Form (n_samples,): Die Ausgabewerte.

Referenzen

[1]

G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, „Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation“, 2009.

Beispiele

>>> from sklearn.datasets import make_sparse_uncorrelated
>>> X, y = make_sparse_uncorrelated(random_state=0)
>>> X.shape
(100, 10)
>>> y.shape
(100,)

make_sparse_uncorrelated#

Diese Seite