make_sparse_uncorrelated#
- sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[Quelle]#
Generiert ein zufälliges Regressionsproblem mit dünnem, unkorreliertem Design.
Dieser Datensatz wird bei Celeux et al. [1] wie folgt beschrieben:
X ~ N(0, 1) y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]
Nur die ersten 4 Merkmale sind informativ. Die übrigen Merkmale sind nutzlos.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- n_samplesint, Standard=100
Die Anzahl der Stichproben.
- n_featuresint, Standard=10
Die Anzahl der Merkmale.
- random_stateint, RandomState-Instanz oder None, default=None
Bestimmt die Zufallszahlengenerierung für die Datenerstellung. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.
- Gibt zurück:
- Xndarray der Form (n_samples, n_features)
Die Eingabestichproben.
- yndarray der Form (n_samples,)
Die Ausgabewerte.
Referenzen
[1]G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, „Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation“, 2009.
Beispiele
>>> from sklearn.datasets import make_sparse_uncorrelated >>> X, y = make_sparse_uncorrelated(random_state=0) >>> X.shape (100, 10) >>> y.shape (100,)