load_diabetes#

sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[Quellcode]#

Lädt und gibt den Diabetes Datensatz (Regression) zurück.

Gesamtanzahl Samples	442
Dimensionalität	10
Merkmale	real, -.2 < x < .2
Ziele	integer 25 - 346

Hinweis

Die Bedeutung jeder Funktion (d. h. feature_names) ist möglicherweise unklar (insbesondere für ltg), da die Dokumentation des ursprünglichen Datensatzes nicht eindeutig ist. Wir stellen Informationen bereit, die im Einklang mit der wissenschaftlichen Literatur auf diesem Forschungsgebiet zu stehen scheinen.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

return_X_ybool, Standard=False: Wenn True, wird ein Bunch-Objekt zurückgegeben, das (data, target) enthält. Weitere Informationen zu den Objekten data und target finden Sie unten.

Hinzugefügt in Version 0.18.
as_framebool, default=False: Wenn True, sind die Daten ein pandas DataFrame, einschließlich Spalten mit geeigneten dtypes (numerisch). Das Ziel ist ein pandas DataFrame oder eine Series, abhängig von der Anzahl der Zielspalten. Wenn return_X_y True ist, dann sind (data, target) pandas DataFrames oder Series wie unten beschrieben.

Hinzugefügt in Version 0.23.
scaledbool, Standardwert=True: Wenn True, werden die Merkmalsvariablen mittels des Mittelwerts zentriert und durch die Standardabweichung multipliziert mit der Quadratwurzel von n_samples skaliert. Wenn False, werden die Rohdaten für die Merkmalsvariablen zurückgegeben.

Hinzugefügt in Version 1.1.

Gibt zurück:

dataBunch

Dictionary-ähnliches Objekt mit den folgenden Attributen.

data{ndarray, dataframe} der Form (442, 10): Die Datenmatrix. Wenn as_frame=True, ist data ein pandas DataFrame.
target: {ndarray, Series} der Form (442,): Das Regressionsziel. Wenn as_frame=True, ist target eine pandas Series.
feature_names: list: Die Namen der Datensatzspalten.
frame: DataFrame der Form (442, 11): Nur vorhanden, wenn as_frame=True. DataFrame mit data und target.

Hinzugefügt in Version 0.23.
DESCR: str: Die vollständige Beschreibung des Datensatzes.
data_filename: str: Der Pfad zum Speicherort der Daten.
target_filename: str: Der Pfad zum Speicherort des Ziels.

(data, target)tuple, wenn return_X_y True ist

Gibt ein Tupel aus zwei ndarrays der Form (n_samples, n_features) zurück. Ein 2D-Array, wobei jede Zeile eine Stichprobe und jede Spalte die Merkmale und/oder das Ziel einer gegebenen Stichprobe darstellt.

Hinzugefügt in Version 0.18.

Beispiele

>>> from sklearn.datasets import load_diabetes
>>> diabetes = load_diabetes()
>>> diabetes.target[:3]
array([151.,  75., 141.])
>>> diabetes.data.shape
(442, 10)

Galeriebeispiele#

Einfluss der Modellkomplexität

Gradient Boosting Regression

Vorhersagen von einzelnen und abstimmenden Regressionsmodellen plotten

Modellbasierte und sequentielle Merkmalsauswahl

Fehlende Werte imputieren, bevor ein Schätzer erstellt wird

Lasso-Modellauswahl über Informationskriterien

Lasso, Lasso-LARS und Elastic Net Pfade

Lasso-Modellauswahl: AIC-BIC / Kreuzvalidierung

Gewöhnliche kleinste Quadrate und Ridge Regression

Fortgeschrittene Plotting mit Partial Dependence

Kreuzvalidierte Vorhersagen plotten

Release Highlights für scikit-learn 1.2

load_diabetes#

Galeriebeispiele#

Diese Seite