load_diabetes#
- sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[Quellcode]#
Lädt und gibt den Diabetes Datensatz (Regression) zurück.
Gesamtanzahl Samples
442
Dimensionalität
10
Merkmale
real, -.2 < x < .2
Ziele
integer 25 - 346
Hinweis
Die Bedeutung jeder Funktion (d. h.
feature_names) ist möglicherweise unklar (insbesondere fürltg), da die Dokumentation des ursprünglichen Datensatzes nicht eindeutig ist. Wir stellen Informationen bereit, die im Einklang mit der wissenschaftlichen Literatur auf diesem Forschungsgebiet zu stehen scheinen.Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- return_X_ybool, Standard=False
Wenn True, wird ein Bunch-Objekt zurückgegeben, das
(data, target)enthält. Weitere Informationen zu den Objektendataundtargetfinden Sie unten.Hinzugefügt in Version 0.18.
- as_framebool, default=False
Wenn True, sind die Daten ein pandas DataFrame, einschließlich Spalten mit geeigneten dtypes (numerisch). Das Ziel ist ein pandas DataFrame oder eine Series, abhängig von der Anzahl der Zielspalten. Wenn
return_X_yTrue ist, dann sind (data,target) pandas DataFrames oder Series wie unten beschrieben.Hinzugefügt in Version 0.23.
- scaledbool, Standardwert=True
Wenn True, werden die Merkmalsvariablen mittels des Mittelwerts zentriert und durch die Standardabweichung multipliziert mit der Quadratwurzel von
n_samplesskaliert. Wenn False, werden die Rohdaten für die Merkmalsvariablen zurückgegeben.Hinzugefügt in Version 1.1.
- Gibt zurück:
- data
Bunch Dictionary-ähnliches Objekt mit den folgenden Attributen.
- data{ndarray, dataframe} der Form (442, 10)
Die Datenmatrix. Wenn
as_frame=True, istdataein pandas DataFrame.- target: {ndarray, Series} der Form (442,)
Das Regressionsziel. Wenn
as_frame=True, isttargeteine pandas Series.- feature_names: list
Die Namen der Datensatzspalten.
- frame: DataFrame der Form (442, 11)
Nur vorhanden, wenn
as_frame=True. DataFrame mitdataundtarget.Hinzugefügt in Version 0.23.
- DESCR: str
Die vollständige Beschreibung des Datensatzes.
- data_filename: str
Der Pfad zum Speicherort der Daten.
- target_filename: str
Der Pfad zum Speicherort des Ziels.
- (data, target)tuple, wenn
return_X_yTrue ist Gibt ein Tupel aus zwei ndarrays der Form (n_samples, n_features) zurück. Ein 2D-Array, wobei jede Zeile eine Stichprobe und jede Spalte die Merkmale und/oder das Ziel einer gegebenen Stichprobe darstellt.
Hinzugefügt in Version 0.18.
- data
Beispiele
>>> from sklearn.datasets import load_diabetes >>> diabetes = load_diabetes() >>> diabetes.target[:3] array([151., 75., 141.]) >>> diabetes.data.shape (442, 10)
Galeriebeispiele#
Vorhersagen von einzelnen und abstimmenden Regressionsmodellen plotten
Fehlende Werte imputieren, bevor ein Schätzer erstellt wird
Gewöhnliche kleinste Quadrate und Ridge Regression