sklearn.datasets#

Dienstprogramme zum Laden beliebter Datensätze und Generatoren für künstliche Daten.

Benutzerhandbuch. Weitere Details finden Sie im Abschnitt Datensatzlade-Dienstprogramme.

Lader#

clear_data_home

Löscht den gesamten Inhalt des Daten-Cache.

dump_svmlight_file

Speichert den Datensatz im svmlight / libsvm-Dateiformat.

fetch_20newsgroups

Lädt die Dateinamen und Daten aus dem 20 newsgroups Datensatz (Klassifikation).

fetch_20newsgroups_vectorized

Lädt und vektorisiert den 20 newsgroups Datensatz (Klassifikation).

fetch_california_housing

Lädt den California Housing Datensatz (Regression).

fetch_covtype

Lädt den covertype Datensatz (Klassifikation).

fetch_file

Ruft eine Datei aus dem Web ab, falls sie nicht bereits im lokalen Ordner vorhanden ist.

fetch_kddcup99

Lädt den kddcup99 Datensatz (Klassifikation).

fetch_lfw_pairs

Lädt den Labeled Faces in the Wild (LFW) Pairs Datensatz (Klassifikation).

fetch_lfw_people

Lädt den Labeled Faces in the Wild (LFW) People Datensatz (Klassifikation).

fetch_olivetti_faces

Lädt den Olivetti Faces Datensatz von AT&T (Klassifikation).

fetch_openml

Ruft den Datensatz von openml nach Name oder Datensatz-ID ab.

fetch_rcv1

Lädt den RCV1 Multilabel Datensatz (Klassifikation).

fetch_species_distributions

Lader für den Datensatz zur Artenverteilung von Phillips et.

get_data_home

Gibt den Pfad des scikit-learn Datenverzeichnisses zurück.

load_breast_cancer

Lädt und gibt den Brustkrebs Wisconsin Datensatz (Klassifikation) zurück.

load_diabetes

Lädt und gibt den Diabetes Datensatz (Regression) zurück.

load_digits

Lädt und gibt den Ziffern Datensatz (Klassifikation) zurück.

load_files

Lädt Textdateien mit Kategorien als Unterordnernamen.

load_iris

Lädt und gibt den Iris Datensatz (Klassifikation) zurück.

load_linnerud

Lädt und gibt den Linnerud Datensatz für körperliche Übungen zurück.

load_sample_image

Lädt das Numpy-Array eines einzelnen Beispielbildes.

load_sample_images

Lädt Beispielbilder für die Bildbearbeitung.

load_svmlight_file

Lädt Datensätze im svmlight / libsvm-Format in eine dünne CSR-Matrix.

load_svmlight_files

Lädt Datensätze aus mehreren Dateien im SVMlight-Format.

load_wine

Lädt und gibt den Wein Datensatz (Klassifikation) zurück.

Stichprobengeneratoren#

make_biclusters

Generiert ein Array mit konstanter Blockdiagonalstruktur für Biclustering.

make_blobs

Generiert isotrope Gaußsche Klumpen für das Clustering.

make_checkerboard

Generiert ein Array mit Block-Schachbrettstruktur für Biclustering.

make_circles

Erstellt einen großen Kreis, der einen kleineren Kreis in 2D enthält.

make_classification

Generiert eine zufällige Klassifikationsaufgabe mit n Klassen.

make_friedman1

Generiere das Regressionsproblem "Friedman #1".

make_friedman2

Generiere das Regressionsproblem "Friedman #2".

make_friedman3

Generiere das Regressionsproblem "Friedman #3".

make_gaussian_quantiles

Generiert isotrope Gaußsche und beschriftete Stichproben nach Quantilen.

make_hastie_10_2

Generiert Daten für binäre Klassifikation, wie in Hastie et al. 2009, Beispiel 10.2.

make_low_rank_matrix

Generiert eine hauptsächlich niedrigrangige Matrix mit glockenförmigen singulären Werten.

make_moons

Erstellt zwei sich abwechselnde Halbkreise.

make_multilabel_classification

Generiert eine zufällige Multilabel-Klassifikationsaufgabe.

make_regression

Generiert ein zufälliges Regressionsproblem.

make_s_curve

Generiert einen S-Kurven-Datensatz.

make_sparse_coded_signal

Generiert ein Signal als dünne Kombination von Wörterbuchelementen.

make_sparse_spd_matrix

Generiert eine dünne symmetrische positiv-definite Matrix.

make_sparse_uncorrelated

Generiert ein zufälliges Regressionsproblem mit dünnem, unkorreliertem Design.

make_spd_matrix

Generiert eine zufällige symmetrische, positiv-definite Matrix.

make_swiss_roll

Generiert einen Swiss-Roll-Datensatz.