fetch_lfw_people#

sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[Quelle]#

Lädt den Labeled Faces in the Wild (LFW) People Datensatz (Klassifikation).

Bei Bedarf herunterladen.

Klassen

5749

Gesamtanzahl Samples

13233

Dimensionalität

5828

Merkmale

echt, zwischen 0 und 255

Ein Anwendungsbeispiel für diesen Datensatz finden Sie unter Gesichtserkennung mit Eigenfaces und SVMs.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
data_homestr oder path-like, Standard=None

Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.

funneledbool, Standard=True

Laden Sie die "funneled"-Variante des Datensatzes herunter und verwenden Sie sie.

resizefloat oder None, Standard=0.5

Verhältnis, das zum Ändern der Größe jedes Gesichterbilds verwendet wird. Wenn None, wird keine Größenänderung vorgenommen.

min_faces_per_personint, Standard=None

Der extrahierte Datensatz behält nur Bilder von Personen, die mindestens min_faces_per_person verschiedene Bilder haben.

colorbool, Standard=False

Behalten Sie die 3 RGB-Kanäle bei, anstatt sie zu einem einzigen Graustufenkanal zu mitteln. Wenn color True ist, hat die Form der Daten eine Dimension mehr als die Form mit color = False.

slice_tuple von slice, Standard=(slice(70, 195), slice(78, 172))

Stellen Sie einen benutzerdefinierten 2D-Slice (Höhe, Breite) bereit, um den "interessanten" Teil der JPEG-Dateien zu extrahieren und statistische Korrelationen vom Hintergrund zu vermeiden.

download_if_missingbool, Standard=True

Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.

return_X_ybool, Standard=False

Wenn True, gibt (dataset.data, dataset.target) anstelle eines Bunch-Objekts zurück. Weitere Informationen zu den Objekten dataset.data und dataset.target finden Sie weiter unten.

Hinzugefügt in Version 0.20.

n_retriesint, Standard=3

Anzahl der Wiederholungsversuche bei HTTP-Fehlern.

Hinzugefügt in Version 1.5.

delayfloat, Standard=1.0

Anzahl der Sekunden zwischen den Wiederholungsversuchen.

Hinzugefügt in Version 1.5.

Gibt zurück:
datasetBunch

Dictionary-ähnliches Objekt mit den folgenden Attributen.

datanumpy array der Form (13233, 2914)

Jede Zeile entspricht einem verflachten Gesichterbild der Originalgröße 62 x 47 Pixel. Das Ändern der Parameter slice_ oder resize ändert die Form der Ausgabe.

imagesnumpy array der Form (13233, 62, 47)

Jede Zeile ist ein Gesichterbild, das einer der 5749 Personen im Datensatz entspricht. Das Ändern der Parameter slice_ oder resize ändert die Form der Ausgabe.

targetnumpy array der Form (13233,)

Labels, die jedem Gesichterbild zugeordnet sind. Diese Labels reichen von 0-5748 und entsprechen den Personen-IDs.

target_namesnumpy array der Form (5749,)

Namen aller Personen im Datensatz. Die Position im Array entspricht der Personen-ID im Target-Array.

DESCRstr

Beschreibung des Labeled Faces in the Wild (LFW) Datensatzes.

(data, target)tuple, wenn return_X_y True ist

Ein Tupel aus zwei ndarrays. Das erste enthält ein 2D-Array der Form (n_samples, n_features), wobei jede Zeile eine Stichprobe und jede Spalte die Merkmale darstellt. Das zweite ndarray der Form (n_samples,) enthält die Zielstichproben.

Hinzugefügt in Version 0.20.

Beispiele

>>> from sklearn.datasets import fetch_lfw_people
>>> lfw_people = fetch_lfw_people()
>>> lfw_people.data.shape
(13233, 2914)
>>> lfw_people.target.shape
(13233,)
>>> for name in lfw_people.target_names[:5]:
...    print(name)
AJ Cook
AJ Lamas
Aaron Eckhart
Aaron Guiel
Aaron Patterson