fetch_lfw_people#
- sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[Quelle]#
Lädt den Labeled Faces in the Wild (LFW) People Datensatz (Klassifikation).
Bei Bedarf herunterladen.
Klassen
5749
Gesamtanzahl Samples
13233
Dimensionalität
5828
Merkmale
echt, zwischen 0 und 255
Ein Anwendungsbeispiel für diesen Datensatz finden Sie unter Gesichtserkennung mit Eigenfaces und SVMs.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- data_homestr oder path-like, Standard=None
Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.
- funneledbool, Standard=True
Laden Sie die "funneled"-Variante des Datensatzes herunter und verwenden Sie sie.
- resizefloat oder None, Standard=0.5
Verhältnis, das zum Ändern der Größe jedes Gesichterbilds verwendet wird. Wenn
None, wird keine Größenänderung vorgenommen.- min_faces_per_personint, Standard=None
Der extrahierte Datensatz behält nur Bilder von Personen, die mindestens
min_faces_per_personverschiedene Bilder haben.- colorbool, Standard=False
Behalten Sie die 3 RGB-Kanäle bei, anstatt sie zu einem einzigen Graustufenkanal zu mitteln. Wenn color True ist, hat die Form der Daten eine Dimension mehr als die Form mit color = False.
- slice_tuple von slice, Standard=(slice(70, 195), slice(78, 172))
Stellen Sie einen benutzerdefinierten 2D-Slice (Höhe, Breite) bereit, um den "interessanten" Teil der JPEG-Dateien zu extrahieren und statistische Korrelationen vom Hintergrund zu vermeiden.
- download_if_missingbool, Standard=True
Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.
- return_X_ybool, Standard=False
Wenn True, gibt
(dataset.data, dataset.target)anstelle eines Bunch-Objekts zurück. Weitere Informationen zu den Objektendataset.dataunddataset.targetfinden Sie weiter unten.Hinzugefügt in Version 0.20.
- n_retriesint, Standard=3
Anzahl der Wiederholungsversuche bei HTTP-Fehlern.
Hinzugefügt in Version 1.5.
- delayfloat, Standard=1.0
Anzahl der Sekunden zwischen den Wiederholungsversuchen.
Hinzugefügt in Version 1.5.
- Gibt zurück:
- dataset
Bunch Dictionary-ähnliches Objekt mit den folgenden Attributen.
- datanumpy array der Form (13233, 2914)
Jede Zeile entspricht einem verflachten Gesichterbild der Originalgröße 62 x 47 Pixel. Das Ändern der Parameter
slice_oder resize ändert die Form der Ausgabe.- imagesnumpy array der Form (13233, 62, 47)
Jede Zeile ist ein Gesichterbild, das einer der 5749 Personen im Datensatz entspricht. Das Ändern der Parameter
slice_oder resize ändert die Form der Ausgabe.- targetnumpy array der Form (13233,)
Labels, die jedem Gesichterbild zugeordnet sind. Diese Labels reichen von 0-5748 und entsprechen den Personen-IDs.
- target_namesnumpy array der Form (5749,)
Namen aller Personen im Datensatz. Die Position im Array entspricht der Personen-ID im Target-Array.
- DESCRstr
Beschreibung des Labeled Faces in the Wild (LFW) Datensatzes.
- (data, target)tuple, wenn
return_X_yTrue ist Ein Tupel aus zwei ndarrays. Das erste enthält ein 2D-Array der Form (n_samples, n_features), wobei jede Zeile eine Stichprobe und jede Spalte die Merkmale darstellt. Das zweite ndarray der Form (n_samples,) enthält die Zielstichproben.
Hinzugefügt in Version 0.20.
- dataset
Beispiele
>>> from sklearn.datasets import fetch_lfw_people >>> lfw_people = fetch_lfw_people() >>> lfw_people.data.shape (13233, 2914) >>> lfw_people.target.shape (13233,) >>> for name in lfw_people.target_names[:5]: ... print(name) AJ Cook AJ Lamas Aaron Eckhart Aaron Guiel Aaron Patterson
Galeriebeispiele#
Gesichtserkennungsbeispiel mit Eigenfaces und SVMs