fetch_lfw_pairs#
- sklearn.datasets.fetch_lfw_pairs(*, subset='train', data_home=None, funneled=True, resize=0.5, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, n_retries=3, delay=1.0)[Quelle]#
Lädt den Labeled Faces in the Wild (LFW) Pairs Datensatz (Klassifikation).
Bei Bedarf herunterladen.
Klassen
2
Gesamtanzahl Samples
13233
Dimensionalität
5828
Merkmale
echt, zwischen 0 und 255
In der Originalarbeit entspricht die „Pairs“-Version der „restricted task“, bei der der Experimentator nicht den Namen einer Person verwenden darf, um die Gleichheit oder Ungleichheit zweier Gesichtsbilder zu schlussfolgern, die nicht explizit im Trainingsdatensatz angegeben sind.
Die Originalbilder sind 250 x 250 Pixel groß, aber die Standardwerte für `slice` und `resize` reduzieren sie auf 62 x 47 Pixel.
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- subset{‘train’, ‘test’, ‘10_folds’}, Standardwert=’train’
Wählt den zu ladenden Datensatz aus: ‚train‘ für den Entwicklungs-Trainingssatz, ‚test‘ für den Entwicklungs-Test-Satz und ‚10_folds‘ für den offiziellen Evaluationssatz, der für eine 10-fach-Kreuzvalidierung verwendet werden soll.
- data_homestr oder path-like, Standard=None
Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.
- funneledbool, Standardwert=True
Lädt und verwendet die „funneled“-Variante des Datensatzes.
- resizefloat, Standardwert=0.5
Verhältnis, das zur Größenänderung jedes Gesichtsbildes verwendet wird.
- colorbool, Standardwert=False
Behält die 3 RGB-Kanäle bei, anstatt sie zu einem einzigen Graustufenkanal zu mitteln. Wenn color True ist, hat die Form der Daten eine Dimension mehr als die Form mit color = False.
- slice_tuple von slice, Standardwert=(slice(70, 195), slice(78, 172))
Stellt einen benutzerdefinierten 2D-Slice (Höhe, Breite) zur Verfügung, um den „interessanten“ Teil der JPEG-Dateien zu extrahieren und statistische Korrelationen vom Hintergrund zu vermeiden.
- download_if_missingbool, Standard=True
Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.
- n_retriesint, Standard=3
Anzahl der Wiederholungsversuche bei HTTP-Fehlern.
Hinzugefügt in Version 1.5.
- delayfloat, Standard=1.0
Anzahl der Sekunden zwischen den Wiederholungsversuchen.
Hinzugefügt in Version 1.5.
- Gibt zurück:
- data
Bunch Dictionary-ähnliches Objekt mit den folgenden Attributen.
- datandarray der Form (2200, 5828). Die Form hängt von
subsetab. Jede Zeile entspricht 2 verflachten Gesichtsbildern der Originalgröße 62 x 47 Pixel. Das Ändern der Parameter
slice_,resizeodersubsetändert die Form der Ausgabe.- pairsndarray der Form (2200, 2, 62, 47). Die Form hängt von
subsetab. Jede Zeile enthält 2 Gesichtsbilder, die von derselben oder einer anderen Person aus dem Datensatz mit 5749 Personen stammen. Das Ändern der Parameter
slice_,resizeodersubsetändert die Form der Ausgabe.- targetnumpy array der Form (2200,). Die Form hängt von
subsetab. Labels, die jedem Bildpaar zugeordnet sind. Die beiden Labelwerte sind „unterschiedliche Personen“ oder „dieselbe Person“.
- target_namesnumpy array der Form (2,)
Erklärt die Zielwerte des Target-Arrays. 0 entspricht „Unterschiedliche Person“, 1 entspricht „dieselbe Person“.
- DESCRstr
Beschreibung des Labeled Faces in the Wild (LFW)-Datensatzes.
- datandarray der Form (2200, 5828). Die Form hängt von
- data
Beispiele
>>> from sklearn.datasets import fetch_lfw_pairs >>> lfw_pairs_train = fetch_lfw_pairs(subset='train') >>> list(lfw_pairs_train.target_names) [np.str_('Different persons'), np.str_('Same person')] >>> lfw_pairs_train.pairs.shape (2200, 2, 62, 47) >>> lfw_pairs_train.data.shape (2200, 5828) >>> lfw_pairs_train.target.shape (2200,)