fetch_lfw_pairs#

sklearn.datasets.fetch_lfw_pairs(*, subset='train', data_home=None, funneled=True, resize=0.5, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, n_retries=3, delay=1.0)[Quelle]#

Lädt den Labeled Faces in the Wild (LFW) Pairs Datensatz (Klassifikation).

Bei Bedarf herunterladen.

Klassen

2

Gesamtanzahl Samples

13233

Dimensionalität

5828

Merkmale

echt, zwischen 0 und 255

In der Originalarbeit entspricht die „Pairs“-Version der „restricted task“, bei der der Experimentator nicht den Namen einer Person verwenden darf, um die Gleichheit oder Ungleichheit zweier Gesichtsbilder zu schlussfolgern, die nicht explizit im Trainingsdatensatz angegeben sind.

Die Originalbilder sind 250 x 250 Pixel groß, aber die Standardwerte für `slice` und `resize` reduzieren sie auf 62 x 47 Pixel.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
subset{‘train’, ‘test’, ‘10_folds’}, Standardwert=’train’

Wählt den zu ladenden Datensatz aus: ‚train‘ für den Entwicklungs-Trainingssatz, ‚test‘ für den Entwicklungs-Test-Satz und ‚10_folds‘ für den offiziellen Evaluationssatz, der für eine 10-fach-Kreuzvalidierung verwendet werden soll.

data_homestr oder path-like, Standard=None

Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.

funneledbool, Standardwert=True

Lädt und verwendet die „funneled“-Variante des Datensatzes.

resizefloat, Standardwert=0.5

Verhältnis, das zur Größenänderung jedes Gesichtsbildes verwendet wird.

colorbool, Standardwert=False

Behält die 3 RGB-Kanäle bei, anstatt sie zu einem einzigen Graustufenkanal zu mitteln. Wenn color True ist, hat die Form der Daten eine Dimension mehr als die Form mit color = False.

slice_tuple von slice, Standardwert=(slice(70, 195), slice(78, 172))

Stellt einen benutzerdefinierten 2D-Slice (Höhe, Breite) zur Verfügung, um den „interessanten“ Teil der JPEG-Dateien zu extrahieren und statistische Korrelationen vom Hintergrund zu vermeiden.

download_if_missingbool, Standard=True

Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.

n_retriesint, Standard=3

Anzahl der Wiederholungsversuche bei HTTP-Fehlern.

Hinzugefügt in Version 1.5.

delayfloat, Standard=1.0

Anzahl der Sekunden zwischen den Wiederholungsversuchen.

Hinzugefügt in Version 1.5.

Gibt zurück:
dataBunch

Dictionary-ähnliches Objekt mit den folgenden Attributen.

datandarray der Form (2200, 5828). Die Form hängt von subset ab.

Jede Zeile entspricht 2 verflachten Gesichtsbildern der Originalgröße 62 x 47 Pixel. Das Ändern der Parameter slice_, resize oder subset ändert die Form der Ausgabe.

pairsndarray der Form (2200, 2, 62, 47). Die Form hängt von subset ab.

Jede Zeile enthält 2 Gesichtsbilder, die von derselben oder einer anderen Person aus dem Datensatz mit 5749 Personen stammen. Das Ändern der Parameter slice_, resize oder subset ändert die Form der Ausgabe.

targetnumpy array der Form (2200,). Die Form hängt von subset ab.

Labels, die jedem Bildpaar zugeordnet sind. Die beiden Labelwerte sind „unterschiedliche Personen“ oder „dieselbe Person“.

target_namesnumpy array der Form (2,)

Erklärt die Zielwerte des Target-Arrays. 0 entspricht „Unterschiedliche Person“, 1 entspricht „dieselbe Person“.

DESCRstr

Beschreibung des Labeled Faces in the Wild (LFW)-Datensatzes.

Beispiele

>>> from sklearn.datasets import fetch_lfw_pairs
>>> lfw_pairs_train = fetch_lfw_pairs(subset='train')
>>> list(lfw_pairs_train.target_names)
[np.str_('Different persons'), np.str_('Same person')]
>>> lfw_pairs_train.pairs.shape
(2200, 2, 62, 47)
>>> lfw_pairs_train.data.shape
(2200, 5828)
>>> lfw_pairs_train.target.shape
(2200,)