fetch_species_distributions#
- sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[Quelle]#
Loader für den Datensatz zur Artenverteilung von Phillips et al. (2006).
Lesen Sie mehr im Benutzerhandbuch.
- Parameter:
- data_homestr oder path-like, Standard=None
Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.
- download_if_missingbool, Standard=True
Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.
- n_retriesint, Standard=3
Anzahl der Wiederholungsversuche bei HTTP-Fehlern.
Hinzugefügt in Version 1.5.
- delayfloat, Standard=1.0
Anzahl der Sekunden zwischen den Wiederholungsversuchen.
Hinzugefügt in Version 1.5.
- Gibt zurück:
- data
Bunch Dictionary-ähnliches Objekt mit den folgenden Attributen.
- coveragesArray, Form = [14, 1592, 1212]
Diese repräsentieren die 14 Merkmale, die an jedem Punkt des Kartenrasters gemessen wurden. Die Breiten-/Längengrade für das Raster werden unten diskutiert. Fehlende Daten werden durch den Wert -9999 dargestellt.
- trainAufzeichnung-Array, Form = (1624,)
Die Trainingspunkte für die Daten. Jeder Punkt hat drei Felder
train[‘species’] ist der Artname
train[‘dd long’] ist der Längengrad, in Grad
train[‘dd lat’] ist der Breitengrad, in Grad
- testAufzeichnung-Array, Form = (620,)
Die Testpunkte für die Daten. Gleiches Format wie die Trainingsdaten.
- Nx, NyGanzzahlen
Die Anzahl der Längengrade (x) und Breitengrade (y) im Raster
- x_left_lower_corner, y_left_lower_cornerGleitkommazahlen
Die (x,y)-Position der linken unteren Ecke, in Grad
- grid_sizeGleitkommazahl
Der Abstand zwischen den Punkten des Rasters, in Grad
- data
Anmerkungen
Dieser Datensatz repräsentiert die geografische Verteilung von Arten. Der Datensatz wird von Phillips et al. (2006) bereitgestellt.
Die beiden Arten sind
„Bradypus variegatus“ , das Braunkehl-Faultier.
„Microryzomys minutus“, auch bekannt als der kleine Waldreisratte, ein Nagetier, das in Peru, Kolumbien, Ecuador, Peru und Venezuela lebt.
Referenzen
„Maximum entropy modeling of species geographic distributions“ S. J. Phillips, R. P. Anderson, R. E. Schapire - Ecological Modelling, 190:231-259, 2006.
Beispiele
>>> from sklearn.datasets import fetch_species_distributions >>> species = fetch_species_distributions() >>> species.train[:5] array([(b'microryzomys_minutus', -64.7 , -17.85 ), (b'microryzomys_minutus', -67.8333, -16.3333), (b'microryzomys_minutus', -67.8833, -16.3 ), (b'microryzomys_minutus', -67.8 , -16.2667), (b'microryzomys_minutus', -67.9833, -15.9 )], dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])
Ein ausführlicheres Beispiel finden Sie unter Modellierung der Artenverteilung