fetch_species_distributions#

sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[Quelle]#

Loader für den Datensatz zur Artenverteilung von Phillips et al. (2006).

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

data_homestr oder path-like, Standard=None: Geben Sie einen anderen Download- und Cache-Ordner für die Datensätze an. Standardmäßig werden alle scikit-learn-Daten in Unterordnern unter „~/scikit_learn_data“ gespeichert.
download_if_missingbool, Standard=True: Wenn False, wird eine OSError ausgelöst, wenn die Daten nicht lokal verfügbar sind, anstatt zu versuchen, die Daten von der Quell-Website herunterzuladen.
n_retriesint, Standard=3: Anzahl der Wiederholungsversuche bei HTTP-Fehlern.

Hinzugefügt in Version 1.5.
delayfloat, Standard=1.0: Anzahl der Sekunden zwischen den Wiederholungsversuchen.

Hinzugefügt in Version 1.5.

Gibt zurück:

dataBunch

Dictionary-ähnliches Objekt mit den folgenden Attributen.

coveragesArray, Form = [14, 1592, 1212]

Diese repräsentieren die 14 Merkmale, die an jedem Punkt des Kartenrasters gemessen wurden. Die Breiten-/Längengrade für das Raster werden unten diskutiert. Fehlende Daten werden durch den Wert -9999 dargestellt.

trainAufzeichnung-Array, Form = (1624,)

Die Trainingspunkte für die Daten. Jeder Punkt hat drei Felder

train[‘species’] ist der Artname
train[‘dd long’] ist der Längengrad, in Grad
train[‘dd lat’] ist der Breitengrad, in Grad

testAufzeichnung-Array, Form = (620,)

Die Testpunkte für die Daten. Gleiches Format wie die Trainingsdaten.

Nx, NyGanzzahlen

Die Anzahl der Längengrade (x) und Breitengrade (y) im Raster

x_left_lower_corner, y_left_lower_cornerGleitkommazahlen

Die (x,y)-Position der linken unteren Ecke, in Grad

grid_sizeGleitkommazahl

Der Abstand zwischen den Punkten des Rasters, in Grad

Anmerkungen

Dieser Datensatz repräsentiert die geografische Verteilung von Arten. Der Datensatz wird von Phillips et al. (2006) bereitgestellt.

Die beiden Arten sind

„Bradypus variegatus“ , das Braunkehl-Faultier.
„Microryzomys minutus“, auch bekannt als der kleine Waldreisratte, ein Nagetier, das in Peru, Kolumbien, Ecuador, Peru und Venezuela lebt.

Referenzen

„Maximum entropy modeling of species geographic distributions“ S. J. Phillips, R. P. Anderson, R. E. Schapire - Ecological Modelling, 190:231-259, 2006.

Beispiele

>>> from sklearn.datasets import fetch_species_distributions
>>> species = fetch_species_distributions()
>>> species.train[:5]
array([(b'microryzomys_minutus', -64.7   , -17.85  ),
       (b'microryzomys_minutus', -67.8333, -16.3333),
       (b'microryzomys_minutus', -67.8833, -16.3   ),
       (b'microryzomys_minutus', -67.8   , -16.2667),
       (b'microryzomys_minutus', -67.9833, -15.9   )],
      dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])

Ein ausführlicheres Beispiel finden Sie unter Modellierung der Artenverteilung

Galeriebeispiele#

Artenschutzmodellierung

Kernel-Dichteschätzung von Artenverteilungen

fetch_species_distributions#

Galeriebeispiele#

Diese Seite