DummyClassifier#

class sklearn.dummy.DummyClassifier(*, strategy='prior', random_state=None, constant=None)[Quelle]#

DummyClassifier trifft Vorhersagen, die die Eingabemerkmale ignorieren.

Dieser Klassifikator dient als einfacher Basiswert zum Vergleich mit anderen, komplexeren Klassifikatoren.

Das spezifische Verhalten des Basiswerts wird mit dem Parameter strategy ausgewählt.

Alle Strategien treffen Vorhersagen, die die Eingabemerkmalwerte ignorieren, die als X-Argument an fit und predict übergeben werden. Die Vorhersagen hängen jedoch typischerweise von den Werten ab, die im y-Parameter beobachtet wurden, der an fit übergeben wird.

Beachten Sie, dass die Strategien „stratified“ und „uniform“ nicht-deterministische Vorhersagen liefern, die durch Setzen des Parameters random_state deterministisch gemacht werden können, falls erforderlich. Die anderen Strategien sind von Natur aus deterministisch und geben nach dem Anpassen immer die gleiche konstante Vorhersage für jeden Wert von X zurück.

Lesen Sie mehr im Benutzerhandbuch.

Hinzugefügt in Version 0.13.

Parameter:

strategy{„most_frequent“, „prior“, „stratified“, „uniform“, „constant“}, Standardwert=„prior“

Strategie zur Erzeugung von Vorhersagen.

„most_frequent“: Die Methode predict gibt immer das häufigste Klassenlabel im beobachteten y-Argument zurück, das an fit übergeben wurde. Die Methode predict_proba gibt den entsprechenden One-Hot-kodierten Vektor zurück.
„prior“: Die Methode predict gibt immer das häufigste Klassenlabel im beobachteten y-Argument zurück, das an fit übergeben wurde (wie „most_frequent“). predict_proba gibt immer die empirische Klassenverteilung von y zurück, auch bekannt als die empirische Klassen-Prior-Verteilung.
„stratified“: Die Methode predict_proba zieht zufällig One-Hot-Vektoren aus einer multivariaten Verteilung, die durch die empirischen Klassen-Prior-Wahrscheinlichkeiten parametrisiert ist. Die Methode predict gibt das Klassenlabel zurück, das im One-Hot-Vektor von predict_proba die Wahrscheinlichkeit eins erhalten hat. Jede gezogene Zeile beider Methoden ist daher unabhängig und identisch verteilt.
„uniform“: Erzeugt Vorhersagen gleichmäßig zufällig aus der Liste der eindeutigen Klassen, die in y beobachtet wurden, d.h. jede Klasse hat die gleiche Wahrscheinlichkeit.
„constant“: Sagt immer ein vom Benutzer bereitgestelltes konstantes Label voraus. Dies ist nützlich für Metriken, die eine nicht-Mehrheitsklasse auswerten.

Geändert in Version 0.24: Der Standardwert von strategy wurde in Version 0.24 auf „prior“ geändert.

random_stateint, RandomState-Instanz oder None, default=None

Steuert die Zufälligkeit zur Erzeugung von Vorhersagen, wenn strategy='stratified' oder strategy='uniform' ist. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

constantint oder str oder array-like von Form (n_outputs,), Standardwert=None

Das explizite konstante Label, das von der Strategie „constant“ vorhergesagt wird. Dieser Parameter ist nur für die Strategie „constant“ nützlich.

Attribute:

classes_ndarray von Form (n_classes,) oder Liste solcher Arrays: Eindeutige Klassenlabels, die in y beobachtet wurden. Bei Multi-Output-Klassifizierungsproblemen ist dieses Attribut eine Liste von Arrays, da jeder Output einen unabhängigen Satz möglicher Klassen hat.
n_classes_int oder Liste von int: Anzahl der Labels für jeden Output.
class_prior_ndarray von Form (n_classes,) oder Liste solcher Arrays: Häufigkeit jeder Klasse, die in y beobachtet wurde. Bei Multi-Output-Klassifizierungsproblemen wird dies unabhängig für jeden Output berechnet.
n_features_in_int: Anzahl der während des fits gesehenen Merkmale.
feature_names_in_ndarray mit Form (n_features_in_,): Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.
n_outputs_int: Anzahl der Ausgaben.
sparse_output_bool: True, wenn das von predict zurückgegebene Array im sparse CSC-Format vorliegen soll. Wird automatisch auf True gesetzt, wenn das Eingabe-y im Sparse-Format übergeben wird.

Siehe auch

DummyRegressor: Regressor, der Vorhersagen nach einfachen Regeln trifft.

Beispiele

>>> import numpy as np
>>> from sklearn.dummy import DummyClassifier
>>> X = np.array([-1, 1, 1, 1])
>>> y = np.array([0, 1, 1, 1])
>>> dummy_clf = DummyClassifier(strategy="most_frequent")
>>> dummy_clf.fit(X, y)
DummyClassifier(strategy='most_frequent')
>>> dummy_clf.predict(X)
array([1, 1, 1, 1])
>>> dummy_clf.score(X, y)
0.75

fit(X, y, sample_weight=None)[Quelle]#

Passe den Basis-Klassifikator an.

Parameter:

Xarray-like der Form (n_samples, n_features): Trainingsdaten.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs): Zielwerte.
sample_weightarray-like der Form (n_samples,), Standardwert=None: Stichprobengewichte.

Gibt zurück:

selfobject: Gibt die Instanz selbst zurück.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:

routingMetadataRequest: Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:

deepbool, default=True: Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:

paramsdict: Parameternamen, zugeordnet ihren Werten.

predict(X)[Quelle]#

Führe Klassifizierung auf Testvektoren X durch.

Parameter:

Xarray-like der Form (n_samples, n_features): Testdaten.

Gibt zurück:

yarray-like der Form (n_samples,) oder (n_samples, n_outputs): Vorhergesagte Zielwerte für X.

predict_log_proba(X)[Quelle]#

Gib Log-Wahrscheinlichkeits-Schätzungen für die Testvektoren X zurück.

Parameter:

X{array-like, Objekt mit endlicher Länge oder Form}: Trainingsdaten.

Gibt zurück:

Pndarray von Form (n_samples, n_classes) oder Liste solcher Arrays: Gibt die Log-Wahrscheinlichkeit der Stichprobe für jede Klasse im Modell zurück, wobei die Klassen für jeden Output arithmetisch geordnet sind.

predict_proba(X)[Quelle]#

Gibt Wahrscheinlichkeitsschätzungen für die Testvektoren X zurück.

Parameter:

Xarray-like der Form (n_samples, n_features): Testdaten.

Gibt zurück:

Pndarray von Form (n_samples, n_classes) oder Liste solcher Arrays: Gibt die Wahrscheinlichkeit der Stichprobe für jede Klasse im Modell zurück, wobei die Klassen arithmetisch geordnet sind, für jeden Output.

score(X, y, sample_weight=None)[Quelle]#

Gibt die durchschnittliche Genauigkeit auf den gegebenen Testdaten und Labels zurück.

Bei der Multi-Label-Klassifizierung ist dies die Subset-Genauigkeit, eine strenge Metrik, da für jede Stichprobe verlangt wird, dass jede Label-Menge korrekt vorhergesagt wird.

Parameter:

XNone oder array-like von Form (n_samples, n_features): Teststichproben. Die Übergabe von None als Teststichproben ergibt das gleiche Ergebnis wie die Übergabe von echten Teststichproben, da DummyClassifier unabhängig von den beobachteten Stichproben arbeitet.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs): Wahre Labels für X.
sample_weightarray-like der Form (n_samples,), Standardwert=None: Stichprobengewichte.

Gibt zurück:

scorefloat: Mittlere Genauigkeit von self.predict(X) in Bezug auf y.

set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → DummyClassifier[Quelle]#

Konfiguriert, ob Metadaten für die fit-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

True: Metadaten werden angefordert und, falls vorhanden, an fit übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.
False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an fit.
None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.
str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:

sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED: Metadaten-Routing für den Parameter sample_weight in fit.

Gibt zurück:

selfobject: Das aktualisierte Objekt.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:

**paramsdict: Schätzer-Parameter.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → DummyClassifier[Quelle]#

Konfiguriert, ob Metadaten für die score-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

True: Metadaten werden angefordert und, falls vorhanden, an score übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.
False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an score.
None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.
str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:

sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED: Metadaten-Routing für den Parameter sample_weight in score.

Gibt zurück: