DummyClassifier#
- class sklearn.dummy.DummyClassifier(*, strategy='prior', random_state=None, constant=None)[Quelle]#
DummyClassifier trifft Vorhersagen, die die Eingabemerkmale ignorieren.
Dieser Klassifikator dient als einfacher Basiswert zum Vergleich mit anderen, komplexeren Klassifikatoren.
Das spezifische Verhalten des Basiswerts wird mit dem Parameter
strategyausgewählt.Alle Strategien treffen Vorhersagen, die die Eingabemerkmalwerte ignorieren, die als
X-Argument anfitundpredictübergeben werden. Die Vorhersagen hängen jedoch typischerweise von den Werten ab, die imy-Parameter beobachtet wurden, der anfitübergeben wird.Beachten Sie, dass die Strategien „stratified“ und „uniform“ nicht-deterministische Vorhersagen liefern, die durch Setzen des Parameters
random_statedeterministisch gemacht werden können, falls erforderlich. Die anderen Strategien sind von Natur aus deterministisch und geben nach dem Anpassen immer die gleiche konstante Vorhersage für jeden Wert vonXzurück.Lesen Sie mehr im Benutzerhandbuch.
Hinzugefügt in Version 0.13.
- Parameter:
- strategy{„most_frequent“, „prior“, „stratified“, „uniform“, „constant“}, Standardwert=„prior“
Strategie zur Erzeugung von Vorhersagen.
„most_frequent“: Die Methode
predictgibt immer das häufigste Klassenlabel im beobachteteny-Argument zurück, das anfitübergeben wurde. Die Methodepredict_probagibt den entsprechenden One-Hot-kodierten Vektor zurück.„prior“: Die Methode
predictgibt immer das häufigste Klassenlabel im beobachteteny-Argument zurück, das anfitübergeben wurde (wie „most_frequent“).predict_probagibt immer die empirische Klassenverteilung vonyzurück, auch bekannt als die empirische Klassen-Prior-Verteilung.„stratified“: Die Methode
predict_probazieht zufällig One-Hot-Vektoren aus einer multivariaten Verteilung, die durch die empirischen Klassen-Prior-Wahrscheinlichkeiten parametrisiert ist. Die Methodepredictgibt das Klassenlabel zurück, das im One-Hot-Vektor vonpredict_probadie Wahrscheinlichkeit eins erhalten hat. Jede gezogene Zeile beider Methoden ist daher unabhängig und identisch verteilt.„uniform“: Erzeugt Vorhersagen gleichmäßig zufällig aus der Liste der eindeutigen Klassen, die in
ybeobachtet wurden, d.h. jede Klasse hat die gleiche Wahrscheinlichkeit.„constant“: Sagt immer ein vom Benutzer bereitgestelltes konstantes Label voraus. Dies ist nützlich für Metriken, die eine nicht-Mehrheitsklasse auswerten.
Geändert in Version 0.24: Der Standardwert von
strategywurde in Version 0.24 auf „prior“ geändert.
- random_stateint, RandomState-Instanz oder None, default=None
Steuert die Zufälligkeit zur Erzeugung von Vorhersagen, wenn
strategy='stratified'oderstrategy='uniform'ist. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.- constantint oder str oder array-like von Form (n_outputs,), Standardwert=None
Das explizite konstante Label, das von der Strategie „constant“ vorhergesagt wird. Dieser Parameter ist nur für die Strategie „constant“ nützlich.
- Attribute:
- classes_ndarray von Form (n_classes,) oder Liste solcher Arrays
Eindeutige Klassenlabels, die in
ybeobachtet wurden. Bei Multi-Output-Klassifizierungsproblemen ist dieses Attribut eine Liste von Arrays, da jeder Output einen unabhängigen Satz möglicher Klassen hat.- n_classes_int oder Liste von int
Anzahl der Labels für jeden Output.
- class_prior_ndarray von Form (n_classes,) oder Liste solcher Arrays
Häufigkeit jeder Klasse, die in
ybeobachtet wurde. Bei Multi-Output-Klassifizierungsproblemen wird dies unabhängig für jeden Output berechnet.- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.- n_outputs_int
Anzahl der Ausgaben.
- sparse_output_bool
True, wenn das von predict zurückgegebene Array im sparse CSC-Format vorliegen soll. Wird automatisch auf True gesetzt, wenn das Eingabe-
yim Sparse-Format übergeben wird.
Siehe auch
DummyRegressorRegressor, der Vorhersagen nach einfachen Regeln trifft.
Beispiele
>>> import numpy as np >>> from sklearn.dummy import DummyClassifier >>> X = np.array([-1, 1, 1, 1]) >>> y = np.array([0, 1, 1, 1]) >>> dummy_clf = DummyClassifier(strategy="most_frequent") >>> dummy_clf.fit(X, y) DummyClassifier(strategy='most_frequent') >>> dummy_clf.predict(X) array([1, 1, 1, 1]) >>> dummy_clf.score(X, y) 0.75
- fit(X, y, sample_weight=None)[Quelle]#
Passe den Basis-Klassifikator an.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs)
Zielwerte.
- sample_weightarray-like der Form (n_samples,), Standardwert=None
Stichprobengewichte.
- Gibt zurück:
- selfobject
Gibt die Instanz selbst zurück.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- predict(X)[Quelle]#
Führe Klassifizierung auf Testvektoren X durch.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Testdaten.
- Gibt zurück:
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs)
Vorhergesagte Zielwerte für X.
- predict_log_proba(X)[Quelle]#
Gib Log-Wahrscheinlichkeits-Schätzungen für die Testvektoren X zurück.
- Parameter:
- X{array-like, Objekt mit endlicher Länge oder Form}
Trainingsdaten.
- Gibt zurück:
- Pndarray von Form (n_samples, n_classes) oder Liste solcher Arrays
Gibt die Log-Wahrscheinlichkeit der Stichprobe für jede Klasse im Modell zurück, wobei die Klassen für jeden Output arithmetisch geordnet sind.
- predict_proba(X)[Quelle]#
Gibt Wahrscheinlichkeitsschätzungen für die Testvektoren X zurück.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Testdaten.
- Gibt zurück:
- Pndarray von Form (n_samples, n_classes) oder Liste solcher Arrays
Gibt die Wahrscheinlichkeit der Stichprobe für jede Klasse im Modell zurück, wobei die Klassen arithmetisch geordnet sind, für jeden Output.
- score(X, y, sample_weight=None)[Quelle]#
Gibt die durchschnittliche Genauigkeit auf den gegebenen Testdaten und Labels zurück.
Bei der Multi-Label-Klassifizierung ist dies die Subset-Genauigkeit, eine strenge Metrik, da für jede Stichprobe verlangt wird, dass jede Label-Menge korrekt vorhergesagt wird.
- Parameter:
- XNone oder array-like von Form (n_samples, n_features)
Teststichproben. Die Übergabe von None als Teststichproben ergibt das gleiche Ergebnis wie die Übergabe von echten Teststichproben, da DummyClassifier unabhängig von den beobachteten Stichproben arbeitet.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs)
Wahre Labels für X.
- sample_weightarray-like der Form (n_samples,), Standardwert=None
Stichprobengewichte.
- Gibt zurück:
- scorefloat
Mittlere Genauigkeit von self.predict(X) in Bezug auf y.
- set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyClassifier[Quelle]#
Konfiguriert, ob Metadaten für die
fit-Methode angefordert werden sollen.Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit
enable_metadata_routing=Trueaktiviert ist (siehesklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.Die Optionen für jeden Parameter sind
True: Metadaten werden angefordert und, falls vorhanden, anfitübergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht anfit.None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.
Der Standardwert (
sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.Hinzugefügt in Version 1.3.
- Parameter:
- sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED
Metadaten-Routing für den Parameter
sample_weightinfit.
- Gibt zurück:
- selfobject
Das aktualisierte Objekt.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') DummyClassifier[Quelle]#
Konfiguriert, ob Metadaten für die
score-Methode angefordert werden sollen.Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit
enable_metadata_routing=Trueaktiviert ist (siehesklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.Die Optionen für jeden Parameter sind
True: Metadaten werden angefordert und, falls vorhanden, anscoreübergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht anscore.None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.
Der Standardwert (
sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.Hinzugefügt in Version 1.3.
- Parameter:
- sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED
Metadaten-Routing für den Parameter
sample_weightinscore.
- Gibt zurück:
- selfobject
Das aktualisierte Objekt.
Galeriebeispiele#
Post-Hoc-Anpassung des Entscheidungsschwellenwerts für kostenempfindliches Lernen
Klassen-Likelihood-Verhältnisse zur Messung der Klassifikationsleistung