Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Wahrscheinlichkeitskalibrierung für 3-Klassen-Klassifizierung#

Dieses Beispiel veranschaulicht, wie die Sigmoid- Kalibrierung die vorhergesagten Wahrscheinlichkeiten für ein 3-Klassen-Klassifizierungsproblem verändert. Dargestellt ist das Standard-2-Simplex, bei dem die drei Ecken den drei Klassen entsprechen. Pfeile zeigen von den vom unkalibrierten Klassifikator vorhergesagten Wahrscheinlichkeitsvektoren zu den vom selben Klassifikator nach der Sigmoid-Kalibrierung auf einem zurückgehaltenen Validierungsdatensatz vorhergesagten Wahrscheinlichkeitsvektoren. Farben zeigen die wahre Klasse einer Instanz an (rot: Klasse 1, grün: Klasse 2, blau: Klasse 3).

Daten#

Im Folgenden generieren wir einen Klassifizierungsdatensatz mit 2000 Stichproben, 2 Merkmalen und 3 Zielklassen. Wir teilen die Daten dann wie folgt auf:

train: 600 Stichproben (zum Trainieren des Klassifikators)
valid: 400 Stichproben (zur Kalibrierung vorhergesagter Wahrscheinlichkeiten)
test: 1000 Stichproben

Beachten Sie, dass wir auch X_train_valid und y_train_valid erstellen, die sowohl die Trainings- als auch die Validierungsuntergruppen umfassen. Dies wird verwendet, wenn wir nur den Klassifikator trainieren, aber die vorhergesagten Wahrscheinlichkeiten nicht kalibrieren möchten.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

import numpy as np

from sklearn.datasets import make_blobs

np.random.seed(0)

X, y = make_blobs(
    n_samples=2000, n_features=2, centers=3, random_state=42, cluster_std=5.0
)
X_train, y_train = X[:600], y[:600]
X_valid, y_valid = X[600:1000], y[600:1000]
X_train_valid, y_train_valid = X[:1000], y[:1000]
X_test, y_test = X[1000:], y[1000:]

Anpassen und Kalibrierung#

Zuerst trainieren wir einen RandomForestClassifier mit 25 Basisschätzern (Bäumen) auf den verketteten Trainings- und Validierungsdaten (1000 Stichproben). Dies ist der unkalibrierte Klassifikator.

from sklearn.ensemble import RandomForestClassifier

clf = RandomForestClassifier(n_estimators=25)
clf.fit(X_train_valid, y_train_valid)

RandomForestClassifier(n_estimators=25)

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Um den kalibrierten Klassifikator zu trainieren, beginnen wir mit demselben RandomForestClassifier, trainieren ihn aber nur mit der Trainingsdatenuntergruppe (600 Stichproben) und kalibrieren ihn dann mit method='sigmoid' unter Verwendung der Validierungsdatenuntergruppe (400 Stichproben) in einem 2-stufigen Prozess.

from sklearn.calibration import CalibratedClassifierCV
from sklearn.frozen import FrozenEstimator

clf = RandomForestClassifier(n_estimators=25)
clf.fit(X_train, y_train)
cal_clf = CalibratedClassifierCV(FrozenEstimator(clf), method="sigmoid")
cal_clf.fit(X_valid, y_valid)

CalibratedClassifierCV(estimator=FrozenEstimator(estimator=RandomForestClassifier(n_estimators=25)))

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Wahrscheinlichkeiten vergleichen#

Im Folgenden plotten wir ein 2-Simplex mit Pfeilen, die die Änderung der vorhergesagten Wahrscheinlichkeiten der Teststichproben zeigen.

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 10))
colors = ["r", "g", "b"]

clf_probs = clf.predict_proba(X_test)
cal_clf_probs = cal_clf.predict_proba(X_test)
# Plot arrows
for i in range(clf_probs.shape[0]):
    plt.arrow(
        clf_probs[i, 0],
        clf_probs[i, 1],
        cal_clf_probs[i, 0] - clf_probs[i, 0],
        cal_clf_probs[i, 1] - clf_probs[i, 1],
        color=colors[y_test[i]],
        head_width=1e-2,
    )

# Plot perfect predictions, at each vertex
plt.plot([1.0], [0.0], "ro", ms=20, label="Class 1")
plt.plot([0.0], [1.0], "go", ms=20, label="Class 2")
plt.plot([0.0], [0.0], "bo", ms=20, label="Class 3")

# Plot boundaries of unit simplex
plt.plot([0.0, 1.0, 0.0, 0.0], [0.0, 0.0, 1.0, 0.0], "k", label="Simplex")

# Annotate points 6 points around the simplex, and mid point inside simplex
plt.annotate(
    r"($\frac{1}{3}$, $\frac{1}{3}$, $\frac{1}{3}$)",
    xy=(1.0 / 3, 1.0 / 3),
    xytext=(1.0 / 3, 0.23),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.plot([1.0 / 3], [1.0 / 3], "ko", ms=5)
plt.annotate(
    r"($\frac{1}{2}$, $0$, $\frac{1}{2}$)",
    xy=(0.5, 0.0),
    xytext=(0.5, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $\frac{1}{2}$, $\frac{1}{2}$)",
    xy=(0.0, 0.5),
    xytext=(0.1, 0.5),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($\frac{1}{2}$, $\frac{1}{2}$, $0$)",
    xy=(0.5, 0.5),
    xytext=(0.6, 0.6),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $0$, $1$)",
    xy=(0, 0),
    xytext=(0.1, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($1$, $0$, $0$)",
    xy=(1, 0),
    xytext=(1, 0.1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
plt.annotate(
    r"($0$, $1$, $0$)",
    xy=(0, 1),
    xytext=(0.1, 1),
    xycoords="data",
    arrowprops=dict(facecolor="black", shrink=0.05),
    horizontalalignment="center",
    verticalalignment="center",
)
# Add grid
plt.grid(False)
for x in [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]:
    plt.plot([0, x], [x, 0], "k", alpha=0.2)
    plt.plot([0, 0 + (1 - x) / 2], [x, x + (1 - x) / 2], "k", alpha=0.2)
    plt.plot([x, x + (1 - x) / 2], [0, 0 + (1 - x) / 2], "k", alpha=0.2)

plt.title("Change of predicted probabilities on test samples after sigmoid calibration")
plt.xlabel("Probability class 1")
plt.ylabel("Probability class 2")
plt.xlim(-0.05, 1.05)
plt.ylim(-0.05, 1.05)
_ = plt.legend(loc="best")

Change of predicted probabilities on test samples after sigmoid calibration

In der obigen Abbildung repräsentiert jeder Eckpunkt des Simplex eine perfekt vorhergesagte Klasse (z.B. 1, 0, 0). Der Mittelpunkt innerhalb des Simplex repräsentiert die Vorhersage der drei Klassen mit gleicher Wahrscheinlichkeit (d.h. 1/3, 1/3, 1/3). Jeder Pfeil beginnt bei den unkalibrierten Wahrscheinlichkeiten und endet mit der Pfeilspitze bei der kalibrierten Wahrscheinlichkeit. Die Farbe des Pfeils repräsentiert die wahre Klasse dieser Teststichprobe.

Der unkalibrierte Klassifikator ist übermäßig zuversichtlich in seinen Vorhersagen und verursacht einen hohen Log-Verlust. Der kalibrierte Klassifikator verursacht einen niedrigeren Log-Verlust aufgrund von zwei Faktoren. Erstens zeigen die Pfeile in der obigen Abbildung im Allgemeinen weg von den Rändern des Simplex, wo die Wahrscheinlichkeit einer Klasse 0 ist. Zweitens zeigt ein großer Teil der Pfeile in Richtung der wahren Klasse, z.B. grüne Pfeile (Stichproben, bei denen die wahre Klasse 'grün' ist) zeigen im Allgemeinen zum grünen Eckpunkt. Dies führt zu weniger übermäßig zuversichtlichen, 0 vorhergesagten Wahrscheinlichkeiten und gleichzeitig zu einer Erhöhung der vorhergesagten Wahrscheinlichkeiten der korrekten Klasse. Daher liefert der kalibrierte Klassifikator genauere vorhergesagte Wahrscheinlichkeiten, die einen niedrigeren Log-Verlust verursachen.

Wir können dies objektiv vergleichen, indem wir den Log-Verlust der unkalibrierten und kalibrierten Klassifikatoren auf den Vorhersagen der 1000 Teststichproben vergleichen. Beachten Sie, dass eine Alternative darin bestünde, die Anzahl der Basisschätzer (Bäume) des RandomForestClassifier zu erhöhen, was zu einer ähnlichen Verringerung des Log-Verlusts führen würde.

from sklearn.metrics import log_loss

loss = log_loss(y_test, clf_probs)
cal_loss = log_loss(y_test, cal_clf_probs)

print("Log-loss of:")
print(f" - uncalibrated classifier: {loss:.3f}")
print(f" - calibrated classifier: {cal_loss:.3f}")

Log-loss of:
 - uncalibrated classifier: 1.327
 - calibrated classifier: 0.549

Wir können die Kalibrierung auch mit dem Brier-Score für probabilistische Vorhersagen bewerten (niedriger ist besser, möglicher Bereich ist [0, 2])

from sklearn.metrics import brier_score_loss

loss = brier_score_loss(y_test, clf_probs)
cal_loss = brier_score_loss(y_test, cal_clf_probs)

print("Brier score of")
print(f" - uncalibrated classifier: {loss:.3f}")
print(f" - calibrated classifier: {cal_loss:.3f}")

Brier score of
 - uncalibrated classifier: 0.308
 - calibrated classifier: 0.310

Laut Brier-Score ist der kalibrierte Klassifikator nicht besser als das ursprüngliche Modell.

Schließlich generieren wir ein Gitter möglicher unkalibrierter Wahrscheinlichkeiten über dem 2-Simplex, berechnen die entsprechenden kalibrierten Wahrscheinlichkeiten und plotten für jede Pfeile. Die Pfeile sind entsprechend der höchsten unkalibrierten Wahrscheinlichkeit gefärbt. Dies veranschaulicht die erlernte Kalibrierungskarte.

plt.figure(figsize=(10, 10))
# Generate grid of probability values
p1d = np.linspace(0, 1, 20)
p0, p1 = np.meshgrid(p1d, p1d)
p2 = 1 - p0 - p1
p = np.c_[p0.ravel(), p1.ravel(), p2.ravel()]
p = p[p[:, 2] >= 0]

# Use the three class-wise calibrators to compute calibrated probabilities
calibrated_classifier = cal_clf.calibrated_classifiers_[0]
prediction = np.vstack(
    [
        calibrator.predict(this_p)
        for calibrator, this_p in zip(calibrated_classifier.calibrators, p.T)
    ]
).T

# Re-normalize the calibrated predictions to make sure they stay inside the
# simplex. This same renormalization step is performed internally by the
# predict method of CalibratedClassifierCV on multiclass problems.
prediction /= prediction.sum(axis=1)[:, None]

# Plot changes in predicted probabilities induced by the calibrators
for i in range(prediction.shape[0]):
    plt.arrow(
        p[i, 0],
        p[i, 1],
        prediction[i, 0] - p[i, 0],
        prediction[i, 1] - p[i, 1],
        head_width=1e-2,
        color=colors[np.argmax(p[i])],
    )

# Plot the boundaries of the unit simplex
plt.plot([0.0, 1.0, 0.0, 0.0], [0.0, 0.0, 1.0, 0.0], "k", label="Simplex")

plt.grid(False)
for x in [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]:
    plt.plot([0, x], [x, 0], "k", alpha=0.2)
    plt.plot([0, 0 + (1 - x) / 2], [x, x + (1 - x) / 2], "k", alpha=0.2)
    plt.plot([x, x + (1 - x) / 2], [0, 0 + (1 - x) / 2], "k", alpha=0.2)

plt.title("Learned sigmoid calibration map")
plt.xlabel("Probability class 1")
plt.ylabel("Probability class 2")
plt.xlim(-0.05, 1.05)
plt.ylim(-0.05, 1.05)

plt.show()

Man kann beobachten, dass der Kalibrator im Durchschnitt hoch zuversichtliche Vorhersagen von den Grenzen des Simplex weg schiebt, während er gleichzeitig unsichere Vorhersagen in einen von drei Modi bewegt, einen für jede Klasse. Wir können auch beobachten, dass die Abbildung nicht symmetrisch ist. Darüber hinaus scheinen einige Pfeile Klassenzuweisungsgrenzen zu überschreiten, was nicht unbedingt das ist, was man von einer Kalibrierungskarte erwarten würde, da dies bedeutet, dass sich einige vorhergesagte Klassen nach der Kalibrierung ändern werden.

Alles in allem sollte die One-vs-Rest-Mehrklassen-Kalibrierungsstrategie, die in CalibratedClassifierCV implementiert ist, nicht blind vertraut werden.

Gesamtlaufzeit des Skripts: (0 Minuten 1,214 Sekunden)

Verwandte Beispiele

Wahrscheinlichkeitskalibrierung von Klassifikatoren

Vergleich der Kalibrierung von Klassifikatoren

Wahrscheinlichkeitskalibrierungskurven

Beispiele für die Verwendung von FrozenEstimator

Galerie generiert von Sphinx-Gallery

	n_estimators n_estimators: int, default=100 Die Anzahl der Bäume im Wald. .. versionchanged:: 0.22 Der Standardwert von ``n_estimators`` hat sich von 10 auf 100 in 0.22 geändert.	25
	criterion criterion: {"gini", "entropy", "log_loss"}, default="gini" Die Funktion zur Messung der Qualität eines Splits. Unterstützte Kriterien sind "gini" für die Gini-Unreinheit und "log_loss" und "entropy" sowohl für die Shannon-Informationsgewinnung, siehe :ref:`tree_mathematical_formulation`. Hinweis: Dieser Parameter ist baumspezifisch.	'gini'
	max_depth max_depth: int, default=None Die maximale Tiefe des Baumes. Wenn None, werden Knoten erweitert, bis alle Blätter rein sind oder bis alle Blätter weniger als min_samples_split Stichproben enthalten.	None
	min_samples_split min_samples_split: int oder float, default=2 Die Mindestanzahl von Stichproben, die für einen internen Knoten zum Aufteilen erforderlich sind: - Wenn int, dann betrachten Sie `min_samples_split` als die Mindestanzahl. - Wenn float, dann ist `min_samples_split` ein Bruchteil und `ceil(min_samples_split * n_samples)` sind die Mindestanzahl von Stichproben für jeden Split. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	2
	min_samples_leaf min_samples_leaf: int oder float, default=1 Die Mindestanzahl von Stichproben, die an einem Blattknoten erforderlich sind. Ein Aufteilungspunkt in beliebiger Tiefe wird nur dann berücksichtigt, wenn er mindestens ``min_samples_leaf`` Trainingsstichproben in jedem der linken und rechten Zweige hinterlässt. Dies kann den Effekt haben, das Modell zu glätten, insbesondere bei der Regression. - Wenn int, dann betrachten Sie `min_samples_leaf` als die Mindestanzahl. - Wenn float, dann ist `min_samples_leaf` ein Bruchteil und `ceil(min_samples_leaf * n_samples)` sind die Mindestanzahl von Stichproben für jeden Knoten. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, Standard=0.0 Der minimale gewichtete Bruchteil der Gesamtsumme der Gewichte (aller Eingangsstichproben), der in einem Blattknoten erforderlich ist. Stichproben haben gleiches Gewicht, wenn sample_weight nicht angegeben ist.	0.0
	max_features max_features: {"sqrt", "log2", None}, int oder float, default="sqrt" Die Anzahl der Merkmale, die bei der Suche nach dem besten Split berücksichtigt werden: - Wenn int, dann betrachten Sie `max_features` Merkmale bei jedem Split. - Wenn float, dann ist `max_features` ein Bruchteil und `max(1, int(max_features * n_features_in_))` Merkmale werden bei jedem Split berücksichtigt. - Wenn "sqrt", dann `max_features=sqrt(n_features)`. - Wenn "log2", dann `max_features=log2(n_features)`. - Wenn None, dann `max_features=n_features`. .. versionchanged:: 1.1 Der Standardwert von `max_features` hat sich von `"auto"` zu `"sqrt"` geändert. Hinweis: Die Suche nach einem Split stoppt nicht, bis mindestens eine gültige Partition der Knoten-Stichproben gefunden wurde, selbst wenn dies erforderlich ist, mehr als ``max_features`` Merkmale zu inspizieren.	'sqrt'
	max_leaf_nodes max_leaf_nodes: int, Standard=None Wächst Bäume mit ``max_leaf_nodes`` im Best-First-Verfahren. Beste Knoten werden als relative Reduktion der Unreinheit definiert. Wenn None, dann unbegrenzte Anzahl von Blattknoten.	None
	min_impurity_decrease min_impurity_decrease: float, Standard=0.0 Ein Knoten wird geteilt, wenn diese Teilung eine Verringerung der Unreinheit von größer oder gleich diesem Wert bewirkt. Die Gleichung für die gewichtete Verringerung der Unreinheit lautet: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) wobei ``N`` die Gesamtzahl der Stichproben, ``N_t`` die Anzahl der Stichproben am aktuellen Knoten, ``N_t_L`` die Anzahl der Stichproben im linken Kind und ``N_t_R`` die Anzahl der Stichproben im rechten Kind ist. ``N``, ``N_t``, ``N_t_R`` und ``N_t_L`` beziehen sich alle auf die gewichtete Summe, wenn ``sample_weight`` übergeben wird. .. versionadded:: 0.19	0.0
	bootstrap bootstrap: bool, default=True Ob Bootstrap-Stichproben beim Aufbau von Bäumen verwendet werden. Wenn False, wird der gesamte Datensatz zum Aufbau jedes Baumes verwendet.	True
	oob_score oob_score: bool oder aufrufbar, default=False Ob Out-of-Bag-Stichproben zur Schätzung des Generalisierungs-Scores verwendet werden. Standardmäßig wird :func:`~sklearn.metrics.accuracy_score` verwendet. Stellen Sie eine aufrufbare Funktion mit der Signatur `metric(y_true, y_pred)` bereit, um eine benutzerdefinierte Metrik zu verwenden. Nur verfügbar, wenn `bootstrap=True`. Zur Veranschaulichung der Out-of-Bag (OOB)-Fehlerschätzung siehe das Beispiel :ref:`sphx_glr_auto_examples_ensemble_plot_ensemble_oob.py`.	False
	n_jobs n_jobs: int, default=None Die Anzahl der parallel auszuführenden Jobs. :meth:`fit`, :meth:`predict`, :meth:`decision_path` und :meth:`apply` werden alle parallel über die Bäume ausgeführt. ``None`` bedeutet 1, es sei denn, Sie befinden sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet die Verwendung aller Prozessoren. Siehe :term:`Glossary ` für weitere Details.	None
	random_state random_state: int, RandomState-Instanz oder None, default=None Steuert sowohl die Zufälligkeit des Bootstrapping der Stichproben, die beim Aufbau von Bäumen verwendet werden (wenn ``bootstrap=True``), als auch die Stichprobenziehung der Merkmale, die bei der Suche nach dem besten Split in jedem Knoten berücksichtigt werden (wenn ``max_features < n_features``). Siehe :term:`Glossary ` für Details.	None
	verbose verbose: int, Standard=0 Steuert die Ausführlichkeit beim Anpassen und Vorhersagen.	0
	warm_start warm_start: bool, Standard=False Wenn auf ``True`` gesetzt, wird die Lösung des vorherigen Aufrufs von fit wiederverwendet und weitere Estimators zum Ensemble hinzugefügt, andernfalls wird nur ein ganz neuer Wald angepasst. Siehe :term:`Glossary ` und :ref:`tree_ensemble_warm_start` für Details.	False
	class_weight class_weight: {"balanced", "balanced_subsample"}, dict oder Liste von dicts, default=None Gewichte, die den Klassen in Form von ``{class_label: weight}`` zugeordnet sind. Wenn nicht angegeben, wird davon ausgegangen, dass alle Klassen das Gewicht eins haben. Für Multi-Output-Probleme kann eine Liste von Dictionaries in der gleichen Reihenfolge wie die Spalten von y bereitgestellt werden. Beachten Sie, dass für Multi-Output (einschließlich Multilabel) die Gewichte für jede Klasse jeder Spalte in ihrem eigenen Dictionary definiert werden müssen. Zum Beispiel sollten für eine Vier-Klassen-Multilabel-Klassifizierung die Gewichte [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] anstelle von [{1:1}, {2:5}, {3:1}, {4:1}] sein. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch anzupassen, die umgekehrt proportional zu den Klassen-Häufigkeiten in den Eingabedaten sind, als ``n_samples / (n_classes * np.bincount(y))`` Der Modus "balanced_subsample" ist derselbe wie "balanced", mit der Ausnahme, dass die Gewichte basierend auf der Bootstrap-Stichprobe für jeden erzeugten Baum berechnet werden. Für Multi-Output werden die Gewichte jeder Spalte von y multipliziert. Beachten Sie, dass diese Gewichte mit sample_weight (das über die fit-Methode übergeben wird) multipliziert werden, wenn sample_weight angegeben ist.	None
	ccp_alpha ccp_alpha: nicht-negative Gleitkommazahl, default=0.0 Komplexitätsparameter für Minimal Cost-Complexity Pruning. Der Teilbaum mit der größten Kostenkomplexität, die kleiner ist als ``ccp_alpha``, wird ausgewählt. Standardmäßig erfolgt kein Pruning. Siehe :ref:`minimal_cost_complexity_pruning` für Details. Siehe :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` für ein Beispiel für ein solches Pruning. .. versionadded:: 0.22	0.0
	max_samples max_samples: int oder float, default=None Wenn bootstrap True ist, die Anzahl der Stichproben, die aus X gezogen werden, um jeden Basisschätzer zu trainieren. - Wenn None (Standard), dann werden `X.shape[0]` Stichproben gezogen. - Wenn int, dann werden `max_samples` Stichproben gezogen. - Wenn float, dann werden `max(round(n_samples * max_samples), 1)` Stichproben gezogen. Daher sollte `max_samples` im Intervall `(0.0, 1.0]` liegen. .. versionadded:: 0.22	None
	monotonic_cst monotonic_cst: Array-ähnlich von int der Form (n_features), default=None Gibt die Monotonie-Beschränkung an, die für jedes Merkmal durchgesetzt werden soll. - 1: monoton steigend - 0: keine Beschränkung - -1: monoton fallend Wenn monotonic_cst None ist, werden keine Beschränkungen angewendet. Monotonie-Beschränkungen werden nicht unterstützt für: - Multiklassen-Klassifizierungen (d.h. wenn `n_classes > 2`), - Multi-Output-Klassifizierungen (d.h. wenn `n_outputs_ > 1`), - Klassifizierungen, die auf Daten mit fehlenden Werten trainiert wurden. Die Beschränkungen gelten für die Wahrscheinlichkeit der positiven Klasse. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 1.4	None

	estimator estimator: estimator-Instanz, default=None Der Klassifikator, dessen Ausgabe kalibriert werden muss, um genauere `predict_proba`-Ausgaben zu liefern. Der Standard-Klassifikator ist ein :class:`~sklearn.svm.LinearSVC`. .. versionadded:: 1.2	FrozenEstimat...stimators=25))
	method method: {'sigmoid', 'isotonic', 'temperature'}, default='sigmoid' Die zu verwendende Kalibrierungsmethode. Kann sein: - 'sigmoid', was Platts Methode entspricht (d.h. ein binäres logistisches Regressionsmodell). - 'isotonic', ein nicht-parametrischer Ansatz. - 'temperature', Temperatur-Skalierung. Sigmoid- und isotonische Kalibrierungsmethoden unterstützen nativ nur binäre Klassifikatoren und erweitern sich auf Mehrklassen-Klassifizierung mit einer One-vs-Rest (OvR)- Strategie mit nachträglicher Renormierung, d.h. Anpassung der Wahrscheinlichkeiten nach der Kalibrierung, um sicherzustellen, dass sie sich zu 1 aufsummieren. Im Gegensatz dazu unterstützt die Temperatur-Skalierung naturgemäß die Mehrklassen-Kalibrierung durch Anwendung von `softmax(classifier_logits/T)` mit einem Temperaturwert `T`, der den Log-Verlust optimiert. Bei sehr unkalibrierten Klassifikatoren auf stark unausgewogenen Datensätzen kann die Sigmoid-Kalibrierung bevorzugt werden, da sie einen zusätzlichen Achsenabschnittsparameter anpasst. Dies hilft, Entscheidungsgrenzen entsprechend zu verschieben, wenn der zu kalibrierende Klassifikator zum Mehrheitsklasse tendiert. Die isotonische Kalibrierung wird nicht empfohlen, wenn die Anzahl der Kalibrierungsstichproben zu gering ist ``(≪1000)``, da sie dann zu Überanpassung neigt. .. versionchanged:: 1.8 Option 'temperature' hinzugefügt.	'sigmoid'
	cv cv: int, Kreuzvalidierungsgenerator oder iterierbar, default=None Bestimmt die Kreuzvalidierungs-Splitting-Strategie. Mögliche Eingaben für cv sind: - None, um die Standard-5-fache Kreuzvalidierung zu verwenden, - Ganzzahl, um die Anzahl der Folds anzugeben. - :term:`CV-Splitter`, - Ein iterierbarer Ausdruck, der (train, test) Splits als Indizes liefert. Bei Ganzzahl-/None-Eingaben wird, wenn ``y`` binär oder multiklassig ist, :class:`~sklearn.model_selection.StratifiedKFold` verwendet. Wenn ``y`` weder binär noch multiklassig ist, wird :class:`~sklearn.model_selection.KFold` verwendet. Siehe das :ref:`Benutzerhandbuch ` für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können. .. versionchanged:: 0.22 Der Standardwert von ``cv``, wenn None, hat sich von 3-fach auf 5-fach geändert.	None
	n_jobs n_jobs: int, default=None Anzahl der parallel auszuführenden Jobs. ``None`` bedeutet 1, es sei denn, Sie befinden sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet die Verwendung aller Prozessoren. Basis-Estimator-Klone werden parallel über Kreuzvalidierungs-Iterationen angepasst. Siehe :term:`Glossary ` für weitere Details. .. versionadded:: 0.24	None
	ensemble ensemble: bool oder "auto", default="auto" Bestimmt, wie der Kalibrator angepasst wird. "auto" verwendet `False`, wenn der `estimator` ein :class:`~sklearn.frozen.FrozenEstimator` ist, und `True` andernfalls. Wenn `True`, wird der `estimator` mit Trainingsdaten angepasst und mit Testdaten kalibriert für jeden `cv`-Fold. Der endgültige Estimator ist ein Ensemble aus `n_cv` angepassten Klassifikator- und Kalibrator-Paaren, wobei `n_cv` die Anzahl der Kreuzvalidierungs-Folds ist. Die Ausgabe sind die durchschnittlichen vorhergesagten Wahrscheinlichkeiten aller Paare. Wenn `False`, wird `cv` verwendet, um unverzerrte Vorhersagen zu berechnen, über :func:`~sklearn.model_selection.cross_val_predict`, die dann zur Kalibrierung verwendet werden. Zum Zeitpunkt der Vorhersage ist der verwendete Klassifikator der `estimator`, der auf allen Daten trainiert wurde. Beachten Sie, dass diese Methode auch intern in :mod:`sklearn.svm` Estimators mit dem Parameter `probabilities=True` implementiert ist. .. versionadded:: 0.24 .. versionchanged:: 1.6 Option `"auto"` hinzugefügt und ist Standard.	'auto'

	n_estimators n_estimators: int, default=100 Die Anzahl der Bäume im Wald. .. versionchanged:: 0.22 Der Standardwert von ``n_estimators`` hat sich von 10 auf 100 in 0.22 geändert.	25
	criterion criterion: {"gini", "entropy", "log_loss"}, default="gini" Die Funktion zur Messung der Qualität eines Splits. Unterstützte Kriterien sind "gini" für die Gini-Unreinheit und "log_loss" und "entropy" sowohl für die Shannon-Informationsgewinnung, siehe :ref:`tree_mathematical_formulation`. Hinweis: Dieser Parameter ist baumspezifisch.	'gini'
	max_depth max_depth: int, default=None Die maximale Tiefe des Baumes. Wenn None, werden Knoten erweitert, bis alle Blätter rein sind oder bis alle Blätter weniger als min_samples_split Stichproben enthalten.	None
	min_samples_split min_samples_split: int oder float, default=2 Die Mindestanzahl von Stichproben, die für einen internen Knoten zum Aufteilen erforderlich sind: - Wenn int, dann betrachten Sie `min_samples_split` als die Mindestanzahl. - Wenn float, dann ist `min_samples_split` ein Bruchteil und `ceil(min_samples_split * n_samples)` sind die Mindestanzahl von Stichproben für jeden Split. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	2
	min_samples_leaf min_samples_leaf: int oder float, default=1 Die Mindestanzahl von Stichproben, die an einem Blattknoten erforderlich sind. Ein Aufteilungspunkt in beliebiger Tiefe wird nur dann berücksichtigt, wenn er mindestens ``min_samples_leaf`` Trainingsstichproben in jedem der linken und rechten Zweige hinterlässt. Dies kann den Effekt haben, das Modell zu glätten, insbesondere bei der Regression. - Wenn int, dann betrachten Sie `min_samples_leaf` als die Mindestanzahl. - Wenn float, dann ist `min_samples_leaf` ein Bruchteil und `ceil(min_samples_leaf * n_samples)` sind die Mindestanzahl von Stichproben für jeden Knoten. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, Standard=0.0 Der minimale gewichtete Bruchteil der Gesamtsumme der Gewichte (aller Eingangsstichproben), der in einem Blattknoten erforderlich ist. Stichproben haben gleiches Gewicht, wenn sample_weight nicht angegeben ist.	0.0
	max_features max_features: {"sqrt", "log2", None}, int oder float, default="sqrt" Die Anzahl der Merkmale, die bei der Suche nach dem besten Split berücksichtigt werden: - Wenn int, dann betrachten Sie `max_features` Merkmale bei jedem Split. - Wenn float, dann ist `max_features` ein Bruchteil und `max(1, int(max_features * n_features_in_))` Merkmale werden bei jedem Split berücksichtigt. - Wenn "sqrt", dann `max_features=sqrt(n_features)`. - Wenn "log2", dann `max_features=log2(n_features)`. - Wenn None, dann `max_features=n_features`. .. versionchanged:: 1.1 Der Standardwert von `max_features` hat sich von `"auto"` zu `"sqrt"` geändert. Hinweis: Die Suche nach einem Split stoppt nicht, bis mindestens eine gültige Partition der Knoten-Stichproben gefunden wurde, selbst wenn dies erforderlich ist, mehr als ``max_features`` Merkmale zu inspizieren.	'sqrt'
	max_leaf_nodes max_leaf_nodes: int, Standard=None Wächst Bäume mit ``max_leaf_nodes`` im Best-First-Verfahren. Beste Knoten werden als relative Reduktion der Unreinheit definiert. Wenn None, dann unbegrenzte Anzahl von Blattknoten.	None
	min_impurity_decrease min_impurity_decrease: float, Standard=0.0 Ein Knoten wird geteilt, wenn diese Teilung eine Verringerung der Unreinheit von größer oder gleich diesem Wert bewirkt. Die Gleichung für die gewichtete Verringerung der Unreinheit lautet: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) wobei ``N`` die Gesamtzahl der Stichproben, ``N_t`` die Anzahl der Stichproben am aktuellen Knoten, ``N_t_L`` die Anzahl der Stichproben im linken Kind und ``N_t_R`` die Anzahl der Stichproben im rechten Kind ist. ``N``, ``N_t``, ``N_t_R`` und ``N_t_L`` beziehen sich alle auf die gewichtete Summe, wenn ``sample_weight`` übergeben wird. .. versionadded:: 0.19	0.0
	bootstrap bootstrap: bool, default=True Ob Bootstrap-Stichproben beim Aufbau von Bäumen verwendet werden. Wenn False, wird der gesamte Datensatz zum Aufbau jedes Baumes verwendet.	True
	oob_score oob_score: bool oder aufrufbar, default=False Ob Out-of-Bag-Stichproben zur Schätzung des Generalisierungs-Scores verwendet werden. Standardmäßig wird :func:`~sklearn.metrics.accuracy_score` verwendet. Stellen Sie eine aufrufbare Funktion mit der Signatur `metric(y_true, y_pred)` bereit, um eine benutzerdefinierte Metrik zu verwenden. Nur verfügbar, wenn `bootstrap=True`. Zur Veranschaulichung der Out-of-Bag (OOB)-Fehlerschätzung siehe das Beispiel :ref:`sphx_glr_auto_examples_ensemble_plot_ensemble_oob.py`.	False
	n_jobs n_jobs: int, default=None Die Anzahl der parallel auszuführenden Jobs. :meth:`fit`, :meth:`predict`, :meth:`decision_path` und :meth:`apply` werden alle parallel über die Bäume ausgeführt. ``None`` bedeutet 1, es sei denn, Sie befinden sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet die Verwendung aller Prozessoren. Siehe :term:`Glossary ` für weitere Details.	None
	random_state random_state: int, RandomState-Instanz oder None, default=None Steuert sowohl die Zufälligkeit des Bootstrapping der Stichproben, die beim Aufbau von Bäumen verwendet werden (wenn ``bootstrap=True``), als auch die Stichprobenziehung der Merkmale, die bei der Suche nach dem besten Split in jedem Knoten berücksichtigt werden (wenn ``max_features < n_features``). Siehe :term:`Glossary ` für Details.	None
	verbose verbose: int, Standard=0 Steuert die Ausführlichkeit beim Anpassen und Vorhersagen.	0
	warm_start warm_start: bool, Standard=False Wenn auf ``True`` gesetzt, wird die Lösung des vorherigen Aufrufs von fit wiederverwendet und weitere Estimators zum Ensemble hinzugefügt, andernfalls wird nur ein ganz neuer Wald angepasst. Siehe :term:`Glossary ` und :ref:`tree_ensemble_warm_start` für Details.	False
	class_weight class_weight: {"balanced", "balanced_subsample"}, dict oder Liste von dicts, default=None Gewichte, die den Klassen in Form von ``{class_label: weight}`` zugeordnet sind. Wenn nicht angegeben, wird davon ausgegangen, dass alle Klassen das Gewicht eins haben. Für Multi-Output-Probleme kann eine Liste von Dictionaries in der gleichen Reihenfolge wie die Spalten von y bereitgestellt werden. Beachten Sie, dass für Multi-Output (einschließlich Multilabel) die Gewichte für jede Klasse jeder Spalte in ihrem eigenen Dictionary definiert werden müssen. Zum Beispiel sollten für eine Vier-Klassen-Multilabel-Klassifizierung die Gewichte [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] anstelle von [{1:1}, {2:5}, {3:1}, {4:1}] sein. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch anzupassen, die umgekehrt proportional zu den Klassen-Häufigkeiten in den Eingabedaten sind, als ``n_samples / (n_classes * np.bincount(y))`` Der Modus "balanced_subsample" ist derselbe wie "balanced", mit der Ausnahme, dass die Gewichte basierend auf der Bootstrap-Stichprobe für jeden erzeugten Baum berechnet werden. Für Multi-Output werden die Gewichte jeder Spalte von y multipliziert. Beachten Sie, dass diese Gewichte mit sample_weight (das über die fit-Methode übergeben wird) multipliziert werden, wenn sample_weight angegeben ist.	None
	ccp_alpha ccp_alpha: nicht-negative Gleitkommazahl, default=0.0 Komplexitätsparameter für Minimal Cost-Complexity Pruning. Der Teilbaum mit der größten Kostenkomplexität, die kleiner ist als ``ccp_alpha``, wird ausgewählt. Standardmäßig erfolgt kein Pruning. Siehe :ref:`minimal_cost_complexity_pruning` für Details. Siehe :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` für ein Beispiel für ein solches Pruning. .. versionadded:: 0.22	0.0
	max_samples max_samples: int oder float, default=None Wenn bootstrap True ist, die Anzahl der Stichproben, die aus X gezogen werden, um jeden Basisschätzer zu trainieren. - Wenn None (Standard), dann werden `X.shape[0]` Stichproben gezogen. - Wenn int, dann werden `max_samples` Stichproben gezogen. - Wenn float, dann werden `max(round(n_samples * max_samples), 1)` Stichproben gezogen. Daher sollte `max_samples` im Intervall `(0.0, 1.0]` liegen. .. versionadded:: 0.22	None
	monotonic_cst monotonic_cst: Array-ähnlich von int der Form (n_features), default=None Gibt die Monotonie-Beschränkung an, die für jedes Merkmal durchgesetzt werden soll. - 1: monoton steigend - 0: keine Beschränkung - -1: monoton fallend Wenn monotonic_cst None ist, werden keine Beschränkungen angewendet. Monotonie-Beschränkungen werden nicht unterstützt für: - Multiklassen-Klassifizierungen (d.h. wenn `n_classes > 2`), - Multi-Output-Klassifizierungen (d.h. wenn `n_outputs_ > 1`), - Klassifizierungen, die auf Daten mit fehlenden Werten trainiert wurden. Die Beschränkungen gelten für die Wahrscheinlichkeit der positiven Klasse. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 1.4	None

Wahrscheinlichkeitskalibrierung für 3-Klassen-Klassifizierung#

Daten#

Anpassen und Kalibrierung#

Wahrscheinlichkeiten vergleichen#

Diese Seite