Hinweis

Gehen Sie zum Ende, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Monotone Einschränkungen#

Dieses Beispiel veranschaulicht die Auswirkung von monotonen Einschränkungen auf einen Gradient Boosting-Schätzer.

Wir erstellen einen künstlichen Datensatz, bei dem der Zielwert im Allgemeinen positiv mit dem ersten Merkmal korreliert ist (mit einigen zufälligen und nicht zufälligen Variationen) und im Allgemeinen negativ mit dem zweiten Merkmal korreliert.

Durch das Erzwingen einer monotonen Zunahme oder Abnahme des Merkmals während des Lernprozesses ist der Schätzer in der Lage, dem allgemeinen Trend richtig zu folgen, anstatt den Variationen ausgesetzt zu sein.

Dieses Beispiel wurde von der XGBoost-Dokumentation inspiriert.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

import matplotlib.pyplot as plt
import numpy as np

from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.inspection import PartialDependenceDisplay

rng = np.random.RandomState(0)

n_samples = 1000
f_0 = rng.rand(n_samples)
f_1 = rng.rand(n_samples)
X = np.c_[f_0, f_1]
noise = rng.normal(loc=0.0, scale=0.01, size=n_samples)

# y is positively correlated with f_0, and negatively correlated with f_1
y = 5 * f_0 + np.sin(10 * np.pi * f_0) - 5 * f_1 - np.cos(10 * np.pi * f_1) + noise

Passen Sie ein erstes Modell an diesen Datensatz ohne Einschränkungen an.

gbdt_no_cst = HistGradientBoostingRegressor()
gbdt_no_cst.fit(X, y)

HistGradientBoostingRegressor()

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Passen Sie ein zweites Modell an diesen Datensatz mit monotoner Zunahme (1) und monotoner Abnahme (-1) Einschränkungen an.

gbdt_with_monotonic_cst = HistGradientBoostingRegressor(monotonic_cst=[1, -1])
gbdt_with_monotonic_cst.fit(X, y)

HistGradientBoostingRegressor(monotonic_cst=[1, -1])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Lassen Sie uns die partielle Abhängigkeit der Vorhersagen von den beiden Merkmalen anzeigen.

fig, ax = plt.subplots()
disp = PartialDependenceDisplay.from_estimator(
    gbdt_no_cst,
    X,
    features=[0, 1],
    feature_names=(
        "First feature",
        "Second feature",
    ),
    line_kw={"linewidth": 4, "label": "unconstrained", "color": "tab:blue"},
    ax=ax,
)
PartialDependenceDisplay.from_estimator(
    gbdt_with_monotonic_cst,
    X,
    features=[0, 1],
    line_kw={"linewidth": 4, "label": "constrained", "color": "tab:orange"},
    ax=disp.axes_,
)

for f_idx in (0, 1):
    disp.axes_[0, f_idx].plot(
        X[:, f_idx], y, "o", alpha=0.3, zorder=-1, color="tab:green"
    )
    disp.axes_[0, f_idx].set_ylim(-6, 6)

plt.legend()
fig.suptitle("Monotonic constraints effect on partial dependences")
plt.show()

Monotonic constraints effect on partial dependences

Wir können sehen, dass die Vorhersagen des nicht eingeschränkten Modells die Oszillationen der Daten erfassen, während das eingeschränkte Modell dem allgemeinen Trend folgt und die lokalen Variationen ignoriert.

Verwendung von Merkmalsnamen zur Angabe von monotonen Einschränkungen#

Beachten Sie, dass, wenn die Trainingsdaten Merkmalsnamen haben, es möglich ist, die monotonen Einschränkungen durch Übergabe eines Wörterbuchs anzugeben.

import pandas as pd

X_df = pd.DataFrame(X, columns=["f_0", "f_1"])

gbdt_with_monotonic_cst_df = HistGradientBoostingRegressor(
    monotonic_cst={"f_0": 1, "f_1": -1}
).fit(X_df, y)

np.allclose(
    gbdt_with_monotonic_cst_df.predict(X_df), gbdt_with_monotonic_cst.predict(X)
)

True

Gesamtlaufzeit des Skripts: (0 Minuten 0,529 Sekunden)

Verwandte Beispiele

Release Highlights für scikit-learn 0.23

Release Highlights für scikit-learn 1.4

Merkmale in Histogram Gradient Boosting Bäumen

Fortgeschrittene Plotting mit Partial Dependence

Galerie generiert von Sphinx-Gallery

	loss loss: {'squared_error', 'absolute_error', 'gamma', 'poisson', 'quantile'}, default='squared_error' Die Verlustfunktion, die im Boosting-Prozess verwendet wird. Beachten Sie, dass die "squared error", "gamma" und "poisson" Verluste tatsächlich "half least squares loss", "half gamma deviance" und "half poisson deviance" implementieren, um die Berechnung des Gradienten zu vereinfachen. Darüber hinaus verwenden die Verluste "gamma" und "poisson" intern einen Log-Link, "gamma" erfordert ``y > 0`` und "poisson" erfordert ``y >= 0``. "quantile" verwendet den Pinball-Verlust. .. versionchanged:: 0.23 Option 'poisson' hinzugefügt. .. versionchanged:: 1.1 Option 'quantile' hinzugefügt. .. versionchanged:: 1.3 Option 'gamma' hinzugefügt.	'squared_error'
	quantile quantile: float, default=None Wenn loss "quantile" ist, gibt dieser Parameter an, welches Quantil geschätzt werden soll, und muss zwischen 0 und 1 liegen.	None
	learning_rate learning_rate: float, default=0.1 Die Lernrate, auch bekannt als Shrinkage. Sie wird als multiplikativer Faktor für die Blattwerte verwendet. Verwenden Sie ``1`` für keine Schrumpfung.	0.1
	max_iter max_iter: int, default=100 Die maximale Anzahl von Iterationen des Boosting-Prozesses, d.h. die maximale Anzahl von Bäumen.	100
	max_leaf_nodes max_leaf_nodes: int oder None, default=31 Die maximale Anzahl von Blättern pro Baum. Muss strikt größer als 1 sein. Wenn None, gibt es keine maximale Grenze.	31
	max_depth max_depth: int oder None, default=None Die maximale Tiefe jedes Baumes. Die Tiefe eines Baumes ist die Anzahl der Kanten, die vom Wurzelknoten zum tiefsten Blatt führen. Die Tiefe ist standardmäßig nicht begrenzt.	None
	min_samples_leaf min_samples_leaf: int, default=20 Die Mindestanzahl von Samples pro Blatt. Bei kleinen Datensätzen mit weniger als einigen hundert Samples wird empfohlen, diesen Wert zu senken, da nur sehr flache Bäume gebaut würden.	20
	l2_regularization l2_regularization: float, default=0 Der L2-Regularisierungsparameter, der Blätter mit kleinen Hessianen bestraft. Verwenden Sie ``0`` für keine Regularisierung (Standard).	0.0
	max_features max_features: float, default=1.0 Anteil zufällig ausgewählter Merkmale in jedem Knoten-Split. Dies ist eine Form der Regularisierung, kleinere Werte machen die Bäume zu schwächeren Lernern und können Überanpassung verhindern. Wenn Interaktionsbeschränkungen aus `interaction_cst` vorhanden sind, werden nur erlaubte Merkmale für die Unterstichprobe berücksichtigt. .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 Die maximale Anzahl von Bins, die für nicht fehlende Werte verwendet werden sollen. Vor dem Training wird jedes Merkmal des Eingabearrays `X` in ganzzahlige Bins eingeteilt, was eine viel schnellere Trainingsphase ermöglicht. Merkmale mit einer kleinen Anzahl von eindeutigen Werten verwenden möglicherweise weniger als ``max_bins`` Bins. Zusätzlich zu den ``max_bins`` Bins ist immer ein weiterer Bin für fehlende Werte reserviert. Muss nicht größer als 255 sein.	255
	categorical_features categorical_features: array-like von {bool, int, str} der Form (n_features) oder (n_categorical_features), Standardwert='from_dtype' Gibt die kategorialen Merkmale an. - None : kein Merkmal wird als kategorial betrachtet. - Boolesches Array: boolesche Maske, die kategoriale Merkmale angibt. - Ganzzahl-Array: ganzzahlige Indizes, die kategoriale Merkmale angeben - Zeichenketten-Array: Namen von kategorialen Merkmalen (vorausgesetzt, die Trainingsdaten haben Merkmalsnamen). - `"from_dtype"`: Dataframe-Spalten mit dtype "category" werden als kategoriale Merkmale betrachtet. Die Eingabe muss ein Objekt sein, das eine ``__dataframe__``-Methode wie pandas oder polars DataFrames aufweist, um diese Funktion zu nutzen. Für jedes kategoriale Merkmal darf es höchstens `max_bins` eindeutige Kategorien geben. Negative Werte für kategoriale Merkmale, die als numerische Datentypen kodiert sind, werden als fehlende Werte behandelt. Alle kategorialen Werte werden in Gleitkommazahlen umgewandelt. Das bedeutet, dass kategoriale Werte von 1.0 und 1 als dieselbe Kategorie behandelt werden. Lesen Sie mehr im :ref:`Benutzerhandbuch ` und :ref:`sphx_glr_auto_examples_ensemble_plot_gradient_boosting_categorical.py`. .. versionadded:: 0.24 .. versionchanged:: 1.2 Unterstützung für Merkmalsnamen hinzugefügt. .. versionchanged:: 1.4 Option `"from_dtype"` hinzugefügt. .. versionchanged:: 1.6 Der Standardwert wurde von `None` zu `"from_dtype"` geändert.	'from_dtype'
	monotonic_cst monotonic_cst: array-ähnlich von int mit shape (n_features) oder dict, default=None Monotone Einschränkungen, die für jedes Merkmal durchgesetzt werden sollen, werden mit den folgenden Integer-Werten angegeben: - 1: monoton steigend - 0: keine Einschränkung - -1: monoton fallend Wenn ein Dict mit String-Schlüsseln, ordnet es Merkmale zu monotonen Einschränkungen nach Namen zu. Wenn ein Array, werden die Merkmale Einschränkungen nach Position zugeordnet. Siehe :ref:`monotonic_cst_features_names` für ein Anwendungsbeispiel. Weiterlesen im :ref:`Benutzerhandbuch `. .. versionadded:: 0.23 .. versionchanged:: 1.2 Akzeptiert Dict von Einschränkungen mit Merkmalnamen als Schlüssel.	None
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} oder Sequenz von Listen/Tupeln/Sets von Integern, Standardwert=None Gibt Interaktionseinschränkungen an, die Menge von Merkmalen, die miteinander in Kindknotenteilungen interagieren dürfen. Jeder Eintrag gibt die Menge von Merkmalsindizes an, die miteinander interagieren dürfen. Wenn mehr Merkmale vorhanden sind als in diesen Einschränkungen angegeben, werden sie so behandelt, als wären sie als zusätzliche Menge angegeben. Die Zeichenketten "pairwise" und "no_interactions" sind Kurzformen für das Zulassen von nur paarweisen oder gar keiner Interaktion, bzw. Zum Beispiel, bei insgesamt 5 Merkmalen, `interaction_cst=[{0, 1}]` ist äquivalent zu `interaction_cst=[{0, 1}, {2, 3, 4}]`, und gibt an, dass jeder Ast eines Baumes entweder nur auf den Merkmalen 0 und 1 aufteilt oder nur auf den Merkmalen 2, 3 und 4 aufteilt. Siehe :ref:`dieses Beispiel`, wie `interaction_cst` verwendet wird. .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False Wenn ``True`` gesetzt, wird die Lösung des vorherigen fit-Aufrufs wiederverwendet und weitere Schätzer zum Ensemble hinzugefügt. Damit die Ergebnisse gültig sind, sollte der Schätzer nur auf denselben Daten neu trainiert werden. Siehe :term:`Glossar `.	False
	early_stopping early_stopping: 'auto' oder bool, default='auto' Wenn 'auto', ist Early Stopping aktiviert, wenn die Stichprobengröße größer als 10000 ist oder wenn `X_val` und `y_val` an `fit` übergeben werden. Wenn True, ist Early Stopping aktiviert, andernfalls ist Early Stopping deaktiviert. .. versionadded:: 0.23	'auto'
	scoring scoring: str oder callable oder None, default='loss' Scoring-Methode, die für Early Stopping verwendet wird. Wird nur verwendet, wenn `early_stopping` aktiviert ist. Optionen: - str: siehe :ref:`scoring_string_names` für Optionen. - callable: ein Scorer-Callable-Objekt (z.B. Funktion) mit der Signatur ``scorer(estimator, X, y)``. Siehe :ref:`scoring_callable` für Details. - `None`: der :ref:`Bestimmtheitskoeffizient ` (:math:`R^2`) wird verwendet. - 'loss': Early Stopping wird im Vergleich zum Verlustwert überprüft.	'loss'
	validation_fraction validation_fraction: int oder float oder None, default=0.1 Anteil (oder absolute Größe) der Trainingsdaten, der als Validierungsdaten für Early Stopping zurückgestellt wird. Wenn None, erfolgt Early Stopping auf den Trainingsdaten. Der Wert wird ignoriert, wenn entweder kein Early Stopping durchgeführt wird (z.B. `early_stopping=False`) oder wenn `X_val` und `y_val` an fit übergeben werden.	0.1
	n_iter_no_change n_iter_no_change: int, default=10 Wird verwendet, um zu bestimmen, wann "Early Stop" erfolgen soll. Der Anpassungsprozess wird gestoppt, wenn keiner der letzten ``n_iter_no_change`` Scores besser ist als der ``n_iter_no_change - 1``-te-letzte, bis zu einer gewissen Toleranz. Nur verwendet, wenn Early Stopping durchgeführt wird.	10
	tol tol: float, default=1e-7 Die absolute Toleranz, die beim Vergleichen von Scores während des Early Stoppings verwendet wird. Je höher die Toleranz, desto wahrscheinlicher ist es, dass ein frühes Stoppen erfolgt: eine höhere Toleranz bedeutet, dass es für nachfolgende Iterationen schwieriger ist, als Verbesserung gegenüber dem Referenz-Score zu gelten.	1e-07
	verbose verbose: int, default=0 Die Ausführlichkeitsstufe. Wenn nicht null, werden einige Informationen über den Anpassungsprozess ausgegeben. ``1`` gibt nur eine Zusammenfassung aus, ``2`` gibt Informationen pro Iteration aus.	0
	random_state random_state: int, RandomState-Instanz oder None, default=None Pseudozufallszahlengenerator zur Steuerung der Unterabtastung im Binning-Prozess und der Trainings-/Validierungsdatensatzaufteilung, wenn Early Stopping aktiviert ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None

	loss loss: {'squared_error', 'absolute_error', 'gamma', 'poisson', 'quantile'}, default='squared_error' Die Verlustfunktion, die im Boosting-Prozess verwendet wird. Beachten Sie, dass die "squared error", "gamma" und "poisson" Verluste tatsächlich "half least squares loss", "half gamma deviance" und "half poisson deviance" implementieren, um die Berechnung des Gradienten zu vereinfachen. Darüber hinaus verwenden die Verluste "gamma" und "poisson" intern einen Log-Link, "gamma" erfordert ``y > 0`` und "poisson" erfordert ``y >= 0``. "quantile" verwendet den Pinball-Verlust. .. versionchanged:: 0.23 Option 'poisson' hinzugefügt. .. versionchanged:: 1.1 Option 'quantile' hinzugefügt. .. versionchanged:: 1.3 Option 'gamma' hinzugefügt.	'squared_error'
	quantile quantile: float, default=None Wenn loss "quantile" ist, gibt dieser Parameter an, welches Quantil geschätzt werden soll, und muss zwischen 0 und 1 liegen.	None
	learning_rate learning_rate: float, default=0.1 Die Lernrate, auch bekannt als Shrinkage. Sie wird als multiplikativer Faktor für die Blattwerte verwendet. Verwenden Sie ``1`` für keine Schrumpfung.	0.1
	max_iter max_iter: int, default=100 Die maximale Anzahl von Iterationen des Boosting-Prozesses, d.h. die maximale Anzahl von Bäumen.	100
	max_leaf_nodes max_leaf_nodes: int oder None, default=31 Die maximale Anzahl von Blättern pro Baum. Muss strikt größer als 1 sein. Wenn None, gibt es keine maximale Grenze.	31
	max_depth max_depth: int oder None, default=None Die maximale Tiefe jedes Baumes. Die Tiefe eines Baumes ist die Anzahl der Kanten, die vom Wurzelknoten zum tiefsten Blatt führen. Die Tiefe ist standardmäßig nicht begrenzt.	None
	min_samples_leaf min_samples_leaf: int, default=20 Die Mindestanzahl von Samples pro Blatt. Bei kleinen Datensätzen mit weniger als einigen hundert Samples wird empfohlen, diesen Wert zu senken, da nur sehr flache Bäume gebaut würden.	20
	l2_regularization l2_regularization: float, default=0 Der L2-Regularisierungsparameter, der Blätter mit kleinen Hessianen bestraft. Verwenden Sie ``0`` für keine Regularisierung (Standard).	0.0
	max_features max_features: float, default=1.0 Anteil zufällig ausgewählter Merkmale in jedem Knoten-Split. Dies ist eine Form der Regularisierung, kleinere Werte machen die Bäume zu schwächeren Lernern und können Überanpassung verhindern. Wenn Interaktionsbeschränkungen aus `interaction_cst` vorhanden sind, werden nur erlaubte Merkmale für die Unterstichprobe berücksichtigt. .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 Die maximale Anzahl von Bins, die für nicht fehlende Werte verwendet werden sollen. Vor dem Training wird jedes Merkmal des Eingabearrays `X` in ganzzahlige Bins eingeteilt, was eine viel schnellere Trainingsphase ermöglicht. Merkmale mit einer kleinen Anzahl von eindeutigen Werten verwenden möglicherweise weniger als ``max_bins`` Bins. Zusätzlich zu den ``max_bins`` Bins ist immer ein weiterer Bin für fehlende Werte reserviert. Muss nicht größer als 255 sein.	255
	categorical_features categorical_features: array-like von {bool, int, str} der Form (n_features) oder (n_categorical_features), Standardwert='from_dtype' Gibt die kategorialen Merkmale an. - None : kein Merkmal wird als kategorial betrachtet. - Boolesches Array: boolesche Maske, die kategoriale Merkmale angibt. - Ganzzahl-Array: ganzzahlige Indizes, die kategoriale Merkmale angeben - Zeichenketten-Array: Namen von kategorialen Merkmalen (vorausgesetzt, die Trainingsdaten haben Merkmalsnamen). - `"from_dtype"`: Dataframe-Spalten mit dtype "category" werden als kategoriale Merkmale betrachtet. Die Eingabe muss ein Objekt sein, das eine ``__dataframe__``-Methode wie pandas oder polars DataFrames aufweist, um diese Funktion zu nutzen. Für jedes kategoriale Merkmal darf es höchstens `max_bins` eindeutige Kategorien geben. Negative Werte für kategoriale Merkmale, die als numerische Datentypen kodiert sind, werden als fehlende Werte behandelt. Alle kategorialen Werte werden in Gleitkommazahlen umgewandelt. Das bedeutet, dass kategoriale Werte von 1.0 und 1 als dieselbe Kategorie behandelt werden. Lesen Sie mehr im :ref:`Benutzerhandbuch ` und :ref:`sphx_glr_auto_examples_ensemble_plot_gradient_boosting_categorical.py`. .. versionadded:: 0.24 .. versionchanged:: 1.2 Unterstützung für Merkmalsnamen hinzugefügt. .. versionchanged:: 1.4 Option `"from_dtype"` hinzugefügt. .. versionchanged:: 1.6 Der Standardwert wurde von `None` zu `"from_dtype"` geändert.	'from_dtype'
	monotonic_cst monotonic_cst: array-ähnlich von int mit shape (n_features) oder dict, default=None Monotone Einschränkungen, die für jedes Merkmal durchgesetzt werden sollen, werden mit den folgenden Integer-Werten angegeben: - 1: monoton steigend - 0: keine Einschränkung - -1: monoton fallend Wenn ein Dict mit String-Schlüsseln, ordnet es Merkmale zu monotonen Einschränkungen nach Namen zu. Wenn ein Array, werden die Merkmale Einschränkungen nach Position zugeordnet. Siehe :ref:`monotonic_cst_features_names` für ein Anwendungsbeispiel. Weiterlesen im :ref:`Benutzerhandbuch `. .. versionadded:: 0.23 .. versionchanged:: 1.2 Akzeptiert Dict von Einschränkungen mit Merkmalnamen als Schlüssel.	[1, -1]
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} oder Sequenz von Listen/Tupeln/Sets von Integern, Standardwert=None Gibt Interaktionseinschränkungen an, die Menge von Merkmalen, die miteinander in Kindknotenteilungen interagieren dürfen. Jeder Eintrag gibt die Menge von Merkmalsindizes an, die miteinander interagieren dürfen. Wenn mehr Merkmale vorhanden sind als in diesen Einschränkungen angegeben, werden sie so behandelt, als wären sie als zusätzliche Menge angegeben. Die Zeichenketten "pairwise" und "no_interactions" sind Kurzformen für das Zulassen von nur paarweisen oder gar keiner Interaktion, bzw. Zum Beispiel, bei insgesamt 5 Merkmalen, `interaction_cst=[{0, 1}]` ist äquivalent zu `interaction_cst=[{0, 1}, {2, 3, 4}]`, und gibt an, dass jeder Ast eines Baumes entweder nur auf den Merkmalen 0 und 1 aufteilt oder nur auf den Merkmalen 2, 3 und 4 aufteilt. Siehe :ref:`dieses Beispiel`, wie `interaction_cst` verwendet wird. .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False Wenn ``True`` gesetzt, wird die Lösung des vorherigen fit-Aufrufs wiederverwendet und weitere Schätzer zum Ensemble hinzugefügt. Damit die Ergebnisse gültig sind, sollte der Schätzer nur auf denselben Daten neu trainiert werden. Siehe :term:`Glossar `.	False
	early_stopping early_stopping: 'auto' oder bool, default='auto' Wenn 'auto', ist Early Stopping aktiviert, wenn die Stichprobengröße größer als 10000 ist oder wenn `X_val` und `y_val` an `fit` übergeben werden. Wenn True, ist Early Stopping aktiviert, andernfalls ist Early Stopping deaktiviert. .. versionadded:: 0.23	'auto'
	scoring scoring: str oder callable oder None, default='loss' Scoring-Methode, die für Early Stopping verwendet wird. Wird nur verwendet, wenn `early_stopping` aktiviert ist. Optionen: - str: siehe :ref:`scoring_string_names` für Optionen. - callable: ein Scorer-Callable-Objekt (z.B. Funktion) mit der Signatur ``scorer(estimator, X, y)``. Siehe :ref:`scoring_callable` für Details. - `None`: der :ref:`Bestimmtheitskoeffizient ` (:math:`R^2`) wird verwendet. - 'loss': Early Stopping wird im Vergleich zum Verlustwert überprüft.	'loss'
	validation_fraction validation_fraction: int oder float oder None, default=0.1 Anteil (oder absolute Größe) der Trainingsdaten, der als Validierungsdaten für Early Stopping zurückgestellt wird. Wenn None, erfolgt Early Stopping auf den Trainingsdaten. Der Wert wird ignoriert, wenn entweder kein Early Stopping durchgeführt wird (z.B. `early_stopping=False`) oder wenn `X_val` und `y_val` an fit übergeben werden.	0.1
	n_iter_no_change n_iter_no_change: int, default=10 Wird verwendet, um zu bestimmen, wann "Early Stop" erfolgen soll. Der Anpassungsprozess wird gestoppt, wenn keiner der letzten ``n_iter_no_change`` Scores besser ist als der ``n_iter_no_change - 1``-te-letzte, bis zu einer gewissen Toleranz. Nur verwendet, wenn Early Stopping durchgeführt wird.	10
	tol tol: float, default=1e-7 Die absolute Toleranz, die beim Vergleichen von Scores während des Early Stoppings verwendet wird. Je höher die Toleranz, desto wahrscheinlicher ist es, dass ein frühes Stoppen erfolgt: eine höhere Toleranz bedeutet, dass es für nachfolgende Iterationen schwieriger ist, als Verbesserung gegenüber dem Referenz-Score zu gelten.	1e-07
	verbose verbose: int, default=0 Die Ausführlichkeitsstufe. Wenn nicht null, werden einige Informationen über den Anpassungsprozess ausgegeben. ``1`` gibt nur eine Zusammenfassung aus, ``2`` gibt Informationen pro Iteration aus.	0
	random_state random_state: int, RandomState-Instanz oder None, default=None Pseudozufallszahlengenerator zur Steuerung der Unterabtastung im Binning-Prozess und der Trainings-/Validierungsdatensatzaufteilung, wenn Early Stopping aktiviert ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None

Monotone Einschränkungen#

Verwendung von Merkmalsnamen zur Angabe von monotonen Einschränkungen#

Diese Seite