Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Release Highlights für scikit-learn 1.7#

Wir freuen uns, die Veröffentlichung von scikit-learn 1.7 bekannt zu geben! Viele Fehlerbehebungen und Verbesserungen wurden hinzugefügt, ebenso wie einige wichtige neue Funktionen. Nachfolgend beschreiben wir die Highlights dieser Veröffentlichung. Für eine vollständige Liste aller Änderungen siehe die Release Notes.

Um die neueste Version zu installieren (mit pip)

pip install --upgrade scikit-learn

oder mit conda

conda install -c conda-forge scikit-learn

Verbesserte HTML-Darstellung von Estimators#

Die HTML-Darstellung von Estimators enthält nun einen Abschnitt mit der Liste der Parameter und ihren Werten. Nicht-Standard-Parameter sind orange hervorgehoben. Ein Kopier-Button ist ebenfalls verfügbar, um den „vollqualifizierten“ Parameternamen zu kopieren, ohne die Methode get_params aufrufen zu müssen. Dies ist besonders nützlich bei der Definition eines Parameter-Rasters für eine Grid-Suche oder eine Zufallssuche mit einer komplexen Pipeline.

Sehen Sie sich das untenstehende Beispiel an und klicken Sie auf die verschiedenen Estimator-Blöcke, um die verbesserte HTML-Darstellung zu sehen.

from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler

model = make_pipeline(StandardScaler(with_std=False), LogisticRegression(C=2.0))
model

Pipeline(steps=[('standardscaler', StandardScaler(with_std=False)),
                ('logisticregression', LogisticRegression(C=2.0))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Benutzerdefiniertes Validierungsset für histogrammbasierte Gradient Boosting Estimators#

Die Klassen ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor unterstützen nun die direkte Übergabe eines benutzerdefinierten Validierungssets für Early Stopping an die `fit`-Methode über die Parameter X_val, y_val und sample_weight_val. In einer pipeline.Pipeline kann das Validierungsset X_val zusammen mit X über den Parameter transform_input transformiert werden.

import sklearn
from sklearn.datasets import make_classification
from sklearn.ensemble import HistGradientBoostingClassifier
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler

sklearn.set_config(enable_metadata_routing=True)

X, y = make_classification(random_state=0)
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=0)

clf = HistGradientBoostingClassifier()
clf.set_fit_request(X_val=True, y_val=True)

model = Pipeline([("sc", StandardScaler()), ("clf", clf)], transform_input=["X_val"])
model.fit(X, y, X_val=X_val, y_val=y_val)

Pipeline(steps=[('sc', StandardScaler()),
                ('clf', HistGradientBoostingClassifier())],
         transform_input=['X_val'])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

ROC-Kurven aus Kreuzvalidierungsergebnissen plotten#

Die Klasse metrics.RocCurveDisplay verfügt über eine neue Klassenmethode from_cv_results, die es ermöglicht, leicht mehrere ROC-Kurven aus den Ergebnissen von model_selection.cross_validate zu plotten.

from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import RocCurveDisplay
from sklearn.model_selection import cross_validate

X, y = make_classification(n_samples=150, random_state=0)
clf = LogisticRegression(random_state=0)
cv_results = cross_validate(clf, X, y, cv=5, return_estimator=True, return_indices=True)
_ = RocCurveDisplay.from_cv_results(cv_results, X, y)

Array API-Unterstützung#

Mehrere Funktionen wurden aktualisiert, um array-API-kompatible Eingaben seit Version 1.6 zu unterstützen, insbesondere Metriken aus dem Modul sklearn.metrics.

Zusätzlich ist es nicht mehr erforderlich, das Paket array-api-compat zu installieren, um die experimentelle Array-API-Unterstützung in scikit-learn zu nutzen.

Bitte lesen Sie die Seite zur Array API-Unterstützung für Anweisungen zur Verwendung von scikit-learn mit Array-API-kompatiblen Bibliotheken wie PyTorch oder CuPy.

Verbesserte API-Konsistenz von Multi-Layer Perceptron#

Der neural_network.MLPRegressor verfügt über einen neuen Parameter loss und unterstützt nun zusätzlich zur Standard-Loss-Funktion "squared_error" auch die "poisson"-Loss-Funktion. Darüber hinaus unterstützen die Estimators neural_network.MLPClassifier und neural_network.MLPRegressor nun Sample Weights. Diese Verbesserungen wurden vorgenommen, um die Konsistenz dieser Estimators im Vergleich zu anderen Estimators in scikit-learn zu verbessern.

Migration zu Sparse Arrays#

Um die Migration von SciPy von Sparse Matrizen zu Sparse Arrays vorzubereiten, akzeptieren nun alle scikit-learn Estimators, die Sparse Matrizen als Eingabe akzeptieren, auch Sparse Arrays.

Gesamtlaufzeit des Skripts: (0 Minuten 0,131 Sekunden)

Verwandte Beispiele

Release Highlights für scikit-learn 1.6

Release Highlights für scikit-learn 1.2

Release Highlights für scikit-learn 0.23

Release Highlights für scikit-learn 0.22

Galerie generiert von Sphinx-Gallery

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('standardscaler', ...), ('logisticregression', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	penalty penalty: {'l1', 'l2', 'elasticnet', None}, default='l2' Gibt die Norm der Strafe an: - `None`: keine Strafe wird hinzugefügt; - `'l2'`: fügt einen L2-Strafbegriff hinzu und ist die Standardwahl; - `'l1'`: fügt einen L1-Strafbegriff hinzu; - `'elasticnet'`: beide L1- und L2-Strafbegriffe werden hinzugefügt. .. warning:: Einige Strafen funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionadded:: 0.19 l1-Strafe mit SAGA-Solver (erlaubt 'multinomial' + L1) .. deprecated:: 1.8 `penalty` wurde in Version 1.8 als veraltet markiert und wird in 1.10 entfernt. Verwenden Sie stattdessen `l1_ratio`. `l1_ratio=0` für `penalty='l2'`, `l1_ratio=1` für `penalty='l1'` und `l1_ratio` auf eine Gleitkommazahl zwischen 0 und 1 gesetzt für `'penalty='elasticnet'`.	'deprecated'
	C C: float, default=1.0 Kehrwert der Regularisierungsstärke; muss eine positive Gleitkommazahl sein. Wie bei Support Vector Machines geben kleinere Werte eine stärkere Regularisierung an. `C=np.inf` führt zu ungestrafter logistischer Regression. Für ein visuelles Beispiel der Auswirkung der Abstimmung des Parameters `C` mit einer L1-Strafe siehe: :ref:`sphx_glr_auto_examples_linear_model_plot_logistic_path.py`.	2.0
	l1_ratio l1_ratio: float, default=0.0 Der Elastic-Net-Mischungsparameter, mit `0 <= l1_ratio <= 1`. Das Setzen von `l1_ratio=1` ergibt eine reine L1-Strafe, das Setzen von `l1_ratio=0` eine reine L2-Strafe. Jeder Wert zwischen 0 und 1 ergibt eine Elastic-Net-Strafe der Form `l1_ratio * L1 + (1 - l1_ratio) * L2`. .. warning:: Bestimmte Werte von `l1_ratio`, d. h. einige Strafen, funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionchanged:: 1.8 Der Standardwert wurde von None auf 0.0 geändert. .. deprecated:: 1.8 `None` ist veraltet und wird in Version 1.10 entfernt. Verwenden Sie immer `l1_ratio`, um den Strafentyp anzugeben.	0.0
	dual dual: bool, default=False Duale (beschränkte) oder primale (regularisierte, siehe auch :ref:`diese Gleichung `) Formulierung. Die duale Formulierung ist nur für die L2-Strafe mit dem liblinear-Solver implementiert. Bevorzugen Sie `dual=False` wenn n_samples > n_features.	False
	tol tol: float, default=1e-4 Toleranz für Abbruchkriterien.	0.0001
	fit_intercept fit_intercept: bool, default=True Gibt an, ob eine Konstante (auch Bias oder Achsenabschnitt genannt) zur Entscheidungsfunktion hinzugefügt werden soll.	True
	intercept_scaling intercept_scaling: float, default=1 Nur nützlich, wenn der Solver `liblinear` verwendet wird und `self.fit_intercept` auf `True` gesetzt ist. In diesem Fall wird `x` zu `[x, self.intercept_scaling]`, d. h. ein "synthetisches" Merkmal mit konstantem Wert gleich `intercept_scaling` wird an den Instanzvektor angehängt. Der Achsenabschnitt wird dann ``intercept_scaling * synthetisches Merkmalsgewicht``. .. note:: Das Gewicht des synthetischen Merkmals unterliegt der L1- oder L2- Regularisierung wie alle anderen Merkmale. Um die Auswirkung der Regularisierung auf das synthetische Merkmalsgewicht (und damit auf den Achsenabschnitt) zu verringern, muss `intercept_scaling` erhöht werden.	1
	class_weight class_weight: dict oder 'balanced', default=None Mit Klassen assoziierte Gewichte in der Form ``{class_label: weight}``. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch invers proportional zu den Klassenhaüfigkeiten in den Eingabedaten als ``n_samples / (n_classes * np.bincount(y))`` anzupassen. Beachten Sie, dass diese Gewichte mit sample_weight (übergeben durch die fit-Methode) multipliziert werden, wenn sample_weight angegeben ist. .. versionadded:: 0.17 class_weight='balanced'	None
	random_state random_state: int, RandomState-Instanz, default=None Wird verwendet, wenn ``solver`` == 'sag', 'saga' oder 'liblinear', um die Daten zu mischen. Siehe :term:`Glossar ` für Details.	None
	solver solver: {'lbfgs', 'liblinear', 'newton-cg', 'newton-cholesky', 'sag', 'saga'}, default='lbfgs' Algorithmus, der im Optimierungsproblem verwendet wird. Standard ist 'lbfgs'. Um einen Solver auszuwählen, sollten Sie die folgenden Aspekte berücksichtigen: - 'lbfgs' ist ein guter Standard-Solver, da er für eine breite Klasse von Problemen vernünftige Ergebnisse liefert. - Bei :term:`multiclass`-Problemen (`n_classes >= 3`) minimieren alle Solver außer 'liblinear' die vollständige multinomiale Loss-Funktion; 'liblinear' löst dann einen Fehler aus. - 'newton-cholesky' ist eine gute Wahl für `n_samples` >> `n_features * n_classes`, insbesondere bei One-Hot-kodierten kategorialen Merkmalen mit seltenen Kategorien. Beachten Sie, dass die Speichernutzung dieses Solvers eine quadratische Abhängigkeit von `n_features * n_classes` aufweist, da die vollständige Hesse-Matrix explizit berechnet wird. - Für kleine Datensätze ist 'liblinear' eine gute Wahl, während 'sag' und 'saga' für große Datensätze schneller sind; - 'liblinear' kann standardmäßig nur binäre Klassifizierung verarbeiten. Um ein One-Versus-Rest-Schema für die Multiklassen-Einstellung anzuwenden, kann es mit :class:`~sklearn.multiclass.OneVsRestClassifier` umhüllt werden. .. warning:: Die Wahl des Algorithmus hängt von der gewählten Strafe ab (`l1_ratio=0` für L2-Strafe, `l1_ratio=1` für L1-Strafe und `0 < l1_ratio < 1` für Elastic-Net) und von der (multinomialen) Multiklassenunterstützung: ================= ======================== ====================== solver l1_ratio multinomial multiclass ================= ======================== ====================== 'lbfgs' l1_ratio=0 ja 'liblinear' l1_ratio=1 oder l1_ratio=0 nein 'newton-cg' l1_ratio=0 ja 'newton-cholesky' l1_ratio=0 ja 'sag' l1_ratio=0 ja 'saga' 0<=l1_ratio<=1 ja ================= ======================== ====================== .. note:: Die schnelle Konvergenz von 'sag' und 'saga' ist nur bei Merkmalen mit ungefähr gleicher Skalierung garantiert. Sie können die Daten mit einem Scaler aus :mod:`sklearn.preprocessing` vorverarbeiten. .. seealso:: Informationen zu :class:`LogisticRegression` und insbesondere zur :ref:`Tabelle ` mit Zusammenfassung der Solver-/Strafunterstützung finden Sie im :ref:`Benutzerhandbuch `. .. versionadded:: 0.17 Stochastic Average Gradient (SAG) Descent Solver. Multinomiale Unterstützung in Version 0.18. .. versionadded:: 0.19 SAGA Solver. .. versionchanged:: 0.22 Der Standard-Solver wurde von 'liblinear' auf 'lbfgs' in 0.22 geändert. .. versionadded:: 1.2 Newton-Cholesky-Solver. Multinomielle Unterstützung in Version 1.6.	'lbfgs'
	max_iter max_iter: int, default=100 Maximale Anzahl von Iterationen, die die Solver zur Konvergenz benötigen.	100
	verbose verbose: int, default=0 Für die Solver liblinear und lbfgs setzen Sie verbose auf eine beliebige positive Zahl für die Ausführlichkeit.	0
	warm_start warm_start: bool, default=False Wenn auf True gesetzt, wird die Lösung des vorherigen Aufrufs von fit als Initialisierung wiederverwendet, andernfalls wird die vorherige Lösung einfach gelöscht. Nützlich für den liblinear-Solver. Siehe :term:`das Glossar `. .. versionadded:: 0.17 warm_start zur Unterstützung der Solver lbfgs, newton-cg, sag, saga.	False
	n_jobs n_jobs: int, default=None Hat keine Auswirkung. .. deprecated:: 1.8 `n_jobs` ist in Version 1.8 veraltet und wird in 1.10 entfernt.	None

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('sc', ...), ('clf', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	['X_val']
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	loss loss: {'log_loss'}, default='log_loss' Die zu verwendende Loss-Funktion im Boosting-Prozess. Für binäre Klassifizierungsprobleme ist 'log_loss' auch bekannt als logistischer Verlust, binomiale Deviationsmessung oder binäre Kreuzentropie. Intern passt das Modell einen Baum pro Boosting-Iteration an und verwendet die logistische Sigmoid-Funktion (expit) als inverse Link-Funktion, um die vorhergesagte Wahrscheinlichkeit der positiven Klasse zu berechnen. Für Multiklassen-Klassifizierungsprobleme ist 'log_loss' auch bekannt als multinomiale Deviationsmessung oder kategoriale Kreuzentropie. Intern passt das Modell einen Baum pro Boosting-Iteration und pro Klasse an und verwendet die Softmax-Funktion als inverse Link-Funktion, um die vorhergesagten Wahrscheinlichkeiten der Klassen zu berechnen.	'log_loss'
	learning_rate learning_rate: float, default=0.1 Die Lernrate, auch bekannt als Shrinkage. Sie wird als multiplikativer Faktor für die Blattwerte verwendet. Verwenden Sie ``1`` für keine Schrumpfung.	0.1
	max_iter max_iter: int, default=100 Die maximale Anzahl von Iterationen des Boosting-Prozesses, d.h. die maximale Anzahl von Bäumen für binäre Klassifizierung. Für Multiklassen-Klassifizierung werden `n_classes` Bäume pro Iteration aufgebaut.	100
	max_leaf_nodes max_leaf_nodes: int oder None, default=31 Die maximale Anzahl von Blättern pro Baum. Muss strikt größer als 1 sein. Wenn None, gibt es keine maximale Grenze.	31
	max_depth max_depth: int oder None, default=None Die maximale Tiefe jedes Baumes. Die Tiefe eines Baumes ist die Anzahl der Kanten, die vom Wurzelknoten zum tiefsten Blatt führen. Die Tiefe ist standardmäßig nicht begrenzt.	None
	min_samples_leaf min_samples_leaf: int, default=20 Die Mindestanzahl von Samples pro Blatt. Bei kleinen Datensätzen mit weniger als einigen hundert Samples wird empfohlen, diesen Wert zu senken, da nur sehr flache Bäume gebaut würden.	20
	l2_regularization l2_regularization: float, default=0 Der L2-Regularisierungsparameter, der Blätter mit kleinen Hessianen bestraft. Verwenden Sie ``0`` für keine Regularisierung (Standard).	0.0
	max_features max_features: float, default=1.0 Anteil zufällig ausgewählter Merkmale in jedem Knoten-Split. Dies ist eine Form der Regularisierung, kleinere Werte machen die Bäume zu schwächeren Lernern und können Überanpassung verhindern. Wenn Interaktionsbeschränkungen aus `interaction_cst` vorhanden sind, werden nur erlaubte Merkmale für die Unterstichprobe berücksichtigt. .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 Die maximale Anzahl von Bins, die für nicht fehlende Werte verwendet werden sollen. Vor dem Training wird jedes Merkmal des Eingabearrays `X` in ganzzahlige Bins eingeteilt, was eine viel schnellere Trainingsphase ermöglicht. Merkmale mit einer kleinen Anzahl von eindeutigen Werten verwenden möglicherweise weniger als ``max_bins`` Bins. Zusätzlich zu den ``max_bins`` Bins ist immer ein weiterer Bin für fehlende Werte reserviert. Muss nicht größer als 255 sein.	255
	categorical_features categorical_features: array-like of {bool, int, str} von Form (n_features) oder (n_categorical_features,), default='from_dtype' Gibt die kategorialen Merkmale an. - None : kein Merkmal wird als kategorial betrachtet. - Boolesches Array: boolesche Maske, die kategoriale Merkmale angibt. - Ganzzahl-Array: Ganzzahl-Indizes, die kategoriale Merkmale angeben. - String-Array: Namen von kategorialen Merkmalen (vorausgesetzt, die Trainingsdaten haben Merkmalnamen). - `"from_dtype"`: Spalten mit dem dtype "category" werden als kategoriale Merkmale betrachtet. Die Eingabe muss ein Objekt sein, das eine ``__dataframe__`` Methode exponiert, wie z.B. Pandas oder Polars DataFrames, um diese Funktion zu nutzen. Für jedes kategoriale Merkmal darf es höchstens `max_bins` eindeutige Kategorien geben. Negative Werte für kategoriale Merkmale, die als numerische dtypes kodiert sind, werden als fehlende Werte behandelt. Alle kategorialen Werte werden in Gleitkommazahlen umgewandelt. Das bedeutet, dass kategoriale Werte von 1.0 und 1 als dieselbe Kategorie behandelt werden. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 0.24 .. versionchanged:: 1.2 Unterstützung für Merkmalnamen hinzugefügt. .. versionchanged:: 1.4 Option `"from_dtype"` hinzugefügt. .. versionchanged:: 1.6 Der Standardwert wurde von `None` auf `"from_dtype"` geändert.	'from_dtype'
	monotonic_cst monotonic_cst: array-like of int von Form (n_features) oder dict, default=None Monotone Einschränkungen, die für jedes Merkmal erzwungen werden sollen, werden mit den folgenden Ganzzahlwerten angegeben: - 1: monotone Zunahme - 0: keine Einschränkung - -1: monotone Abnahme Wenn ein Dict mit String-Schlüsseln, wird das Merkmal mit monotonen Einschränkungen nach Name zugeordnet. Wenn ein Array, werden die Merkmale den Einschränkungen nach Position zugeordnet. Siehe :ref:`monotonic_cst_features_names` für ein Anwendungsbeispiel. Die Einschränkungen gelten nur für binäre Klassifizierungen und gelten für die Wahrscheinlichkeit der positiven Klasse. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 0.23 .. versionchanged:: 1.2 Akzeptiert Dict von Einschränkungen mit Merkmalnamen als Schlüssel.	None
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} oder Sequenz von Listen/Tupeln/Sets von int, default=None Gibt Interaktionseinschränkungen an, d.h. die Mengen von Merkmalen, die miteinander bei Aufteilungen von Kindknoten interagieren können. Jedes Element gibt die Menge der Merkmalsindizes an, die miteinander interagieren dürfen. Wenn es mehr Merkmale gibt als in diesen Einschränkungen angegeben, werden sie so behandelt, als ob sie als zusätzliche Menge angegeben worden wären. Die Strings "pairwise" und "no_interactions" sind Kurzformen für die Erlaubnis von nur paarweisen oder gar keiner Interaktion, bzw. Zum Beispiel, bei insgesamt 5 Merkmalen, ist `interaction_cst=[{0, 1}]` äquivalent zu `interaction_cst=[{0, 1}, {2, 3, 4}]`, und gibt an, dass jeder Zweig eines Baumes entweder nur auf den Merkmalen 0 und 1 oder nur auf den Merkmalen 2, 3 und 4 aufgeteilt wird. Siehe :ref:`dieses Beispiel ` zur Verwendung von `interaction_cst`. .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False Wenn ``True`` gesetzt, wird die Lösung des vorherigen fit-Aufrufs wiederverwendet und weitere Schätzer zum Ensemble hinzugefügt. Damit die Ergebnisse gültig sind, sollte der Schätzer nur auf denselben Daten neu trainiert werden. Siehe :term:`Glossar `.	False
	early_stopping early_stopping: 'auto' oder bool, default='auto' Wenn 'auto', ist Early Stopping aktiviert, wenn die Stichprobengröße größer als 10000 ist oder wenn `X_val` und `y_val` an `fit` übergeben werden. Wenn True, ist Early Stopping aktiviert, andernfalls ist Early Stopping deaktiviert. .. versionadded:: 0.23	'auto'
	scoring scoring: str oder callable oder None, default='loss' Die zu verwendende Scoring-Methode für Early Stopping. Nur verwendet, wenn `early_stopping` aktiviert ist. Optionen: - str: siehe :ref:`scoring_string_names` für Optionen. - callable: ein Scorer-Callable-Objekt (z.B. Funktion) mit der Signatur ``scorer(estimator, X, y)``. Siehe :ref:`scoring_callable` für Details. - `None`: :ref:`accuracy ` wird verwendet. - 'loss': Early Stopping wird bezüglich des Loss-Wertes geprüft.	'loss'
	validation_fraction validation_fraction: int oder float oder None, default=0.1 Anteil (oder absolute Größe) der Trainingsdaten, der als Validierungsdaten für Early Stopping zurückgestellt wird. Wenn None, erfolgt Early Stopping auf den Trainingsdaten. Der Wert wird ignoriert, wenn entweder kein Early Stopping durchgeführt wird (z.B. `early_stopping=False`) oder wenn `X_val` und `y_val` an fit übergeben werden.	0.1
	n_iter_no_change n_iter_no_change: int, default=10 Wird verwendet, um zu bestimmen, wann "Early Stop" erfolgen soll. Der Anpassungsprozess wird gestoppt, wenn keiner der letzten ``n_iter_no_change`` Scores besser ist als der ``n_iter_no_change - 1``-te-letzte, bis zu einer gewissen Toleranz. Nur verwendet, wenn Early Stopping durchgeführt wird.	10
	tol tol: float, default=1e-7 Die absolute Toleranz, die beim Vergleichen von Scores verwendet wird. Je höher die Toleranz, desto wahrscheinlicher ist ein frühes Stoppen: eine höhere Toleranz bedeutet, dass es für nachfolgende Iterationen schwieriger sein wird, als eine Verbesserung gegenüber dem Referenz-Score betrachtet zu werden.	1e-07
	verbose verbose: int, default=0 Die Ausführlichkeitsstufe. Wenn nicht null, werden einige Informationen über den Anpassungsprozess ausgegeben. ``1`` gibt nur eine Zusammenfassung aus, ``2`` gibt Informationen pro Iteration aus.	0
	random_state random_state: int, RandomState-Instanz oder None, default=None Pseudozufallszahlengenerator zur Steuerung der Unterabtastung im Binning-Prozess und der Trainings-/Validierungsdatensatzaufteilung, wenn Early Stopping aktiviert ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None
	class_weight class_weight: dict oder 'balanced', default=None Mit Klassen verbundene Gewichte in Form von `{class_label: weight}`. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch anzupassen, invers proportional zu den Klassenhäufigkeiten in den Eingabedaten als `n_samples / (n_classes * np.bincount(y))`. Beachten Sie, dass diese Gewichte mit `sample_weight` (über die fit-Methode übergeben) multipliziert werden, wenn `sample_weight` angegeben ist. .. versionadded:: 1.2	None

	copy copy: bool, Standard=True Wenn False, versuchen Sie, eine Kopie zu vermeiden und stattdessen direkt zu skalieren. Dies ist nicht garantiert, dass es immer direkt funktioniert; z.B. wenn die Daten kein NumPy-Array oder eine scipy.sparse CSR-Matrix sind, kann immer noch eine Kopie zurückgegeben werden.	True
	with_mean with_mean: bool, Standard=True Wenn True, zentrieren Sie die Daten vor der Skalierung. Dies funktioniert nicht (und löst eine Ausnahme aus), wenn versucht, auf Sparse-Matrizen angewendet zu werden, da deren Zentrierung den Aufbau einer dichten Matrix erfordert, die in gängigen Anwendungsfällen wahrscheinlich zu groß ist, um in den Speicher zu passen.	True
	with_std with_std: bool, Standard=True Wenn True, skalieren Sie die Daten auf Einheitsvarianz (oder äquivalent, Einheitsstandardabweichung).	False