Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Release Highlights für scikit-learn 0.24#

Wir freuen uns, die Veröffentlichung von scikit-learn 0.24 bekannt zu geben! Viele Fehlerbehebungen und Verbesserungen wurden hinzugefügt, ebenso wie einige neue Hauptfunktionen. Nachfolgend stellen wir einige der wichtigsten Funktionen dieser Veröffentlichung im Detail vor. **Eine vollständige Liste aller Änderungen** finden Sie in den Release Notes.

Um die neueste Version zu installieren (mit pip)

pip install --upgrade scikit-learn

oder mit conda

conda install -c conda-forge scikit-learn

Successive Halving-Schätzer zur Abstimmung von Hyperparametern#

Successive Halving, eine moderne Methode, steht nun zur Erkundung des Parameterraums und zur Identifizierung der besten Kombination zur Verfügung. HalvingGridSearchCV und HalvingRandomSearchCV können als Drop-in-Ersatz für GridSearchCV und RandomizedSearchCV verwendet werden. Successive Halving ist ein iterativer Auswahlprozess, der in der folgenden Abbildung dargestellt ist. Die erste Iteration wird mit geringen Ressourcen durchgeführt, wobei die Ressource typischerweise der Anzahl der Trainingsstichproben entspricht, aber auch ein beliebiger ganzzahliger Parameter wie n_estimators in einem Random Forest sein kann. Nur eine Teilmenge der Kandidatenparameter wird für die nächste Iteration ausgewählt, die mit einer zunehmenden Menge an zugewiesenen Ressourcen durchgeführt wird. Nur eine Teilmenge der Kandidaten übersteht den gesamten Iterationsprozess, und der beste Kandidat ist derjenige mit der höchsten Punktzahl in der letzten Iteration.

Lesen Sie mehr im Benutzerhandbuch (Hinweis: Die Successive Halving-Schätzer sind noch experimentell).

../../_images/sphx_glr_plot_successive_halving_iterations_001.png

import numpy as np
from scipy.stats import randint

from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier
from sklearn.experimental import enable_halving_search_cv  # noqa: F401
from sklearn.model_selection import HalvingRandomSearchCV

rng = np.random.RandomState(0)

X, y = make_classification(n_samples=700, random_state=rng)

clf = RandomForestClassifier(n_estimators=10, random_state=rng)

param_dist = {
    "max_depth": [3, None],
    "max_features": randint(1, 11),
    "min_samples_split": randint(2, 11),
    "bootstrap": [True, False],
    "criterion": ["gini", "entropy"],
}

rsh = HalvingRandomSearchCV(
    estimator=clf, param_distributions=param_dist, factor=2, random_state=rng
)
rsh.fit(X, y)
rsh.best_params_

{'bootstrap': True, 'criterion': 'gini', 'max_depth': None, 'max_features': 10, 'min_samples_split': 10}

Native Unterstützung für kategorische Merkmale in HistGradientBoosting-Schätzern#

HistGradientBoostingClassifier und HistGradientBoostingRegressor haben jetzt native Unterstützung für kategorische Merkmale: Sie können Teilungen auf nicht-geordnete, kategorische Daten berücksichtigen. Lesen Sie mehr im Benutzerhandbuch.

../../_images/sphx_glr_plot_gradient_boosting_categorical_001.png

Der Plot zeigt, dass die neue native Unterstützung für kategorische Merkmale zu Trainingszeiten führt, die mit Modellen vergleichbar sind, bei denen die Kategorien als geordnete Größen behandelt werden, d. h. einfach ordinal kodiert. Die native Unterstützung ist auch ausdrucksstärker als sowohl One-Hot-Encoding als auch Ordinal-Encoding. Um den neuen Parameter categorical_features zu verwenden, ist es jedoch immer noch erforderlich, die Daten innerhalb einer Pipeline vorzuverarbeiten, wie in diesem Beispiel gezeigt.

Verbesserte Leistung von HistGradientBoosting-Schätzern#

Der Speicherbedarf von ensemble.HistGradientBoostingRegressor und ensemble.HistGradientBoostingClassifier wurde während der Aufrufe von fit erheblich verbessert. Darüber hinaus erfolgt die Histogramminitialisierung jetzt parallel, was zu leichten Geschwindigkeitsverbesserungen führt. Mehr dazu auf der Benchmark-Seite.

Neuer Self-Training Meta-Schätzer#

Eine neue Self-Training-Implementierung, basierend auf Yarowskis Algorithmus, kann nun mit jedem Klassifikator verwendet werden, der predict_proba implementiert. Der Unterklassifikator verhält sich als semi-überwachter Klassifikator und ermöglicht es ihm, aus unbeschrifteten Daten zu lernen. Lesen Sie mehr im Benutzerhandbuch.

import numpy as np

from sklearn import datasets
from sklearn.semi_supervised import SelfTrainingClassifier
from sklearn.svm import SVC

rng = np.random.RandomState(42)
iris = datasets.load_iris()
random_unlabeled_points = rng.rand(iris.target.shape[0]) < 0.3
iris.target[random_unlabeled_points] = -1
svc = SVC(probability=True, gamma="auto")
self_training_model = SelfTrainingClassifier(svc)
self_training_model.fit(iris.data, iris.target)

SelfTrainingClassifier(estimator=SVC(gamma='auto', probability=True))

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Neuer SequentialFeatureSelector-Transformer#

Ein neuer iterativer Transformer zur Auswahl von Merkmalen ist verfügbar: SequentialFeatureSelector. Sequential Feature Selection kann Merkmale einzeln hinzufügen (Vorwärtsselektion) oder Merkmale aus der Liste der verfügbaren Merkmale entfernen (Rückwärtsselektion), basierend auf einer Maximierung des kreuzvalidierten Scores. Sehen Sie im Benutzerhandbuch.

from sklearn.datasets import load_iris
from sklearn.feature_selection import SequentialFeatureSelector
from sklearn.neighbors import KNeighborsClassifier

X, y = load_iris(return_X_y=True, as_frame=True)
feature_names = X.columns
knn = KNeighborsClassifier(n_neighbors=3)
sfs = SequentialFeatureSelector(knn, n_features_to_select=2)
sfs.fit(X, y)
print(
    "Features selected by forward sequential selection: "
    f"{feature_names[sfs.get_support()].tolist()}"
)

Features selected by forward sequential selection: ['sepal length (cm)', 'petal width (cm)']

Neue PolynomialCountSketch-Kernel-Approximationsfunktion#

Der neue PolynomialCountSketch approximiert eine polynomiale Erweiterung eines Merkmalsraums bei Verwendung mit linearen Modellen, verbraucht aber deutlich weniger Speicher als PolynomialFeatures.

from sklearn.datasets import fetch_covtype
from sklearn.kernel_approximation import PolynomialCountSketch
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import MinMaxScaler

X, y = fetch_covtype(return_X_y=True)
pipe = make_pipeline(
    MinMaxScaler(),
    PolynomialCountSketch(degree=2, n_components=300),
    LogisticRegression(max_iter=1000),
)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, train_size=5000, test_size=10000, random_state=42
)
pipe.fit(X_train, y_train).score(X_test, y_test)

0.7361

Zum Vergleich ist hier die Punktzahl eines linearen Basismodells für dieselben Daten

linear_baseline = make_pipeline(MinMaxScaler(), LogisticRegression(max_iter=1000))
linear_baseline.fit(X_train, y_train).score(X_test, y_test)

0.7141

Individual Conditional Expectation Plots#

Eine neue Art von Partial Dependence Plot ist verfügbar: der Individual Conditional Expectation (ICE) Plot. ICE-Plots visualisieren die Abhängigkeit der Vorhersage von einem Merkmal für jede Stichprobe einzeln, mit einer Linie pro Stichprobe. Sehen Sie im Benutzerhandbuch

from sklearn.datasets import fetch_california_housing
from sklearn.ensemble import RandomForestRegressor

# from sklearn.inspection import plot_partial_dependence
from sklearn.inspection import PartialDependenceDisplay

X, y = fetch_california_housing(return_X_y=True, as_frame=True)
features = ["MedInc", "AveOccup", "HouseAge", "AveRooms"]
est = RandomForestRegressor(n_estimators=10)
est.fit(X, y)

# plot_partial_dependence has been removed in version 1.2. From 1.2, use
# PartialDependenceDisplay instead.
# display = plot_partial_dependence(
display = PartialDependenceDisplay.from_estimator(
    est,
    X,
    features,
    kind="individual",
    subsample=50,
    n_jobs=3,
    grid_resolution=20,
    random_state=0,
)
display.figure_.suptitle(
    "Partial dependence of house value on non-location features\n"
    "for the California housing dataset, with BayesianRidge"
)
display.figure_.subplots_adjust(hspace=0.3)

Partial dependence of house value on non-location features for the California housing dataset, with BayesianRidge

Neues Poisson-Splitting-Kriterium für DecisionTreeRegressor#

Die Integration der Poisson-Regressionsschätzung wird aus Version 0.23 fortgesetzt. DecisionTreeRegressor unterstützt nun ein neues Splitting-Kriterium 'poisson'. Die Einstellung von criterion="poisson" könnte eine gute Wahl sein, wenn Ihr Ziel eine Anzahl oder eine Frequenz ist.

import numpy as np

from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor

n_samples, n_features = 1000, 20
rng = np.random.RandomState(0)
X = rng.randn(n_samples, n_features)
# positive integer target correlated with X[:, 5] with many zeros:
y = rng.poisson(lam=np.exp(X[:, 5]) / 2)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=rng)
regressor = DecisionTreeRegressor(criterion="poisson", random_state=0)
regressor.fit(X_train, y_train)

DecisionTreeRegressor(criterion='poisson', random_state=0)

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Neue Verbesserungen der Dokumentation#

Neue Beispiele und Dokumentationsseiten wurden hinzugefügt, in einem kontinuierlichen Bestreben, das Verständnis von maschinellen Lernpraktiken zu verbessern

ein neuer Abschnitt über häufige Fallstricke und empfohlene Vorgehensweisen,
ein Beispiel, das veranschaulicht, wie die Leistung von Modellen statistisch verglichen wird, die mit GridSearchCV ausgewertet wurden,
ein Beispiel, wie die Koeffizienten von linearen Modellen interpretiert werden,
ein Beispiel, das Principal Component Regression und Partial Least Squares vergleicht.

Gesamtlaufzeit des Skripts: (0 Minuten 14,909 Sekunden)

Verwandte Beispiele

Release Highlights für scikit-learn 0.23

Release Highlights für scikit-learn 0.22

Release Highlights für scikit-learn 1.0

Release Highlights für scikit-learn 1.2

Galerie generiert von Sphinx-Gallery

	estimator estimator: estimator object Ein Estimator-Objekt, das `fit` und `predict_proba` implementiert. Der Aufruf der `fit`-Methode trainiert eine Kopie des übergebenen Estimators, die im `estimator_`-Attribut gespeichert wird. .. versionadded:: 1.6 `estimator` wurde hinzugefügt, um `base_estimator` zu ersetzen.	SVC(gamma='au...bability=True)
	threshold threshold: float, default=0.75 Der Entscheidungsschwellenwert für die Verwendung mit `criterion='threshold'`. Sollte in [0, 1) liegen. Bei Verwendung des Kriteriums `'threshold'` sollte ein :ref:`gut kalibrierter Klassifikator ` verwendet werden.	0.75
	criterion criterion: {'threshold', 'k_best'}, default='threshold' Das Auswahlkriterium, das zur Auswahl der Labels verwendet wird, die zum Trainingsdatensatz hinzugefügt werden sollen. Wenn `'threshold'`, werden Pseudo-Labels mit Vorhersagewahrscheinlichkeiten über `threshold` zum Datensatz hinzugefügt. Wenn `'k_best'`, werden die `k_best` Pseudo-Labels mit den höchsten Vorhersagewahrscheinlichkeiten zum Datensatz hinzugefügt. Bei Verwendung des Kriteriums `'threshold'` sollte ein :ref:`gut kalibrierter Klassifikator ` verwendet werden.	'threshold'
	k_best k_best: int, default=10 Die Anzahl der in jeder Iteration hinzuzufügenden Stichproben. Wird nur verwendet, wenn `criterion='k_best'`.	10
	max_iter max_iter: int oder None, default=10 Maximale Anzahl erlaubter Iterationen. Sollte größer oder gleich 0 sein. Wenn es `None` ist, wird der Klassifikator weiterhin Labels vorhersagen, bis keine neuen Pseudo-Labels hinzugefügt werden oder bis alle unbeschrifteten Stichproben beschriftet wurden.	10
	verbose verbose: bool, default=False Ausführliche Ausgabe aktivieren.	False

	C C: float, Standard=1.0 Regularisierungsparameter. Die Stärke der Regularisierung ist umgekehrt proportional zu C. Muss strikt positiv sein. Die Strafe ist eine quadratische l2-Strafe. Für eine intuitive Visualisierung der Auswirkungen der Skalierung des Regularisierungsparameters C siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_scale_c.py`.	1.0
	kernel kernel: {'linear', 'poly', 'rbf', 'sigmoid', 'precomputed'} oder callable, Standard='rbf' Gibt den zu verwendenden Kernel-Typ im Algorithmus an. Wenn keiner angegeben ist, wird 'rbf' verwendet. Wenn ein Callable angegeben ist, wird es verwendet, um die Kernel-Matrix aus Datenmatrizen vorab zu berechnen; diese Matrix sollte ein Array der Form ``(n_samples, n_samples)`` sein. Für eine intuitive Visualisierung verschiedener Kernel-Typen siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_kernels.py`.	'rbf'
	degree degree: int, Standard=3 Grad der polynomialen Kernel-Funktion ('poly'). Muss nicht-negativ sein. Ignoriert von allen anderen Kernels.	3
	gamma gamma: {'scale', 'auto'} oder float, Standard='scale' Kernel-Koeffizient für 'rbf', 'poly' und 'sigmoid'. - Wenn ``gamma='scale'`` (Standard) übergeben wird, verwendet es 1 / (n_features * X.var()) als Wert von gamma, - Wenn 'auto', verwendet es 1 / n_features - Wenn float, muss es nicht-negativ sein. .. versionchanged:: 0.22 Der Standardwert von ``gamma`` hat sich von 'auto' zu 'scale' geändert.	'auto'
	coef0 coef0: float, Standard=0.0 Unabhängiger Term in der Kernel-Funktion. Er ist nur bei 'poly' und 'sigmoid' signifikant.	0.0
	shrinking shrinking: bool, Standard=True Ob die Schrumpfungsheuristik verwendet werden soll. Siehe das :ref:`Benutzerhandbuch `.	True
	probability probability: bool, Standard=False Ob Wahrscheinlichkeitsschätzungen aktiviert werden sollen. Dies muss vor dem Aufruf von `fit` aktiviert werden und verlangsamt diese Methode, da sie intern eine 5-fache Kreuzvalidierung verwendet, und `predict_proba` kann inkonsistent mit `predict` sein. Lesen Sie mehr im :ref:`Benutzerhandbuch `.	True
	tol tol: float, Standard=1e-3 Toleranz für das Abbruchkriterium.	0.001
	cache_size cache_size: float, Standard=200 Gibt die Größe des Kernel-Caches an (in MB).	200
	class_weight class_weight: dict oder 'balanced', Standard=None Setzt den Parameter C der Klasse i auf class_weight[i]C für SVC. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch invers proportional zu den Klassenhäufigkeiten in den Eingabedaten als ``n_samples / (n_classes np.bincount(y))`` anzupassen.	None
	verbose verbose: bool, Standard=False Detaillierte Ausgabe aktivieren. Beachten Sie, dass diese Einstellung eine prozessweite Laufzeiteinstellung in libsvm nutzt, die, wenn sie aktiviert ist, in einem Multithreading-Kontext möglicherweise nicht richtig funktioniert.	False
	max_iter max_iter: int, Standard=-1 Harte Grenze für Iterationen innerhalb des Lösers oder -1 für keine Grenze.	-1
	decision_function_shape decision_function_shape: {'ovo', 'ovr'}, Standard='ovr' Gibt zurück, ob eine One-vs-Rest ('ovr') Entscheidungsfunktion der Form (n_samples, n_classes) wie bei allen anderen Klassifikatoren zurückgegeben werden soll, oder die ursprüngliche One-vs-One ('ovo') Entscheidungsfunktion von libsvm, die die Form (n_samples, n_classes * (n_classes - 1) / 2) hat. Beachten Sie jedoch, dass intern One-vs-One ('ovo') immer als Multi-Class-Strategie zum Trainieren von Modellen verwendet wird; eine ovr-Matrix wird nur aus der ovo-Matrix konstruiert. Der Parameter wird für die binäre Klassifikation ignoriert. .. versionchanged:: 0.19 decision_function_shape ist standardmäßig 'ovr'. .. versionadded:: 0.17 decision_function_shape='ovr' wird empfohlen. .. versionchanged:: 0.17 Deprecated decision_function_shape='ovo' und None.	'ovr'
	break_ties break_ties: bool, Standard=False Wenn true, ``decision_function_shape='ovr'`` und die Anzahl der Klassen > 2 ist, ``predict`` wird Bindungen gemäß den Konfidenzwerten von ``decision_function`` auflösen; andernfalls wird die erste Klasse unter den gebundenen Klassen zurückgegeben. Bitte beachten Sie, dass das Auflösen von Bindungen mit relativ hohen Rechenkosten im Vergleich zu einem einfachen Predict verbunden ist. Siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_tie_breaking.py` für ein Beispiel seiner Verwendung mit ``decision_function_shape='ovr'``. .. versionadded:: 0.22	False
	random_state random_state: int, RandomState-Instanz oder None, Standard=None Steuert die pseudo-zufällige Zahlengenerierung zum Mischen der Daten für Wahrscheinlichkeitsschätzungen. Ignoriert, wenn `probability` False ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None

	criterion criterion: {"squared_error", "friedman_mse", "absolute_error", "poisson"}, default="squared_error" Die Funktion zur Messung der Qualität einer Teilung. Unterstützte Kriterien sind "squared_error" für den mittleren quadratischen Fehler, der gleich der Varianzreduktion als Kriterium für die Merkmalsauswahl ist und den L2- Verlust durch den Mittelwert jedes Endknotens minimiert, "friedman_mse", der den mittleren quadratischen Fehler mit Friedmans Verbesserungs-Score für potenzielle Teilungen verwendet, "absolute_error" für den mittleren absoluten Fehler, der den L1-Verlust durch den Median jedes Endknotens minimiert, und "poisson", der die Reduzierung der halben mittleren Poisson-Devianz zur Suche nach Teilungen verwendet. .. versionadded:: 0.18 Kriterium für den mittleren absoluten Fehler (MAE). .. versionadded:: 0.24 Kriterium für die Poisson-Devianz.	'poisson'
	splitter splitter: {"best", "random"}, default="best" Die Strategie zur Auswahl der Teilung an jedem Knoten. Unterstützte Strategien sind "best" zur Auswahl der besten Teilung und "random" zur Auswahl der besten zufälligen Teilung.	'best'
	max_depth max_depth: int, default=None Die maximale Tiefe des Baumes. Wenn None, werden Knoten erweitert, bis alle Blätter rein sind oder bis alle Blätter weniger als min_samples_split Stichproben enthalten. Ein Beispiel dafür, wie ``max_depth`` das Modell beeinflusst, finden Sie unter :ref:`sphx_glr_auto_examples_tree_plot_tree_regression.py`.	None
	min_samples_split min_samples_split: int oder float, default=2 Die Mindestanzahl von Stichproben, die für einen internen Knoten zum Aufteilen erforderlich sind: - Wenn int, dann betrachten Sie `min_samples_split` als die Mindestanzahl. - Wenn float, dann ist `min_samples_split` ein Bruchteil und `ceil(min_samples_split * n_samples)` sind die Mindestanzahl von Stichproben für jeden Split. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	2
	min_samples_leaf min_samples_leaf: int oder float, default=1 Die Mindestanzahl von Stichproben, die an einem Blattknoten erforderlich sind. Ein Aufteilungspunkt in beliebiger Tiefe wird nur dann berücksichtigt, wenn er mindestens ``min_samples_leaf`` Trainingsstichproben in jedem der linken und rechten Zweige hinterlässt. Dies kann den Effekt haben, das Modell zu glätten, insbesondere bei der Regression. - Wenn int, dann betrachten Sie `min_samples_leaf` als die Mindestanzahl. - Wenn float, dann ist `min_samples_leaf` ein Bruchteil und `ceil(min_samples_leaf * n_samples)` sind die Mindestanzahl von Stichproben für jeden Knoten. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, Standard=0.0 Der minimale gewichtete Bruchteil der Gesamtsumme der Gewichte (aller Eingangsstichproben), der in einem Blattknoten erforderlich ist. Stichproben haben gleiches Gewicht, wenn sample_weight nicht angegeben ist.	0.0
	max_features max_features: int, float oder {"sqrt", "log2"}, default=None Die Anzahl der Merkmale, die bei der Suche nach der besten Teilung berücksichtigt werden: - Wenn int, werden `max_features` Merkmale bei jeder Teilung berücksichtigt. - Wenn float, dann ist `max_features` ein Bruch und `max(1, int(max_features * n_features_in_))` Merkmale werden bei jeder Teilung berücksichtigt. - Wenn "sqrt", dann ist `max_features=sqrt(n_features)`. - Wenn "log2", dann ist `max_features=log2(n_features)`. - Wenn None, dann ist `max_features=n_features`. Hinweis: Die Suche nach einer Teilung stoppt nicht, bis mindestens eine gültige Partition der Knotenstichproben gefunden wurde, selbst wenn dies erfordert, mehr als ``max_features`` Merkmale zu inspizieren.	None
	random_state random_state: int, RandomState-Instanz oder None, default=None Steuert die Zufälligkeit des Schätzers. Die Merkmale werden immer bei jeder Teilung zufällig permutiert, auch wenn ``splitter`` auf ``"best"`` gesetzt ist. Wenn ``max_features < n_features``, wählt der Algorithmus bei jeder Teilung zufällig ``max_features`` aus, bevor die beste Teilung unter ihnen gefunden wird. Aber die gefundene beste Teilung kann bei verschiedenen Läufen variieren, auch wenn ``max_features=n_features`` ist. Das ist der Fall, wenn die Verbesserung des Kriteriums für mehrere Teilungen identisch ist und eine Teilung zufällig ausgewählt werden muss. Um ein deterministisches Verhalten während des Trainings zu erzielen, muss ``random_state`` auf eine Ganzzahl gesetzt werden. Siehe :term:`Glossary ` für Details.	0
	max_leaf_nodes max_leaf_nodes: int, default=None Wächst einen Baum im Best-First-Verfahren mit ``max_leaf_nodes``. Beste Knoten sind definiert als relative Reduzierung der Unreinheit. Wenn None, dann unbegrenzte Anzahl von Blattknoten.	None
	min_impurity_decrease min_impurity_decrease: float, Standard=0.0 Ein Knoten wird geteilt, wenn diese Teilung eine Verringerung der Unreinheit von größer oder gleich diesem Wert bewirkt. Die Gleichung für die gewichtete Verringerung der Unreinheit lautet: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) wobei ``N`` die Gesamtzahl der Stichproben, ``N_t`` die Anzahl der Stichproben am aktuellen Knoten, ``N_t_L`` die Anzahl der Stichproben im linken Kind und ``N_t_R`` die Anzahl der Stichproben im rechten Kind ist. ``N``, ``N_t``, ``N_t_R`` und ``N_t_L`` beziehen sich alle auf die gewichtete Summe, wenn ``sample_weight`` übergeben wird. .. versionadded:: 0.19	0.0
	ccp_alpha ccp_alpha: nicht-negative Gleitkommazahl, default=0.0 Komplexitätsparameter für Minimal Cost-Complexity Pruning. Der Teilbaum mit der größten Kostenkomplexität, die kleiner ist als ``ccp_alpha``, wird ausgewählt. Standardmäßig erfolgt kein Pruning. Siehe :ref:`minimal_cost_complexity_pruning` für Details. Siehe :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` für ein Beispiel für ein solches Pruning. .. versionadded:: 0.22	0.0
	monotonic_cst monotonic_cst: array-like von int der Form (n_features), default=None Gibt die Monotonie-Beschränkung an, die für jedes Merkmal erzwungen werden soll. - 1: monoton steigend - 0: keine Beschränkung - -1: monoton fallend Wenn monotonic_cst None ist, werden keine Beschränkungen angewendet. Monotonie-Beschränkungen werden nicht unterstützt für: - Multi-Output-Regressionen (d. h. wenn `n_outputs_ > 1`), - Regressionen, die auf Daten mit fehlenden Werten trainiert wurden. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 1.4	None