Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Pipelines anzeigen#

Die Standardkonfiguration für die Anzeige einer Pipeline in einem Jupyter Notebook ist 'diagram', wobei set_config(display='diagram') verwendet wird. Um die HTML-Darstellung zu deaktivieren, verwenden Sie set_config(display='text').

Um detailliertere Schritte in der Visualisierung der Pipeline zu sehen, klicken Sie auf die Schritte in der Pipeline.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Anzeigen einer Pipeline mit einem Vorverarbeitungsschritt und Klassifikator#

Dieser Abschnitt erstellt eine Pipeline mit einem Vorverarbeitungsschritt, StandardScaler, und einem Klassifikator, LogisticRegression, und zeigt deren visuelle Darstellung an.

from sklearn import set_config
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler

steps = [
    ("preprocessing", StandardScaler()),
    ("classifier", LogisticRegression()),
]
pipe = Pipeline(steps)

Zur Visualisierung des Diagramms ist die Standardeinstellung display='diagram'.

set_config(display="diagram")
pipe  # click on the diagram below to see the details of each step

Pipeline(steps=[('preprocessing', StandardScaler()),
                ('classifier', LogisticRegression())])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Um die Text-Pipeline anzuzeigen, ändern Sie auf display='text'.

set_config(display="text")
pipe

Pipeline(steps=[('preprocessing', StandardScaler()),
                ('classifier', LogisticRegression())])

Standardanzeige wiederherstellen

set_config(display="diagram")

Anzeigen einer Pipeline, die mehrere Vorverarbeitungsschritte & Klassifikator verknüpft#

Dieser Abschnitt erstellt eine Pipeline mit mehreren Vorverarbeitungsschritten, PolynomialFeatures und StandardScaler, und einem Klassifikatorschritt, LogisticRegression, und zeigt deren visuelle Darstellung an.

from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures, StandardScaler

steps = [
    ("standard_scaler", StandardScaler()),
    ("polynomial", PolynomialFeatures(degree=3)),
    ("classifier", LogisticRegression(C=2.0)),
]
pipe = Pipeline(steps)
pipe  # click on the diagram below to see the details of each step

Pipeline(steps=[('standard_scaler', StandardScaler()),
                ('polynomial', PolynomialFeatures(degree=3)),
                ('classifier', LogisticRegression(C=2.0))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Anzeigen einer Pipeline mit Dimensionsreduktion und Klassifikator#

Dieser Abschnitt erstellt eine Pipeline mit einem Dimensionsreduktionsschritt, PCA, einem Klassifikator, SVC, und zeigt deren visuelle Darstellung an.

from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
from sklearn.svm import SVC

steps = [("reduce_dim", PCA(n_components=4)), ("classifier", SVC(kernel="linear"))]
pipe = Pipeline(steps)
pipe  # click on the diagram below to see the details of each step

Pipeline(steps=[('reduce_dim', PCA(n_components=4)),
                ('classifier', SVC(kernel='linear'))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Anzeigen einer komplexen Pipeline, die einen Spaltentransformer verknüpft#

Dieser Abschnitt erstellt eine komplexe Pipeline mit einem ColumnTransformer und einem Klassifikator, LogisticRegression, und zeigt deren visuelle Darstellung an.

import numpy as np

from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline, make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler

numeric_preprocessor = Pipeline(
    steps=[
        ("imputation_mean", SimpleImputer(missing_values=np.nan, strategy="mean")),
        ("scaler", StandardScaler()),
    ]
)

categorical_preprocessor = Pipeline(
    steps=[
        (
            "imputation_constant",
            SimpleImputer(fill_value="missing", strategy="constant"),
        ),
        ("onehot", OneHotEncoder(handle_unknown="ignore")),
    ]
)

preprocessor = ColumnTransformer(
    [
        ("categorical", categorical_preprocessor, ["state", "gender"]),
        ("numerical", numeric_preprocessor, ["age", "weight"]),
    ]
)

pipe = make_pipeline(preprocessor, LogisticRegression(max_iter=500))
pipe  # click on the diagram below to see the details of each step

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(transformers=[('categorical',
                                                  Pipeline(steps=[('imputation_constant',
                                                                   SimpleImputer(fill_value='missing',
                                                                                 strategy='constant')),
                                                                  ('onehot',
                                                                   OneHotEncoder(handle_unknown='ignore'))]),
                                                  ['state', 'gender']),
                                                 ('numerical',
                                                  Pipeline(steps=[('imputation_mean',
                                                                   SimpleImputer()),
                                                                  ('scaler',
                                                                   StandardScaler())]),
                                                  ['age', 'weight'])])),
                ('logisticregression', LogisticRegression(max_iter=500))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('preprocessing', ...), ('classifier', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	copy copy: bool, Standard=True Wenn False, versuchen Sie, eine Kopie zu vermeiden und stattdessen direkt zu skalieren. Dies ist nicht garantiert, dass es immer direkt funktioniert; z.B. wenn die Daten kein NumPy-Array oder eine scipy.sparse CSR-Matrix sind, kann immer noch eine Kopie zurückgegeben werden.	True
	with_mean with_mean: bool, Standard=True Wenn True, zentrieren Sie die Daten vor der Skalierung. Dies funktioniert nicht (und löst eine Ausnahme aus), wenn versucht, auf Sparse-Matrizen angewendet zu werden, da deren Zentrierung den Aufbau einer dichten Matrix erfordert, die in gängigen Anwendungsfällen wahrscheinlich zu groß ist, um in den Speicher zu passen.	True
	with_std with_std: bool, Standard=True Wenn True, skalieren Sie die Daten auf Einheitsvarianz (oder äquivalent, Einheitsstandardabweichung).	True

	penalty penalty: {'l1', 'l2', 'elasticnet', None}, default='l2' Gibt die Norm der Strafe an: - `None`: keine Strafe wird hinzugefügt; - `'l2'`: fügt einen L2-Strafbegriff hinzu und ist die Standardwahl; - `'l1'`: fügt einen L1-Strafbegriff hinzu; - `'elasticnet'`: beide L1- und L2-Strafbegriffe werden hinzugefügt. .. warning:: Einige Strafen funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionadded:: 0.19 l1-Strafe mit SAGA-Solver (erlaubt 'multinomial' + L1) .. deprecated:: 1.8 `penalty` wurde in Version 1.8 als veraltet markiert und wird in 1.10 entfernt. Verwenden Sie stattdessen `l1_ratio`. `l1_ratio=0` für `penalty='l2'`, `l1_ratio=1` für `penalty='l1'` und `l1_ratio` auf eine Gleitkommazahl zwischen 0 und 1 gesetzt für `'penalty='elasticnet'`.	'deprecated'
	C C: float, default=1.0 Kehrwert der Regularisierungsstärke; muss eine positive Gleitkommazahl sein. Wie bei Support Vector Machines geben kleinere Werte eine stärkere Regularisierung an. `C=np.inf` führt zu ungestrafter logistischer Regression. Für ein visuelles Beispiel der Auswirkung der Abstimmung des Parameters `C` mit einer L1-Strafe siehe: :ref:`sphx_glr_auto_examples_linear_model_plot_logistic_path.py`.	1.0
	l1_ratio l1_ratio: float, default=0.0 Der Elastic-Net-Mischungsparameter, mit `0 <= l1_ratio <= 1`. Das Setzen von `l1_ratio=1` ergibt eine reine L1-Strafe, das Setzen von `l1_ratio=0` eine reine L2-Strafe. Jeder Wert zwischen 0 und 1 ergibt eine Elastic-Net-Strafe der Form `l1_ratio * L1 + (1 - l1_ratio) * L2`. .. warning:: Bestimmte Werte von `l1_ratio`, d. h. einige Strafen, funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionchanged:: 1.8 Der Standardwert wurde von None auf 0.0 geändert. .. deprecated:: 1.8 `None` ist veraltet und wird in Version 1.10 entfernt. Verwenden Sie immer `l1_ratio`, um den Strafentyp anzugeben.	0.0
	dual dual: bool, default=False Duale (beschränkte) oder primale (regularisierte, siehe auch :ref:`diese Gleichung `) Formulierung. Die duale Formulierung ist nur für die L2-Strafe mit dem liblinear-Solver implementiert. Bevorzugen Sie `dual=False` wenn n_samples > n_features.	False
	tol tol: float, default=1e-4 Toleranz für Abbruchkriterien.	0.0001
	fit_intercept fit_intercept: bool, default=True Gibt an, ob eine Konstante (auch Bias oder Achsenabschnitt genannt) zur Entscheidungsfunktion hinzugefügt werden soll.	True
	intercept_scaling intercept_scaling: float, default=1 Nur nützlich, wenn der Solver `liblinear` verwendet wird und `self.fit_intercept` auf `True` gesetzt ist. In diesem Fall wird `x` zu `[x, self.intercept_scaling]`, d. h. ein "synthetisches" Merkmal mit konstantem Wert gleich `intercept_scaling` wird an den Instanzvektor angehängt. Der Achsenabschnitt wird dann ``intercept_scaling * synthetisches Merkmalsgewicht``. .. note:: Das Gewicht des synthetischen Merkmals unterliegt der L1- oder L2- Regularisierung wie alle anderen Merkmale. Um die Auswirkung der Regularisierung auf das synthetische Merkmalsgewicht (und damit auf den Achsenabschnitt) zu verringern, muss `intercept_scaling` erhöht werden.	1
	class_weight class_weight: dict oder 'balanced', default=None Mit Klassen assoziierte Gewichte in der Form ``{class_label: weight}``. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch invers proportional zu den Klassenhaüfigkeiten in den Eingabedaten als ``n_samples / (n_classes * np.bincount(y))`` anzupassen. Beachten Sie, dass diese Gewichte mit sample_weight (übergeben durch die fit-Methode) multipliziert werden, wenn sample_weight angegeben ist. .. versionadded:: 0.17 class_weight='balanced'	None
	random_state random_state: int, RandomState-Instanz, default=None Wird verwendet, wenn ``solver`` == 'sag', 'saga' oder 'liblinear', um die Daten zu mischen. Siehe :term:`Glossar ` für Details.	None
	solver solver: {'lbfgs', 'liblinear', 'newton-cg', 'newton-cholesky', 'sag', 'saga'}, default='lbfgs' Algorithmus zur Verwendung im Optimierungsproblem. Standard ist 'lbfgs'. Zur Auswahl eines Solvers sollten Sie die folgenden Aspekte berücksichtigen: - 'lbfgs' ist ein guter Standard-Solver, da er für eine breite Klasse von Problemen gut funktioniert. - Für :term:`multiclass` Probleme (`n_klassen >= 3`) minimieren alle Solver außer 'liblinear' den vollständigen multinominalen Verlust; 'liblinear' löst einen Fehler aus. - 'newton-cholesky' ist eine gute Wahl für `n_samples` >> `n_features * n_classes`, insbesondere mit One-Hot-kodierten kategorialen Merkmalen mit seltenen Kategorien. Beachten Sie, dass der Speicherbedarf dieses Solvers eine quadratische Abhängigkeit von `n_features * n_classes` hat, da er explizit die vollständige Hesse-Matrix berechnet. - Für kleine Datensätze ist 'liblinear' eine gute Wahl, während 'sag' und 'saga' für große Datensätze schneller sind; - 'liblinear' kann standardmäßig nur binäre Klassifizierung verarbeiten. Um ein One-vs-Rest-Schema für den Multiklassenfall anzuwenden, kann es mit der :class:`~sklearn.multiclass.OneVsRestClassifier`-Klasse umhüllt werden. .. warning:: Die Wahl des Algorithmus hängt von der gewählten Strafe ab (`l1_ratio=0` für L2-Strafe, `l1_ratio=1` für L1-Strafe und `0 < l1_ratio < 1` für Elastic-Net) und von der Unterstützung von (multinomialen) Multiklassenproblemen: ================= ======================== ====================== solver l1_ratio multinomial multiclass ================= ======================== ====================== 'lbfgs' l1_ratio=0 ja 'liblinear' l1_ratio=1 oder l1_ratio=0 nein 'newton-cg' l1_ratio=0 ja 'newton-cholesky' l1_ratio=0 ja 'sag' l1_ratio=0 ja 'saga' 0<=l1_ratio<=1 ja ================= ======================== ====================== .. note:: Die schnelle Konvergenz von 'sag' und 'saga' ist nur garantiert für Merkmale mit ungefähr gleicher Skalierung. Sie können die Daten mit einem Skalierer aus :mod:`sklearn.preprocessing` vorverarbeiten. .. seealso:: Informationen zu :class:`LogisticRegression` und insbesondere zur :ref:`Tabelle ` finden Sie im :ref:`Benutzerhandbuch `, die die Solver/Strafenunterstützung zusammenfasst. .. versionadded:: 0.17 Stochastic Average Gradient (SAG) Descent Solver. Unterstützung für Multiklassenprobleme in Version 0.18. .. versionadded:: 0.19 SAGA Solver. .. versionchanged:: 0.22 Der Standard-Solver wurde in 0.22 von 'liblinear' auf 'lbfgs' geändert. .. versionadded:: 1.2 Newton-Cholesky Solver. Unterstützung für Multiklassenprobleme in Version 1.6.	'lbfgs'
	max_iter max_iter: int, default=100 Maximale Anzahl von Iterationen, die die Solver zur Konvergenz benötigen.	100
	verbose verbose: int, default=0 Für die Solver liblinear und lbfgs setzen Sie verbose auf eine beliebige positive Zahl für die Ausführlichkeit.	0
	warm_start warm_start: bool, default=False Wenn auf True gesetzt, wird die Lösung des vorherigen Aufrufs von fit als Initialisierung wiederverwendet, andernfalls wird die vorherige Lösung einfach gelöscht. Nützlich für den liblinear-Solver. Siehe :term:`das Glossar `. .. versionadded:: 0.17 warm_start zur Unterstützung der Solver lbfgs, newton-cg, sag, saga.	False
	n_jobs n_jobs: int, default=None Hat keine Auswirkung. .. deprecated:: 1.8 `n_jobs` ist in Version 1.8 veraltet und wird in 1.10 entfernt.	None

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('standard_scaler', ...), ('polynomial', ...), ...]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	copy copy: bool, Standard=True Wenn False, versuchen Sie, eine Kopie zu vermeiden und stattdessen direkt zu skalieren. Dies ist nicht garantiert, dass es immer direkt funktioniert; z.B. wenn die Daten kein NumPy-Array oder eine scipy.sparse CSR-Matrix sind, kann immer noch eine Kopie zurückgegeben werden.	True
	with_mean with_mean: bool, Standard=True Wenn True, zentrieren Sie die Daten vor der Skalierung. Dies funktioniert nicht (und löst eine Ausnahme aus), wenn versucht, auf Sparse-Matrizen angewendet zu werden, da deren Zentrierung den Aufbau einer dichten Matrix erfordert, die in gängigen Anwendungsfällen wahrscheinlich zu groß ist, um in den Speicher zu passen.	True
	with_std with_std: bool, Standard=True Wenn True, skalieren Sie die Daten auf Einheitsvarianz (oder äquivalent, Einheitsstandardabweichung).	True

Pipelines anzeigen#

Anzeigen einer Pipeline mit einem Vorverarbeitungsschritt und Klassifikator#

Anzeigen einer Pipeline, die mehrere Vorverarbeitungsschritte & Klassifikator verknüpft#

Anzeigen einer Pipeline mit Dimensionsreduktion und Klassifikator#

Anzeigen einer komplexen Pipeline, die einen Spaltentransformer verknüpft#

Anzeigen einer Grid-Suche über eine Pipeline mit einem Klassifikator#

Diese Seite

	degree degree: int oder Tuple (min_degree, max_degree), default=2 Wenn ein einzelner Integer angegeben wird, gibt er den maximalen Grad der Polynommerkmale an. Wenn ein Tupel `(min_degree, max_degree)` übergeben wird, dann ist `min_degree` das Minimum und `max_degree` das Maximum des Polynomgrads der generierten Merkmale. Beachten Sie, dass `min_degree=0` und `min_degree=1` äquivalent sind, da die Ausgabe des Polynomgrads Null durch `include_bias` bestimmt wird.	3
	interaction_only interaction_only: bool, default=False Wenn `True`, werden nur Interaktionsmerkmale erzeugt: Merkmale, die Produkte von höchstens `degree` unterschiedlichen Eingabemerkmalen sind, d.h. Terme mit Potenz von 2 oder höher desselben Eingabemerkmals werden ausgeschlossen: - eingeschlossen: `x[0]`, `x[1]`, `x[0] * x[1]`, usw. - ausgeschlossen: `x[0] 2`, `x[0] 2 * x[1]`, usw.	False
	include_bias include_bias: bool, default=True Wenn `True` (Standard), dann fügen Sie eine Bias-Spalte hinzu, das Merkmal, in dem alle Polynompotenzen Null sind (d.h. eine Spalte von Einsen - fungiert als ein Achsenabschnittsterm in einem linearen Modell).	True
	order order: {'C', 'F'}, default='C' Reihenfolge des Ausgabe-Arrays im dichten Fall. `'F'`-Reihenfolge ist schneller zu berechnen, kann aber nachfolgende Estimators verlangsamen. .. versionadded:: 0.21	'C'

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('reduce_dim', ...), ('classifier', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	n_components n_components: int, float oder 'mle', default=None Anzahl der zu behaltenden Komponenten. Wenn n_components nicht gesetzt ist, werden alle Komponenten beibehalten:: n_components == min(n_samples, n_features) Wenn ``n_components == 'mle'`` und ``svd_solver == 'full'``, wird Minka's MLE verwendet, um die Dimension zu erraten. Die Verwendung von ``n_components == 'mle'`` interpretiert ``svd_solver == 'auto'`` als ``svd_solver == 'full'``. Wenn ``0 < n_components < 1`` und ``svd_solver == 'full'``, werden die Anzahl der Komponenten so ausgewählt, dass der zu erklärende Varianzbetrag größer als der durch n_components angegebene Prozentsatz ist. Wenn ``svd_solver == 'arpack'``, muss die Anzahl der Komponenten strikt kleiner als das Minimum von n_features und n_samples sein. Daher ergibt der Fall None:: n_components == min(n_samples, n_features) - 1	4
	copy copy: bool, default=True Wenn False, werden die an fit übergebenen Daten überschrieben und das Ausführen von fit(X).transform(X) liefert nicht die erwarteten Ergebnisse. Verwenden Sie stattdessen fit_transform(X).	True
	whiten whiten: bool, default=False Wenn True (standardmäßig False), werden die `components_`-Vektoren mit der Quadratwurzel von n_samples multipliziert und dann durch die Singulärwerte geteilt, um unkorrelierte Ausgaben mit Einheitskomponentenvarianzen zu gewährleisten. Das Whitening entfernt einige Informationen aus dem transformierten Signal (die relativen Varianzskalen der Komponenten), kann aber manchmal die Vorhersagegenauigkeit nachgeschalteter Estimator verbessern, indem sie die Daten einige hartkodierte Annahmen respektieren lassen.	False
	svd_solver svd_solver: {'auto', 'full', 'covariance_eigh', 'arpack', 'randomized'}, default='auto' "auto" : Der Solver wird nach einer Standardrichtlinie 'auto' basierend auf `X.shape` und `n_components` ausgewählt: Wenn die Eingabedaten weniger als 1000 Merkmale haben und mehr als 10-mal so viele Samples, dann wird der Solver "covariance_eigh" verwendet. Andernfalls, wenn die Eingabedaten größer als 500x500 sind und die Anzahl der zu extrahierenden Komponenten kleiner als 80% der kleinsten Dimension der Daten ist, dann wird die effizientere "randomized"-Methode ausgewählt. Andernfalls wird die exakte "full" SVD berechnet und optional danach gekürzt. "full" : Führt eine exakte vollständige SVD unter Verwendung des Standard-LAPACK-Solvers über `scipy.linalg.svd` aus und wählt die Komponenten durch Nachbearbeitung aus. "covariance_eigh" : Berechnet vorab die Kovarianzmatrix (auf zentrierten Daten), führt eine klassische Eigenwertzerlegung der Kovarianzmatrix durch, typischerweise unter Verwendung von LAPACK, und wählt die Komponenten durch Nachbearbeitung aus. Dieser Solver ist sehr effizient für n_samples >> n_features und kleine n_features. Er ist jedoch sonst für große n_features nicht handhabbar (großer Speicherbedarf zur Materialisierung der Kovarianzmatrix). Beachten Sie auch, dass dieser Solver im Vergleich zum "full"-Solver die Konditionszahl effektiv verdoppelt und daher weniger numerisch stabil ist (z. B. bei Eingabedaten mit einem großen Bereich von singulären Werten). "arpack" : Führt eine auf `n_components` gekürzte SVD unter Verwendung des ARPACK-Solvers über `scipy.sparse.linalg.svds` aus. Erfordert strikt `0 < n_components < min(X.shape)`. "randomized" : Führt eine randomisierte SVD nach der Methode von Halko et al. aus. .. versionadded:: 0.18.0 .. versionchanged:: 1.5 Der 'covariance_eigh'-Solver wurde hinzugefügt.	'auto'
	tol tol: float, default=0.0 Toleranz für Singulärwerte, die von svd_solver == 'arpack' berechnet werden. Muss im Bereich [0.0, unendlich) liegen. .. versionadded:: 0.18.0	0.0
	iterated_power iterated_power: int oder 'auto', default='auto' Anzahl der Iterationen für die Potenzmethode, berechnet durch svd_solver == 'randomized'. Muss im Bereich [0, unendlich) liegen. .. versionadded:: 0.18.0	'auto'
	n_oversamples n_oversamples: int, default=10 Dieser Parameter ist nur relevant, wenn `svd_solver="randomized"`. Er entspricht der zusätzlichen Anzahl von Zufallsvektoren, um den Bereich von `X` abzutasten und eine ordnungsgemäße Konditionierung zu gewährleisten. Siehe :func:`~sklearn.utils.extmath.randomized_svd` für weitere Details. .. versionadded:: 1.1	10
	power_iteration_normalizer power_iteration_normalizer: {'auto', 'QR', 'LU', 'none'}, default='auto' Potenziterationsnormalisierer für den randomisierten SVD-Solver. Wird nicht von ARPACK verwendet. Siehe :func:`~sklearn.utils.extmath.randomized_svd` für weitere Details. .. versionadded:: 1.1	'auto'
	random_state random_state: int, RandomState-Instanz oder None, default=None Wird verwendet, wenn die Solver 'arpack' oder 'randomized' verwendet werden. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe :term:`Glossar `. .. versionadded:: 0.18.0	None

	C C: float, Standard=1.0 Regularisierungsparameter. Die Stärke der Regularisierung ist umgekehrt proportional zu C. Muss strikt positiv sein. Die Strafe ist eine quadratische l2-Strafe. Für eine intuitive Visualisierung der Auswirkungen der Skalierung des Regularisierungsparameters C siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_scale_c.py`.	1.0
	kernel kernel: {'linear', 'poly', 'rbf', 'sigmoid', 'precomputed'} oder callable, Standard='rbf' Gibt den zu verwendenden Kernel-Typ im Algorithmus an. Wenn keiner angegeben ist, wird 'rbf' verwendet. Wenn ein Callable angegeben ist, wird es verwendet, um die Kernel-Matrix aus Datenmatrizen vorab zu berechnen; diese Matrix sollte ein Array der Form ``(n_samples, n_samples)`` sein. Für eine intuitive Visualisierung verschiedener Kernel-Typen siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_kernels.py`.	'linear'
	degree degree: int, Standard=3 Grad der polynomialen Kernel-Funktion ('poly'). Muss nicht-negativ sein. Ignoriert von allen anderen Kernels.	3
	gamma gamma: {'scale', 'auto'} oder float, Standard='scale' Kernel-Koeffizient für 'rbf', 'poly' und 'sigmoid'. - Wenn ``gamma='scale'`` (Standard) übergeben wird, verwendet es 1 / (n_features * X.var()) als Wert von gamma, - Wenn 'auto', verwendet es 1 / n_features - Wenn float, muss es nicht-negativ sein. .. versionchanged:: 0.22 Der Standardwert von ``gamma`` hat sich von 'auto' zu 'scale' geändert.	'scale'
	coef0 coef0: float, Standard=0.0 Unabhängiger Term in der Kernel-Funktion. Er ist nur bei 'poly' und 'sigmoid' signifikant.	0.0
	shrinking shrinking: bool, Standard=True Ob die Schrumpfungsheuristik verwendet werden soll. Siehe das :ref:`Benutzerhandbuch `.	True
	probability probability: bool, Standard=False Ob Wahrscheinlichkeitsschätzungen aktiviert werden sollen. Dies muss vor dem Aufruf von `fit` aktiviert werden und verlangsamt diese Methode, da sie intern eine 5-fache Kreuzvalidierung verwendet, und `predict_proba` kann inkonsistent mit `predict` sein. Lesen Sie mehr im :ref:`Benutzerhandbuch `.	False
	tol tol: float, Standard=1e-3 Toleranz für das Abbruchkriterium.	0.001
	cache_size cache_size: float, Standard=200 Gibt die Größe des Kernel-Caches an (in MB).	200
	class_weight class_weight: dict oder 'balanced', Standard=None Setzt den Parameter C der Klasse i auf class_weight[i]C für SVC. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch invers proportional zu den Klassenhäufigkeiten in den Eingabedaten als ``n_samples / (n_classes np.bincount(y))`` anzupassen.	None
	verbose verbose: bool, Standard=False Detaillierte Ausgabe aktivieren. Beachten Sie, dass diese Einstellung eine prozessweite Laufzeiteinstellung in libsvm nutzt, die, wenn sie aktiviert ist, in einem Multithreading-Kontext möglicherweise nicht richtig funktioniert.	False
	max_iter max_iter: int, Standard=-1 Harte Grenze für Iterationen innerhalb des Lösers oder -1 für keine Grenze.	-1
	decision_function_shape decision_function_shape: {'ovo', 'ovr'}, Standard='ovr' Gibt zurück, ob eine One-vs-Rest ('ovr') Entscheidungsfunktion der Form (n_samples, n_classes) wie bei allen anderen Klassifikatoren zurückgegeben werden soll, oder die ursprüngliche One-vs-One ('ovo') Entscheidungsfunktion von libsvm, die die Form (n_samples, n_classes * (n_classes - 1) / 2) hat. Beachten Sie jedoch, dass intern One-vs-One ('ovo') immer als Multi-Class-Strategie zum Trainieren von Modellen verwendet wird; eine ovr-Matrix wird nur aus der ovo-Matrix konstruiert. Der Parameter wird für die binäre Klassifikation ignoriert. .. versionchanged:: 0.19 decision_function_shape ist standardmäßig 'ovr'. .. versionadded:: 0.17 decision_function_shape='ovr' wird empfohlen. .. versionchanged:: 0.17 Deprecated decision_function_shape='ovo' und None.	'ovr'
	break_ties break_ties: bool, Standard=False Wenn true, ``decision_function_shape='ovr'`` und die Anzahl der Klassen > 2 ist, ``predict`` wird Bindungen gemäß den Konfidenzwerten von ``decision_function`` auflösen; andernfalls wird die erste Klasse unter den gebundenen Klassen zurückgegeben. Bitte beachten Sie, dass das Auflösen von Bindungen mit relativ hohen Rechenkosten im Vergleich zu einem einfachen Predict verbunden ist. Siehe :ref:`sphx_glr_auto_examples_svm_plot_svm_tie_breaking.py` für ein Beispiel seiner Verwendung mit ``decision_function_shape='ovr'``. .. versionadded:: 0.22	False
	random_state random_state: int, RandomState-Instanz oder None, Standard=None Steuert die pseudo-zufällige Zahlengenerierung zum Mischen der Daten für Wahrscheinlichkeitsschätzungen. Ignoriert, wenn `probability` False ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('columntransformer', ...), ('logisticregression', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	transformers transformers: Liste von Tupeln Liste von (name, transformer, columns) Tupeln, die die auf Teilmengen der Daten anzuwendenden Transformer-Objekte spezifizieren. name : str Wie in Pipeline und FeatureUnion, ermöglicht dies das Setzen des Transformers und seiner Parameter mit ``set_params`` und die Suche in der Grid-Suche. transformer : {'drop', 'passthrough'} oder Estimator Der Estimator muss :term:`fit` und :term:`transform` unterstützen. Speziell behandelte Zeichenketten 'drop' und 'passthrough' werden ebenfalls akzeptiert, um anzugeben, dass die Spalten verworfen oder unverändert durchgelassen werden sollen. columns : str, Array-artig aus str, int, Array-artig aus int, Array-artig aus bool, Slice oder aufrufbar Indiziert die Daten auf ihrer zweiten Achse. Integer werden als Positionsspalten interpretiert, während Strings DataFrame-Spalten nach Namen referenzieren können. Ein Skalar-String oder Integer sollte verwendet werden, wenn ``transformer`` erwartet, dass X ein 1D-Array-artiges Objekt (Vektor) ist, andernfalls wird ein 2D-Array an den Transformer übergeben. Eine aufrufbare Funktion erhält die Eingabedaten `X` und kann jedes der oben genannten zurückgeben. Um mehrere Spalten nach Name oder Datentyp auszuwählen, können Sie :obj:`make_column_selector` verwenden.	[('categorical', ...), ('numerical', ...)]
	remainder remainder: {'drop', 'passthrough'} oder Schätzer, default='drop' Standardmäßig werden nur die in `transformers` spezifizierten Spalten transformiert und im Ergebnis kombiniert, und die nicht spezifizierten Spalten werden verworfen. (Standard von ``'drop'``). Durch Angabe von ``remainder='passthrough'`` werden alle verbleibenden Spalten, die nicht in `transformers` spezifiziert, aber in den an `fit` übergebenen Daten vorhanden waren, automatisch durchgelassen. Diese Teilmenge von Spalten wird mit dem Ergebnis der Transformer verkettet. Für DataFrames werden zusätzliche Spalten, die während `fit` nicht gesehen wurden, aus dem Ergebnis von `transform` ausgeschlossen. Durch Setzen von ``remainder`` auf einen Schätzer verwenden die verbleibenden nicht spezifizierten Spalten den ``remainder``-Schätzer. Der Schätzer muss :term:`fit` und :term:`transform` unterstützen. Beachten Sie, dass die Verwendung dieser Funktion erfordert, dass die DataFrame-Spalten bei `fit` und `transform` die gleiche Reihenfolge haben.	'drop'
	sparse_threshold sparse_threshold: float, default=0.3 Wenn die Ausgabe der verschiedenen Transformer dünnbesetzte Matrizen enthält, werden diese als dünnbesetzte Matrix gestapelt, wenn die Gesamtdichte geringer ist als dieser Wert. Verwenden Sie ``sparse_threshold=0``, um immer dicht zu liefern. Wenn die transformierte Ausgabe nur dichte Daten enthält, wird das gestapelte Ergebnis dicht sein, und dieses Schlüsselwort wird ignoriert.	0.3
	n_jobs n_jobs: int, default=None Anzahl der parallel auszuführenden Jobs. ``None`` bedeutet 1, es sei denn, es befindet sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet, alle Prozessoren zu verwenden. Siehe :term:`Glossar ` für weitere Details.	None
	transformer_weights transformer_weights: dict, default=None Multiplikative Gewichte für Merkmale pro Transformer. Die Ausgabe des Transformers wird mit diesen Gewichten multipliziert. Schlüssel sind Transformer-Namen, Werte die Gewichte.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Transformators gedruckt, wenn er abgeschlossen ist.	False
	verbose_feature_names_out verbose_feature_names_out: bool, str oder Callable[[str, str], str], default=True - Wenn True, wird :meth:`ColumnTransformer.get_feature_names_out` allen Merkmalnamen den Namen des Transformers voranstellen, der dieses Merkmal generiert hat. Dies ist äquivalent zu `verbose_feature_names_out="{transformer_name}__{feature_name}"`. - Wenn False, wird :meth:`ColumnTransformer.get_feature_names_out` keine Merkmalnamen voranstellen und einen Fehler auslösen, wenn die Merkmalnamen nicht eindeutig sind. - Wenn ``Callable[[str, str], str]``, wird :meth:`ColumnTransformer.get_feature_names_out` alle Merkmale umbenennen, indem der Name des Transformers verwendet wird. Das erste Argument des Callables ist der Transformer-Name und das zweite Argument ist der Merkmalname. Der zurückgegebene String ist der neue Merkmalname. - Wenn ``str``, muss es eine formatierbare Zeichenkette sein. Die gegebene Zeichenkette wird mit zwei Feldnamen formatiert: ``transformer_name`` und ``feature_name``. z. B. ``"{feature_name}__{transformer_name}"``. Weitere Informationen finden Sie in der :meth:`str.format`-Methode aus der Standardbibliothek. .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` kann ein Callable oder eine zu formatierende Zeichenkette sein.	True
	force_int_remainder_cols force_int_remainder_cols: bool, default=False Dieser Parameter hat keine Auswirkung. .. note:: Wenn Sie nicht auf die Liste der Spalten für die verbleibenden Spalten im ``transformers_`` angepassten Attribut zugreifen, müssen Sie diesen Parameter nicht setzen. .. versionadded:: 1.5 .. versionchanged:: 1.7 Der Standardwert für `force_int_remainder_cols` ändert sich von `True` auf `False` in Version 1.7. .. deprecated:: 1.7 `force_int_remainder_cols` ist veraltet und wird in Version 1.9 entfernt.	'deprecated'

	missing_values missing_values: int, float, str, np.nan, None oder pandas.NA, Standard=np.nan Der Platzhalter für die fehlenden Werte. Alle Vorkommen von `missing_values` werden imputiert. Für Pandas-DataFrames mit nullbaren Integer-Datentypen mit fehlenden Werten kann `missing_values` auf `np.nan` oder `pd.NA` gesetzt werden.	nan
	strategy strategy: str oder Callable, default='mean' Die Imputationsstrategie. - Wenn "mean", werden fehlende Werte mit dem Mittelwert entlang jeder Spalte ersetzt. Kann nur mit numerischen Daten verwendet werden. - Wenn "median", werden fehlende Werte mit dem Median entlang jeder Spalte ersetzt. Kann nur mit numerischen Daten verwendet werden. - Wenn "most_frequent", werden fehlende Werte mit dem häufigsten Wert entlang jeder Spalte ersetzt. Kann mit Zeichenketten oder numerischen Daten verwendet werden. Wenn es mehr als einen solchen Wert gibt, wird nur der kleinste zurückgegeben. - Wenn "constant", werden fehlende Werte mit fill_value ersetzt. Kann mit Zeichenketten oder numerischen Daten verwendet werden. - Wenn eine Instanz von Callable, werden fehlende Werte mit der skalaren Statistik ersetzt, die durch Ausführen des Callables auf einem dichten 1D- Array mit nicht fehlenden Werten jeder Spalte zurückgegeben wird. .. versionadded:: 0.20 strategy="constant" für die Imputation mit festem Wert. .. versionadded:: 1.5 strategy=callable für die Imputation mit benutzerdefinierten Werten.	'constant'
	fill_value fill_value: str oder numerischer Wert, Standard=None Wenn strategy == "constant", wird `fill_value` verwendet, um alle Vorkommen von missing_values zu ersetzen. Für Zeichenketten oder Objekt-Datentypen muss `fill_value` eine Zeichenkette sein. Wenn `None`, ist `fill_value` 0 bei der Imputation numerischer Daten und "missing_value" für Zeichenketten oder Objekt-Datentypen.	'missing'
	copy copy: bool, Standard=True Wenn True, wird eine Kopie von X erstellt. Wenn False, wird die Imputation nach Möglichkeit direkt durchgeführt. Beachten Sie, dass in den folgenden Fällen immer eine neue Kopie erstellt wird, auch wenn `copy=False` - Wenn `X` kein Array von Fließkommawerten ist; - Wenn `X` als CSR-Matrix kodiert ist; - Wenn `add_indicator=True`.	True
	add_indicator add_indicator: bool, Standard=False Wenn True, wird ein :class:`MissingIndicator` Transform an die Ausgabe des Imputers angehängt. Dies ermöglicht einem prädiktiven Schätzer, Fehlwerte trotz Imputation zu berücksichtigen. Wenn ein Merkmal zur Fit-/Trainingszeit keine fehlenden Werte hat, erscheint das Merkmal nicht im Fehlwertindikator, auch wenn zur Transformations-/Testzeit fehlende Werte vorhanden sind.	False
	keep_empty_features keep_empty_features: bool, Standard=False Wenn True, werden Merkmale, die ausschließlich aus fehlenden Werten bestehen, wenn `fit` aufgerufen wird, in den Ergebnissen zurückgegeben, wenn `transform` aufgerufen wird. Der imputierte Wert ist immer `0`, außer wenn `strategy="constant"`, in diesem Fall wird stattdessen `fill_value` verwendet. .. versionadded:: 1.2	False

	categories categories: 'auto' oder eine Liste von Arrays, Standard='auto' Kategorien (eindeutige Werte) pro Merkmal: - 'auto': Kategorien automatisch aus den Trainingsdaten ermitteln. - Liste: ``categories[i]`` enthält die erwarteten Kategorien in der i-ten Spalte. Die übergebenen Kategorien sollten keine Strings und numerischen Werte innerhalb eines Merkmals mischen und sollten bei numerischen Werten sortiert sein. Die verwendeten Kategorien finden Sie im Attribut ``categories_``. .. versionadded:: 0.20	'auto'
	drop drop: {'first', 'if_binary'} oder ein Array-ähnliches Objekt der Form (n_features,), default=None Spezifiziert eine Methode zum Verwerfen einer der Kategorien pro Merkmal. Dies ist nützlich in Situationen, in denen perfekt kollineare Merkmale Probleme verursachen, z. B. beim Zuführen der resultierenden Daten in ein nicht reguläres lineares Regressionsmodell. Das Verwerfen einer Kategorie bricht jedoch die Symmetrie der ursprünglichen Darstellung und kann daher zu einer Verzerrung in nachgelagerten Modellen führen, z. B. bei bestraften linearen Klassifikations- oder Regressionsmodellen. - None : Behalten Sie alle Merkmale bei (Standard). - 'first' : Verwerfen Sie die erste Kategorie in jedem Merkmal. Wenn nur eine Kategorie vorhanden ist, wird das Merkmal vollständig verworfen. - 'if_binary' : Verwerfen Sie die erste Kategorie in jedem Merkmal mit zwei Kategorien. Merkmale mit 1 oder mehr als 2 Kategorien bleiben unverändert. - Array : ``drop[i]`` ist die Kategorie im Merkmal ``X[:, i]``, die verworfen werden soll. Wenn `max_categories` oder `min_frequency` konfiguriert ist, um seltene Kategorien zu gruppieren, wird das Verwerfen nach der Gruppierung gehandhabt. .. versionadded:: 0.21 Der Parameter `drop` wurde in 0.21 hinzugefügt. .. versionchanged:: 0.23 Die Option `drop='if_binary'` wurde in 0.23 hinzugefügt. .. versionchanged:: 1.1 Unterstützung für das Verwerfen seltener Kategorien.	None
	sparse_output sparse_output: bool, Standard=True Wenn ``True``, wird eine :class:`scipy.sparse.csr_matrix` zurückgegeben, d. h. eine spärliche Matrix im "Compressed Sparse Row" (CSR)-Format. .. versionadded:: 1.2 `sparse` wurde in `sparse_output` umbenannt.	True
	dtype dtype: numerischer Typ, default=np.float64 Gewünschter dtype der Ausgabe.	<class 'numpy.float64'>
	handle_unknown handle_unknown: {'error', 'ignore', 'infrequent_if_exist', 'warn'}, default='error' Spezifiziert die Art und Weise, wie unbekannte Kategorien während :meth:`transform` behandelt werden. - 'error' : Löst einen Fehler aus, wenn während der Transformation eine unbekannte Kategorie vorhanden ist. - 'ignore' : Wenn während der Transformation eine unbekannte Kategorie angetroffen wird, sind die resultierenden One-Hot-kodierten Spalten für dieses Merkmal alle Nullen. Bei der inversen Transformation wird eine unbekannte Kategorie als None bezeichnet. - 'infrequent_if_exist' : Wenn während der Transformation eine unbekannte Kategorie angetroffen wird, werden die resultierenden One-Hot-kodierten Spalten für dieses Merkmal der seltenen Kategorie zugeordnet, falls diese existiert. Die seltene Kategorie wird der letzten Position in der Kodierung zugeordnet. Während der inversen Transformation wird eine unbekannte Kategorie der Kategorie `'infrequent'` zugeordnet, falls diese existiert. Wenn die Kategorie `'infrequent'` nicht existiert, dann behandelt :meth:`transform` und :meth:`inverse_transform` eine unbekannte Kategorie wie bei `handle_unknown='ignore'`. Seltene Kategorien existieren basierend auf `min_frequency` und `max_categories`. Lesen Sie mehr im :ref:`Benutzerhandbuch `. - 'warn' : Wenn während der Transformation eine unbekannte Kategorie angetroffen wird, wird eine Warnung ausgegeben und die Kodierung wird dann wie bei `handle_unknown="infrequent_if_exist"` fortgesetzt. .. versionchanged:: 1.1 `'infrequent_if_exist'` wurde hinzugefügt, um unbekannte Kategorien und seltene Kategorien automatisch zu behandeln. .. versionadded:: 1.6 Die Option `"warn"` wurde in 1.6 hinzugefügt.	'ignore'
	min_frequency min_frequency: int oder float, Standard=None Gibt die minimale Häufigkeit an, unterhalb derer eine Kategorie als selten betrachtet wird. - Wenn `int`, werden Kategorien mit geringerer Kardinalität als selten betrachtet. - Wenn `float`, werden Kategorien mit geringerer Kardinalität als `min_frequency * n_samples` als selten betrachtet. .. versionadded:: 1.1 Lesen Sie mehr im :ref:`Benutzerhandbuch `.	None
	max_categories max_categories: int, Standard=None Gibt eine Obergrenze für die Anzahl der Ausgabemerkmale pro Eingabe- Merkmal an, wenn seltene Kategorien berücksichtigt werden. Wenn es seltene Kategorien gibt, enthält `max_categories` die Kategorie, die die seltenen Kategorien repräsentiert, zusammen mit den häufigen Kategorien. Wenn `None`, gibt es keine Grenze für die Anzahl der Ausgabemerkmale. .. versionadded:: 1.1 Lesen Sie mehr im :ref:`Benutzerhandbuch `.	None
	feature_name_combiner feature_name_combiner: "concat" oder aufrufbar, Standard="concat" Aufrufbare Funktion mit der Signatur `def callable(input_feature, category)`, die einen String zurückgibt. Dies wird verwendet, um Merkmalsnamen zu erstellen, die von :meth:`get_feature_names_out` zurückgegeben werden. `"concat"` verkettet den kodierten Merkmalnamen und die Kategorie mit `feature + "_" + str(category)`. Z. B. erstellt das Merkmal X mit Werten 1, 6, 7 Merkmalnamen `X_1, X_6, X_7`. .. versionadded:: 1.3	'concat'

	missing_values missing_values: int, float, str, np.nan, None oder pandas.NA, Standard=np.nan Der Platzhalter für die fehlenden Werte. Alle Vorkommen von `missing_values` werden imputiert. Für Pandas-DataFrames mit nullbaren Integer-Datentypen mit fehlenden Werten kann `missing_values` auf `np.nan` oder `pd.NA` gesetzt werden.	nan
	strategy strategy: str oder Callable, default='mean' Die Imputationsstrategie. - Wenn "mean", werden fehlende Werte mit dem Mittelwert entlang jeder Spalte ersetzt. Kann nur mit numerischen Daten verwendet werden. - Wenn "median", werden fehlende Werte mit dem Median entlang jeder Spalte ersetzt. Kann nur mit numerischen Daten verwendet werden. - Wenn "most_frequent", werden fehlende Werte mit dem häufigsten Wert entlang jeder Spalte ersetzt. Kann mit Zeichenketten oder numerischen Daten verwendet werden. Wenn es mehr als einen solchen Wert gibt, wird nur der kleinste zurückgegeben. - Wenn "constant", werden fehlende Werte mit fill_value ersetzt. Kann mit Zeichenketten oder numerischen Daten verwendet werden. - Wenn eine Instanz von Callable, werden fehlende Werte mit der skalaren Statistik ersetzt, die durch Ausführen des Callables auf einem dichten 1D- Array mit nicht fehlenden Werten jeder Spalte zurückgegeben wird. .. versionadded:: 0.20 strategy="constant" für die Imputation mit festem Wert. .. versionadded:: 1.5 strategy=callable für die Imputation mit benutzerdefinierten Werten.	'mean'
	fill_value fill_value: str oder numerischer Wert, Standard=None Wenn strategy == "constant", wird `fill_value` verwendet, um alle Vorkommen von missing_values zu ersetzen. Für Zeichenketten oder Objekt-Datentypen muss `fill_value` eine Zeichenkette sein. Wenn `None`, ist `fill_value` 0 bei der Imputation numerischer Daten und "missing_value" für Zeichenketten oder Objekt-Datentypen.	None
	copy copy: bool, Standard=True Wenn True, wird eine Kopie von X erstellt. Wenn False, wird die Imputation nach Möglichkeit direkt durchgeführt. Beachten Sie, dass in den folgenden Fällen immer eine neue Kopie erstellt wird, auch wenn `copy=False` - Wenn `X` kein Array von Fließkommawerten ist; - Wenn `X` als CSR-Matrix kodiert ist; - Wenn `add_indicator=True`.	True
	add_indicator add_indicator: bool, Standard=False Wenn True, wird ein :class:`MissingIndicator` Transform an die Ausgabe des Imputers angehängt. Dies ermöglicht einem prädiktiven Schätzer, Fehlwerte trotz Imputation zu berücksichtigen. Wenn ein Merkmal zur Fit-/Trainingszeit keine fehlenden Werte hat, erscheint das Merkmal nicht im Fehlwertindikator, auch wenn zur Transformations-/Testzeit fehlende Werte vorhanden sind.	False
	keep_empty_features keep_empty_features: bool, Standard=False Wenn True, werden Merkmale, die ausschließlich aus fehlenden Werten bestehen, wenn `fit` aufgerufen wird, in den Ergebnissen zurückgegeben, wenn `transform` aufgerufen wird. Der imputierte Wert ist immer `0`, außer wenn `strategy="constant"`, in diesem Fall wird stattdessen `fill_value` verwendet. .. versionadded:: 1.2	False

	estimator estimator: Estimator-Objekt Es wird angenommen, dass dies die scikit-learn-Estimator-Schnittstelle implementiert. Entweder muss der Estimator eine ``score``-Funktion bereitstellen, oder ``scoring`` muss übergeben werden.	Pipeline(step...lassifier())])
	param_grid param_grid: dict oder Liste von Dictionaries Dictionary mit Parameternamen (`str`) als Schlüssel und Listen von zu versuchenden Parametereinstellungen als Werte, oder eine Liste solcher Dictionaries, in welchem Fall die von jedem Dictionary im Gitter aufgespannten Gitter durchsucht werden. Dies ermöglicht die Suche über jede Sequenz von Parametereinstellungen.	{'classifier__criterion': ['gini', 'entropy'], 'classifier__max_depth': [4, 5, ...], 'classifier__max_features': ['auto', 'sqrt', ...], 'classifier__n_estimators': [200, 500]}
	scoring scoring: str, callable, list, tuple oder dict, default=None Strategie zur Bewertung der Leistung des kreuzvalidierten Modells auf dem Testdatensatz. Wenn `scoring` eine einzelne Punktzahl darstellt, kann man verwenden: - einen einzelnen String (siehe :ref:`scoring_string_names`); - ein Callable (siehe :ref:`scoring_callable`), das einen einzelnen Wert zurückgibt; - `None`, das :ref:`Standard-Bewertungskriterium des Estimators ` wird verwendet. Wenn `scoring` mehrere Punktzahlen darstellt, kann man verwenden: - eine Liste oder ein Tupel eindeutiger Strings; - ein Callable, das ein Dictionary zurückgibt, dessen Schlüssel die Metriknamen und dessen Werte die Metrikpunktzahlen sind; - ein Dictionary mit Metriknamen als Schlüssel und Callables als Werte. Siehe :ref:`multimetric_grid_search` für ein Beispiel.	None
	n_jobs n_jobs: int, default=None Anzahl der parallel auszuführenden Jobs. ``None`` bedeutet 1, es sei denn, es befindet sich in einem :obj:`joblib.parallel_backend`-Kontext. ``-1`` bedeutet die Verwendung aller Prozessoren. Siehe :term:`Glossar ` für weitere Details. .. versionchanged:: v0.20 Standardwert von `n_jobs` wurde von 1 auf None geändert.	1
	refit refit: bool, str oder Callable, default=True Ein Estimator wird mit den besten gefundenen Parametern auf dem gesamten Datensatz neu angepasst. Für die Auswertung mehrerer Metriken muss dies eine Zeichenkette sein, die den Scorer bezeichnet, der zur Ermittlung der besten Parameter für die Neuanpassung des Estimators am Ende verwendet würde. Wenn es andere Überlegungen als die maximale Punktzahl bei der Auswahl eines besten Estimators gibt, kann ``refit`` auf eine Funktion gesetzt werden, die den ausgewählten ``best_index_`` basierend auf ``cv_results_`` zurückgibt. In diesem Fall werden der ``best_estimator_`` und die ``best_params_`` entsprechend dem zurückgegebenen ``best_index_`` gesetzt, während das Attribut ``best_score_`` nicht verfügbar ist. Der neu angepasste Estimator ist unter dem Attribut ``best_estimator_`` verfügbar und ermöglicht die direkte Verwendung von ``predict`` auf dieser ``GridSearchCV``-Instanz. Auch für die Auswertung mehrerer Metriken sind die Attribute ``best_index_``, ``best_score_`` und ``best_params_`` nur verfügbar, wenn ``refit`` gesetzt ist, und sie alle werden bezüglich dieses spezifischen Scorers bestimmt. Siehe den Parameter ``scoring``, um mehr über die Auswertung mehrerer Metriken zu erfahren. Siehe :ref:`sphx_glr_auto_examples_model_selection_plot_grid_search_digits.py` um zu sehen, wie eine benutzerdefinierte Auswahlstrategie mit einem Callable über `refit` entworfen wird. Siehe :ref:`dieses Beispiel ` als Beispiel dafür, wie ``refit=callable`` verwendet wird, um Modellkomplexität und kreuzvalidierte Punktzahlen auszugleichen. .. versionchanged:: 0.20 Unterstützung für Callable hinzugefügt.	True
	cv cv: int, cross-validation generator oder ein Iterable, default=None Bestimmt die Kreuzvalidierungs-Splitting-Strategie. Mögliche Eingaben für cv sind: - None, um die Standard-5-Falt-Kreuzvalidierung zu verwenden, - Ganzzahl, um die Anzahl der Faltungen in einem `(Stratified)KFold` anzugeben, - :term:`CV-Splitter`, - Ein Iterable, das (Trainings-, Test-)Splits als Index-Arrays liefert. Bei Ganzzahl-/None-Eingaben wird, wenn der Estimator ein Klassifikator ist und ``y`` entweder binär oder multiklass ist, :class:`StratifiedKFold` verwendet. In allen anderen Fällen wird :class:`KFold` verwendet. Diese Splitter werden mit `shuffle=False` instanziiert, sodass die Splits über Aufrufe hinweg gleich sind. Siehe das :ref:`Benutzerhandbuch ` für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können. .. versionchanged:: 0.22 Standardwert von ``cv``, wenn None, wurde von 3-Falt auf 5-Falt geändert.	None
	verbose verbose: int Steuert die Ausführlichkeit: Je höher, desto mehr Nachrichten. - >1 : Die Berechnungszeit für jede Faltung und jeden Parameterkandidaten wird angezeigt; - >2 : Die Punktzahl wird ebenfalls angezeigt; - >3 : Die Faltungs- und Parameterkandidatenindizes werden ebenfalls angezeigt, zusammen mit der Startzeit der Berechnung.	0
	pre_dispatch pre_dispatch: int oder str, default='2n_jobs' Steuert die Anzahl der Jobs, die während der parallelen Ausführung ausgeliefert werden. Die Reduzierung dieser Anzahl kann nützlich sein, um eine Explosion des Speicherverbrauchs zu vermeiden, wenn mehr Jobs ausgeliefert werden, als CPUs verarbeiten können. Dieser Parameter kann sein: - None, in diesem Fall werden alle Jobs sofort erstellt und gespawnt. Verwenden Sie dies für leichte und schnell laufende Jobs, um Verzögerungen durch On-Demand- Spawning der Jobs zu vermeiden - Eine Ganzzahl, die die genaue Gesamtzahl der gespawnten Jobs angibt - Ein String, der einen Ausdruck als Funktion von n_jobs angibt, z. B. '2n_jobs'	'2*n_jobs'
	error_score error_score: 'raise' oder numerisch, default=np.nan Wert, der der Punktzahl zugewiesen wird, wenn beim Anpassen des Estimators ein Fehler auftritt. Wenn auf 'raise' gesetzt, wird der Fehler ausgelöst. Wenn eine numerische Zahl angegeben wird, wird FitFailedWarning ausgelöst. Dieser Parameter beeinflusst den Refit-Schritt nicht, der immer den Fehler auslösen wird.	nan
	return_train_score return_train_score: bool, default=False Wenn ``False``, enthält das Attribut ``cv_results_`` keine Trainingspunktzahlen. Die Berechnung von Trainingspunktzahlen wird verwendet, um Einblicke zu gewinnen, wie verschiedene Parametereinstellungen den Kompromiss zwischen Überanpassung/Unteranpassung beeinflussen. Die Berechnung der Punktzahlen auf dem Trainingsdatensatz kann jedoch rechenintensiv sein und ist nicht unbedingt erforderlich, um die Parameter auszuwählen, die die beste Generalisierungsleistung erzielen. .. versionadded:: 0.19 .. versionchanged:: 0.21 Der Standardwert wurde von ``True`` auf ``False`` geändert.	False

	n_estimators n_estimators: int, default=100 Die Anzahl der Bäume im Wald. .. versionchanged:: 0.22 Der Standardwert von ``n_estimators`` hat sich von 10 auf 100 in 0.22 geändert.	100
	criterion criterion: {"gini", "entropy", "log_loss"}, default="gini" Die Funktion zur Messung der Qualität eines Splits. Unterstützte Kriterien sind "gini" für die Gini-Unreinheit und "log_loss" und "entropy" sowohl für die Shannon-Informationsgewinnung, siehe :ref:`tree_mathematical_formulation`. Hinweis: Dieser Parameter ist baumspezifisch.	'gini'
	max_depth max_depth: int, default=None Die maximale Tiefe des Baumes. Wenn None, werden Knoten erweitert, bis alle Blätter rein sind oder bis alle Blätter weniger als min_samples_split Stichproben enthalten.	None
	min_samples_split min_samples_split: int oder float, default=2 Die Mindestanzahl von Stichproben, die für einen internen Knoten zum Aufteilen erforderlich sind: - Wenn int, dann betrachten Sie `min_samples_split` als die Mindestanzahl. - Wenn float, dann ist `min_samples_split` ein Bruchteil und `ceil(min_samples_split * n_samples)` sind die Mindestanzahl von Stichproben für jeden Split. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	2
	min_samples_leaf min_samples_leaf: int oder float, default=1 Die Mindestanzahl von Stichproben, die an einem Blattknoten erforderlich sind. Ein Aufteilungspunkt in beliebiger Tiefe wird nur dann berücksichtigt, wenn er mindestens ``min_samples_leaf`` Trainingsstichproben in jedem der linken und rechten Zweige hinterlässt. Dies kann den Effekt haben, das Modell zu glätten, insbesondere bei der Regression. - Wenn int, dann betrachten Sie `min_samples_leaf` als die Mindestanzahl. - Wenn float, dann ist `min_samples_leaf` ein Bruchteil und `ceil(min_samples_leaf * n_samples)` sind die Mindestanzahl von Stichproben für jeden Knoten. .. versionchanged:: 0.18 Hinzugefügte Gleitkommawerte für Brüche.	1
	min_weight_fraction_leaf min_weight_fraction_leaf: float, Standard=0.0 Der minimale gewichtete Bruchteil der Gesamtsumme der Gewichte (aller Eingangsstichproben), der in einem Blattknoten erforderlich ist. Stichproben haben gleiches Gewicht, wenn sample_weight nicht angegeben ist.	0.0
	max_features max_features: {"sqrt", "log2", None}, int oder float, default="sqrt" Die Anzahl der Merkmale, die bei der Suche nach dem besten Split berücksichtigt werden: - Wenn int, dann betrachten Sie `max_features` Merkmale bei jedem Split. - Wenn float, dann ist `max_features` ein Bruchteil und `max(1, int(max_features * n_features_in_))` Merkmale werden bei jedem Split berücksichtigt. - Wenn "sqrt", dann `max_features=sqrt(n_features)`. - Wenn "log2", dann `max_features=log2(n_features)`. - Wenn None, dann `max_features=n_features`. .. versionchanged:: 1.1 Der Standardwert von `max_features` hat sich von `"auto"` zu `"sqrt"` geändert. Hinweis: Die Suche nach einem Split stoppt nicht, bis mindestens eine gültige Partition der Knoten-Stichproben gefunden wurde, selbst wenn dies erforderlich ist, mehr als ``max_features`` Merkmale zu inspizieren.	'sqrt'
	max_leaf_nodes max_leaf_nodes: int, Standard=None Wächst Bäume mit ``max_leaf_nodes`` im Best-First-Verfahren. Beste Knoten werden als relative Reduktion der Unreinheit definiert. Wenn None, dann unbegrenzte Anzahl von Blattknoten.	None
	min_impurity_decrease min_impurity_decrease: float, Standard=0.0 Ein Knoten wird geteilt, wenn diese Teilung eine Verringerung der Unreinheit von größer oder gleich diesem Wert bewirkt. Die Gleichung für die gewichtete Verringerung der Unreinheit lautet: N_t / N * (impurity - N_t_R / N_t * right_impurity - N_t_L / N_t * left_impurity) wobei ``N`` die Gesamtzahl der Stichproben, ``N_t`` die Anzahl der Stichproben am aktuellen Knoten, ``N_t_L`` die Anzahl der Stichproben im linken Kind und ``N_t_R`` die Anzahl der Stichproben im rechten Kind ist. ``N``, ``N_t``, ``N_t_R`` und ``N_t_L`` beziehen sich alle auf die gewichtete Summe, wenn ``sample_weight`` übergeben wird. .. versionadded:: 0.19	0.0
	bootstrap bootstrap: bool, default=True Ob Bootstrap-Stichproben beim Aufbau von Bäumen verwendet werden. Wenn False, wird der gesamte Datensatz zum Aufbau jedes Baumes verwendet.	True
	oob_score oob_score: bool oder aufrufbar, default=False Ob Out-of-Bag-Stichproben zur Schätzung des Generalisierungs-Scores verwendet werden. Standardmäßig wird :func:`~sklearn.metrics.accuracy_score` verwendet. Stellen Sie eine aufrufbare Funktion mit der Signatur `metric(y_true, y_pred)` bereit, um eine benutzerdefinierte Metrik zu verwenden. Nur verfügbar, wenn `bootstrap=True`. Zur Veranschaulichung der Out-of-Bag (OOB)-Fehlerschätzung siehe das Beispiel :ref:`sphx_glr_auto_examples_ensemble_plot_ensemble_oob.py`.	False
	n_jobs n_jobs: int, default=None Die Anzahl der parallel auszuführenden Jobs. :meth:`fit`, :meth:`predict`, :meth:`decision_path` und :meth:`apply` werden alle parallel über die Bäume ausgeführt. ``None`` bedeutet 1, es sei denn, Sie befinden sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet die Verwendung aller Prozessoren. Siehe :term:`Glossary ` für weitere Details.	None
	random_state random_state: int, RandomState-Instanz oder None, default=None Steuert sowohl die Zufälligkeit des Bootstrapping der Stichproben, die beim Aufbau von Bäumen verwendet werden (wenn ``bootstrap=True``), als auch die Stichprobenziehung der Merkmale, die bei der Suche nach dem besten Split in jedem Knoten berücksichtigt werden (wenn ``max_features < n_features``). Siehe :term:`Glossary ` für Details.	None
	verbose verbose: int, Standard=0 Steuert die Ausführlichkeit beim Anpassen und Vorhersagen.	0
	warm_start warm_start: bool, Standard=False Wenn auf ``True`` gesetzt, wird die Lösung des vorherigen Aufrufs von fit wiederverwendet und weitere Estimators zum Ensemble hinzugefügt, andernfalls wird nur ein ganz neuer Wald angepasst. Siehe :term:`Glossary ` und :ref:`tree_ensemble_warm_start` für Details.	False
	class_weight class_weight: {"balanced", "balanced_subsample"}, dict oder Liste von dicts, default=None Klassen zugeordnete Gewichte in der Form ``{class_label: weight}``. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Bei Mehrfachausgabeproblemen kann eine Liste von dicts in der gleichen Reihenfolge wie die Spalten von y bereitgestellt werden. Beachten Sie, dass bei Multi-Output (einschließlich Multi-Label) die Gewichte für jede Klasse jeder Spalte in einem eigenen dict definiert werden müssen. Zum Beispiel, für Vierklassen-Multi-Label-Klassifizierung sollten die Gewichte [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] anstelle von [{1:1}, {2:5}, {3:1}, {4:1}] sein. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch umgekehrt proportional zu den Klassenhäufigkeiten in den Eingabedaten als ``n_samples / (n_classes * np.bincount(y))`` anzupassen. Der Modus "balanced_subsample" ist derselbe wie "balanced", außer dass die Gewichte basierend auf dem Bootstrap-Sample für jeden gezogenen Baum berechnet werden. Für Multi-Output werden die Gewichte jeder Spalte von y multipliziert. Beachten Sie, dass diese Gewichte mit sample_weight (über die Fit-Methode übergeben) multipliziert werden, wenn sample_weight angegeben ist.	None
	ccp_alpha ccp_alpha: nicht-negative Gleitkommazahl, default=0.0 Komplexitätsparameter für Minimal Cost-Complexity Pruning. Der Teilbaum mit der größten Kostenkomplexität, die kleiner ist als ``ccp_alpha``, wird ausgewählt. Standardmäßig erfolgt kein Pruning. Siehe :ref:`minimal_cost_complexity_pruning` für Details. Siehe :ref:`sphx_glr_auto_examples_tree_plot_cost_complexity_pruning.py` für ein Beispiel für ein solches Pruning. .. versionadded:: 0.22	0.0
	max_samples max_samples: int oder float, default=None Wenn bootstrap True ist, die Anzahl der Stichproben, die aus X gezogen werden, um jeden Basisschätzer zu trainieren. - Wenn None (Standard), dann werden `X.shape[0]` Stichproben gezogen. - Wenn int, dann werden `max_samples` Stichproben gezogen. - Wenn float, dann werden `max(round(n_samples * max_samples), 1)` Stichproben gezogen. Daher sollte `max_samples` im Intervall `(0.0, 1.0]` liegen. .. versionadded:: 0.22	None
	monotonic_cst monotonic_cst: Array-ähnlich von int der Form (n_features), default=None Gibt die Monotonie-Beschränkung an, die für jedes Merkmal durchgesetzt werden soll. - 1: monoton steigend - 0: keine Beschränkung - -1: monoton fallend Wenn monotonic_cst None ist, werden keine Beschränkungen angewendet. Monotonie-Beschränkungen werden nicht unterstützt für: - Multiklassen-Klassifizierungen (d.h. wenn `n_classes > 2`), - Multi-Output-Klassifizierungen (d.h. wenn `n_outputs_ > 1`), - Klassifizierungen, die auf Daten mit fehlenden Werten trainiert wurden. Die Beschränkungen gelten für die Wahrscheinlichkeit der positiven Klasse. Lesen Sie mehr im :ref:`Benutzerhandbuch `. .. versionadded:: 1.4	None