Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Vergleich des Target Encoders mit anderen Encodern#

Der TargetEncoder verwendet den Wert des Ziels (target), um jedes kategoriale Merkmal zu kodieren. In diesem Beispiel werden wir drei verschiedene Ansätze zur Behandlung kategorialer Merkmale vergleichen: TargetEncoder, OrdinalEncoder, OneHotEncoder und das Verwerfen der Kategorie.

Hinweis

fit(X, y).transform(X) ist nicht gleich fit_transform(X, y), da in fit_transform ein Cross-Fitting-Schema für die Kodierung verwendet wird. Details finden Sie im Benutzerhandbuch.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Laden von Daten von OpenML#

Zuerst laden wir den Weinbewertungsdatensatz, bei dem das Ziel die von einem Rezensenten vergebenen Punkte sind.

from sklearn.datasets import fetch_openml

wine_reviews = fetch_openml(data_id=42074, as_frame=True)

df = wine_reviews.frame
df.head()

	Land	Beschreibung	Bezeichnung	Punkte	Preis	Provinz	Region_1	Region_2	Sorte	Weingut
0	USA	Dieser beeindruckende, 100% sortenreine Wein stammt aus ...	Martha's Vineyard	96	235.0	Kalifornien	Napa Valley	Napa	Cabernet Sauvignon	Heitz
1	Spanien	Reife Aromen von Feige, Brombeere und Cassis sind ...	Carodorum Selección Especial Reserva	96	110.0	Nordspanien	Toro	NaN	Tinta de Toro	Bodega Carmen Rodríguez
2	USA	Mac Watson ehrt die Erinnerung an einen Wein, der einst ...	Special Selected Late Harvest	96	90.0	Kalifornien	Knights Valley	Sonoma	Sauvignon Blanc	Macauley
3	USA	Dieser reifte 20 Monate in 30% neuem französischem Eichenholz, und ...	Reserve	96	65.0	Oregon	Willamette Valley	Willamette Valley	Pinot Noir	Ponzi
4	Frankreich	Dies ist der Spitzenwein von La Bégude, benannt nach ...	La Brûlade	95	66.0	Provence	Bandol	NaN	Provence Rotwein-Blend	Domaine de la Bégude

Für dieses Beispiel verwenden wir die folgende Untermenge von numerischen und kategorialen Merkmalen in den Daten. Die Zielwerte sind kontinuierliche Werte von 80 bis 100.

numerical_features = ["price"]
categorical_features = [
    "country",
    "province",
    "region_1",
    "region_2",
    "variety",
    "winery",
]
target_name = "points"

X = df[numerical_features + categorical_features]
y = df[target_name]

_ = y.hist()

Trainieren und Bewerten von Pipelines mit verschiedenen Encodern#

In diesem Abschnitt werden wir Pipelines mit HistGradientBoostingRegressor mit verschiedenen Kodierungsstrategien auswerten. Zuerst listen wir die Encoder auf, die wir zur Vorverarbeitung der kategorialen Merkmale verwenden werden.

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder, OrdinalEncoder, TargetEncoder

categorical_preprocessors = [
    ("drop", "drop"),
    ("ordinal", OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=-1)),
    (
        "one_hot",
        OneHotEncoder(handle_unknown="ignore", max_categories=20, sparse_output=False),
    ),
    ("target", TargetEncoder(target_type="continuous")),
]

Als Nächstes werten wir die Modelle anhand von Kreuzvalidierung aus und erfassen die Ergebnisse.

from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.model_selection import cross_validate
from sklearn.pipeline import make_pipeline

n_cv_folds = 3
max_iter = 20
results = []


def evaluate_model_and_store(name, pipe):
    result = cross_validate(
        pipe,
        X,
        y,
        scoring="neg_root_mean_squared_error",
        cv=n_cv_folds,
        return_train_score=True,
    )
    rmse_test_score = -result["test_score"]
    rmse_train_score = -result["train_score"]
    results.append(
        {
            "preprocessor": name,
            "rmse_test_mean": rmse_test_score.mean(),
            "rmse_test_std": rmse_train_score.std(),
            "rmse_train_mean": rmse_train_score.mean(),
            "rmse_train_std": rmse_train_score.std(),
        }
    )


for name, categorical_preprocessor in categorical_preprocessors:
    preprocessor = ColumnTransformer(
        [
            ("numerical", "passthrough", numerical_features),
            ("categorical", categorical_preprocessor, categorical_features),
        ]
    )
    pipe = make_pipeline(
        preprocessor, HistGradientBoostingRegressor(random_state=0, max_iter=max_iter)
    )
    evaluate_model_and_store(name, pipe)

Native Unterstützung für kategoriale Merkmale#

In diesem Abschnitt bauen und bewerten wir eine Pipeline, die die native Unterstützung für kategoriale Merkmale in HistGradientBoostingRegressor verwendet, die nur bis zu 255 eindeutige Kategorien unterstützt. In unserem Datensatz haben die meisten kategorialen Merkmale mehr als 255 eindeutige Kategorien.

n_unique_categories = df[categorical_features].nunique().sort_values(ascending=False)
n_unique_categories

winery      14810
region_1     1236
variety       632
province      455
country        48
region_2       18
dtype: int64

Um die oben genannte Einschränkung zu umgehen, gruppieren wir die kategorialen Merkmale in Merkmale mit niedriger Kardinalität und Merkmale mit hoher Kardinalität. Die Merkmale mit hoher Kardinalität werden mit Target Encoding kodiert, und die Merkmale mit niedriger Kardinalität verwenden die native kategoriale Unterstützung im Gradient Boosting.

high_cardinality_features = n_unique_categories[n_unique_categories > 255].index
low_cardinality_features = n_unique_categories[n_unique_categories <= 255].index
mixed_encoded_preprocessor = ColumnTransformer(
    [
        ("numerical", "passthrough", numerical_features),
        (
            "high_cardinality",
            TargetEncoder(target_type="continuous"),
            high_cardinality_features,
        ),
        (
            "low_cardinality",
            OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=-1),
            low_cardinality_features,
        ),
    ],
    verbose_feature_names_out=False,
)

# The output of the of the preprocessor must be set to pandas so the
# gradient boosting model can detect the low cardinality features.
mixed_encoded_preprocessor.set_output(transform="pandas")
mixed_pipe = make_pipeline(
    mixed_encoded_preprocessor,
    HistGradientBoostingRegressor(
        random_state=0, max_iter=max_iter, categorical_features=low_cardinality_features
    ),
)
mixed_pipe

Pipeline(steps=[('columntransformer',
                 ColumnTransformer(transformers=[('numerical', 'passthrough',
                                                  ['price']),
                                                 ('high_cardinality',
                                                  TargetEncoder(target_type='continuous'),
                                                  Index(['winery', 'region_1', 'variety', 'province'], dtype='object')),
                                                 ('low_cardinality',
                                                  OrdinalEncoder(handle_unknown='use_encoded_value',
                                                                 unknown_value=-1),
                                                  Index(['country', 'region_2'], dtype='object'))],
                                   verbose_feature_names_out=False)),
                ('histgradientboostingregressor',
                 HistGradientBoostingRegressor(categorical_features=Index(['country', 'region_2'], dtype='object'),
                                               max_iter=20, random_state=0))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Schließlich werten wir die Pipeline anhand von Kreuzvalidierung aus und erfassen die Ergebnisse.

evaluate_model_and_store("mixed_target", mixed_pipe)

Darstellung der Ergebnisse#

In diesem Abschnitt zeigen wir die Ergebnisse, indem wir die Test- und Trainingsergebnisse plotten.

import matplotlib.pyplot as plt
import pandas as pd

results_df = (
    pd.DataFrame(results).set_index("preprocessor").sort_values("rmse_test_mean")
)

fig, (ax1, ax2) = plt.subplots(
    1, 2, figsize=(12, 8), sharey=True, constrained_layout=True
)
xticks = range(len(results_df))
name_to_color = dict(
    zip((r["preprocessor"] for r in results), ["C0", "C1", "C2", "C3", "C4"])
)

for subset, ax in zip(["test", "train"], [ax1, ax2]):
    mean, std = f"rmse_{subset}_mean", f"rmse_{subset}_std"
    data = results_df[[mean, std]].sort_values(mean)
    ax.bar(
        x=xticks,
        height=data[mean],
        yerr=data[std],
        width=0.9,
        color=[name_to_color[name] for name in data.index],
    )
    ax.set(
        title=f"RMSE ({subset.title()})",
        xlabel="Encoding Scheme",
        xticks=xticks,
        xticklabels=data.index,
    )

Bei der Bewertung der prädiktiven Leistung auf dem Testdatensatz schneidet das Verwerfen der Kategorien am schlechtesten ab, und die Target Encoder schneiden am besten ab. Dies lässt sich wie folgt erklären:

Das Verwerfen der kategorialen Merkmale macht die Pipeline weniger ausdrucksstark und führt zu Underfitting;
Aufgrund der hohen Kardinalität und zur Reduzierung der Trainingszeit verwendet das One-Hot-Encoding-Schema max_categories=20, was verhindert, dass sich die Merkmale zu stark erweitern, was zu Underfitting führen kann.
Wenn wir max_categories=20 nicht gesetzt hätten, hätte das One-Hot-Encoding-Schema wahrscheinlich zu Überanpassung geführt, da die Anzahl der Merkmale mit seltenen Kategorien explodiert, die zufällig mit dem Ziel korrelieren (nur im Trainingsdatensatz);
Das Ordinal-Encoding erzwingt eine willkürliche Reihenfolge der Merkmale, die dann vom HistGradientBoostingRegressor als numerische Werte behandelt werden. Da dieses Modell numerische Merkmale in 256 Bins pro Merkmal gruppiert, können viele nicht zusammenhängende Kategorien zusammen gruppiert werden, und als Ergebnis kann die gesamte Pipeline underfitten;
Bei Verwendung des Target Encoders geschieht dasselbe Binning, aber da die kodierten Werte statistisch nach ihrer marginalen Assoziation mit der Zielvariablen geordnet sind, ist das Binning, das vom HistGradientBoostingRegressor verwendet wird, sinnvoll und führt zu guten Ergebnissen: Die Kombination aus geglättetem Target Encoding und Binning wirkt als gute regularisierende Strategie gegen Überanpassung, ohne die Ausdrucksstärke der Pipeline zu sehr einzuschränken.

Gesamtlaufzeit des Skripts: (0 Minuten 21,022 Sekunden)

Verwandte Beispiele

Unterstützung für kategorische Merkmale in Gradient Boosting

Target Encoders interne Kreuzanpassung

Internes Cross-Fitting des Target Encoders

Column Transformer mit gemischten Typen

Release Highlights für scikit-learn 1.4

Galerie generiert von Sphinx-Gallery

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('columntransformer', ...), ('histgradientboostingregressor', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	transformers transformers: list of tuples Liste von Tupeln (Name, Transformer, Spalten), die die zu verwendenden Transformer-Objekte für Teilmengen der Daten spezifizieren. name : str Wie in Pipeline und FeatureUnion, ermöglicht dies, den Transformer und seine Parameter mit ``set_params`` zu setzen und in der Grid-Suche zu suchen. transformer : {'drop', 'passthrough'} oder Schätzer Der Schätzer muss :term:`fit` und :term:`transform` unterstützen. Speziell behandelte Strings 'drop' und 'passthrough' werden ebenfalls akzeptiert, um die Spalten zu verwerfen oder sie unverändert durchzulassen. columns : str, array-ähnlich von str, int, array-ähnlich von int, array-ähnlich von bool, Slice oder Callable Indiziert die Daten auf ihrer zweiten Achse. Integers werden als positionsbasierte Spalten interpretiert, während Strings DataFrame-Spalten anhand ihres Namens referenzieren können. Ein skalare String oder Integer sollte verwendet werden, wo ``transformer`` erwartet, dass X ein 1D-Array-ähnliches Objekt (Vektor) ist, andernfalls wird ein 2D-Array an den Transformer übergeben. Eine Callable erhält die Eingabedaten `X` und kann eines der oben genannten zurückgeben. Um mehrere Spalten nach Name oder dtype auszuwählen, können Sie :obj:`make_column_selector` verwenden.	[('numerical', ...), ('high_cardinality', ...), ...]
	remainder remainder: {'drop', 'passthrough'} oder Schätzer, default='drop' Standardmäßig werden nur die in `transformers` spezifizierten Spalten transformiert und im Ergebnis kombiniert, und die nicht spezifizierten Spalten werden verworfen. (Standard von ``'drop'``). Durch Angabe von ``remainder='passthrough'`` werden alle verbleibenden Spalten, die nicht in `transformers` spezifiziert, aber in den an `fit` übergebenen Daten vorhanden waren, automatisch durchgelassen. Diese Teilmenge von Spalten wird mit dem Ergebnis der Transformer verkettet. Für DataFrames werden zusätzliche Spalten, die während `fit` nicht gesehen wurden, aus dem Ergebnis von `transform` ausgeschlossen. Durch Setzen von ``remainder`` auf einen Schätzer verwenden die verbleibenden nicht spezifizierten Spalten den ``remainder``-Schätzer. Der Schätzer muss :term:`fit` und :term:`transform` unterstützen. Beachten Sie, dass die Verwendung dieser Funktion erfordert, dass die DataFrame-Spalten bei `fit` und `transform` die gleiche Reihenfolge haben.	'drop'
	sparse_threshold sparse_threshold: float, default=0.3 Wenn die Ausgabe der verschiedenen Transformer dünnbesetzte Matrizen enthält, werden diese als dünnbesetzte Matrix gestapelt, wenn die Gesamtdichte geringer ist als dieser Wert. Verwenden Sie ``sparse_threshold=0``, um immer dicht zu liefern. Wenn die transformierte Ausgabe nur dichte Daten enthält, wird das gestapelte Ergebnis dicht sein, und dieses Schlüsselwort wird ignoriert.	0.3
	n_jobs n_jobs: int, default=None Anzahl der parallel auszuführenden Jobs. ``None`` bedeutet 1, es sei denn, es befindet sich in einem :obj:`joblib.parallel_backend` Kontext. ``-1`` bedeutet, alle Prozessoren zu verwenden. Siehe :term:`Glossar ` für weitere Details.	None
	transformer_weights transformer_weights: dict, default=None Multiplikative Gewichte für Merkmale pro Transformer. Die Ausgabe des Transformers wird mit diesen Gewichten multipliziert. Schlüssel sind Transformer-Namen, Werte die Gewichte.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Transformators gedruckt, wenn er abgeschlossen ist.	False
	verbose_feature_names_out verbose_feature_names_out: bool, str oder Callable[[str, str], str], default=True - Wenn True, präfigiert :meth:`ColumnTransformer.get_feature_names_out` alle Merkmalnamen mit dem Namen des Transformators, der dieses Merkmal erzeugt hat. Es ist äquivalent zum Setzen von `verbose_feature_names_out="{transformer_name}__{feature_name}"`. - Wenn False, präfigiert :meth:`ColumnTransformer.get_feature_names_out` keine Merkmalnamen und gibt einen Fehler aus, wenn Merkmalnamen nicht eindeutig sind. - Wenn ``Callable[[str, str], str]``, :meth:`ColumnTransformer.get_feature_names_out` benennt alle Merkmale mit dem Namen des Transformators um. Das erste Argument des Aufrufs ist der Transformer-Name und das zweite Argument ist der Merkmalname. Der zurückgegebene String ist der neue Merkmalname. - Wenn ``str``, muss es ein String sein, der für die Formatierung bereit ist. Der angegebene String wird mit zwei Feldnamen formatiert: ``transformer_name`` und ``feature_name``. z.B. ``"{feature_name}__{transformer_name}"``. Siehe :meth:`str.format` Methode aus der Standardbibliothek für weitere Informationen. .. versionadded:: 1.0 .. versionchanged:: 1.6 `verbose_feature_names_out` kann ein Callable oder ein zu formatierender String sein.	False
	force_int_remainder_cols force_int_remainder_cols: bool, default=False Dieser Parameter hat keine Auswirkung. .. note:: Wenn Sie nicht auf die Liste der Spalten für die verbleibenden Spalten im ``transformers_`` angepassten Attribut zugreifen, müssen Sie diesen Parameter nicht setzen. .. versionadded:: 1.5 .. versionchanged:: 1.7 Der Standardwert für `force_int_remainder_cols` ändert sich von `True` auf `False` in Version 1.7. .. deprecated:: 1.7 `force_int_remainder_cols` ist veraltet und wird in Version 1.9 entfernt.	'deprecated'

	categories categories: "auto" oder Liste von shape (n_features,) von array-ähnlich, default="auto" Kategorien (eindeutige Werte) pro Merkmal: - `"auto"` : Kategorien werden automatisch aus den Trainingsdaten bestimmt. - Liste : `categories[i]` enthält die erwarteten Kategorien in der i-ten Spalte. Die übergebenen Kategorien sollten keine Strings und numerische Werte innerhalb eines einzelnen Merkmals mischen und sollten bei numerischen Werten sortiert sein. Die verwendeten Kategorien werden im Attribut `categories_` gespeichert.	'auto'
	target_type target_type: {"auto", "continuous", "binary", "multiclass"}, default="auto" Typ des Ziels. - `"auto"` : Der Typ des Ziels wird mit :func:`~sklearn.utils.multiclass.type_of_target` abgeleitet. - `"continuous"` : Kontinuierliches Ziel - `"binary"` : Binäres Ziel - `"multiclass"` : Multiklassen-Ziel .. note:: Der mit `"auto"` abgeleitete Zieltyp ist möglicherweise nicht der gewünschte Zieltyp für die Modellierung. Wenn das Ziel beispielsweise aus ganzen Zahlen zwischen 0 und 100 besteht, wird :func:`~sklearn.utils.multiclass.type_of_target` den Zieltyp als `"multiclass"` ableiten. In diesem Fall wird durch Setzen von `target_type="continuous"` das Ziel als Regressionsproblem spezifiziert. Das Attribut `target_type_` gibt den vom Encoder verwendeten Zieltyp an. .. versionchanged:: 1.4 Option 'multiclass' hinzugefügt.	'continuous'
	smooth smooth: "auto" oder float, default="auto" Das Ausmaß der Mischung des bedingten Zielmittelwerts mit dem Wert der Kategorie mit dem globalen Zielmittelwert. Ein größerer `smooth`-Wert legt mehr Gewicht auf den globalen Zielmittelwert. Wenn `"auto"`, dann wird `smooth` auf einen empirischen Bayes-Schätzer gesetzt.	'auto'
	cv cv: int, default=5 Bestimmt die Anzahl der Folds im :term:`Cross-Fitting`-Schema, das in :meth:`fit_transform` verwendet wird. Für Klassifizierungsziele wird `StratifiedKFold` verwendet, und für kontinuierliche Ziele wird `KFold` verwendet.	5
	shuffle shuffle: bool, default=True Ob die Daten in :meth:`fit_transform` vor der Aufteilung in Folds gemischt werden sollen. Beachten Sie, dass die Samples innerhalb jedes Folds nicht gemischt werden.	True
	random_state random_state: int, RandomState-Instanz oder None, default=None Wenn `shuffle` True ist, beeinflusst `random_state` die Reihenfolge der Indizes, die die Zufälligkeit jedes Folds steuert. Andernfalls hat dieser Parameter keine Auswirkung. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None

	categories categories: 'auto' oder eine Liste von array-ähnlichen Objekten, default='auto' Kategorien (eindeutige Werte) pro Merkmal: - 'auto' : Kategorien werden automatisch aus den Trainingsdaten bestimmt. - Liste : ``categories[i]`` enthält die erwarteten Kategorien in der i-ten Spalte. Die übergebenen Kategorien sollten keine Strings und numerischen Werte mischen und sollten bei numerischen Werten sortiert sein. Die verwendeten Kategorien finden Sie im Attribut ``categories_``.	'auto'
	dtype dtype: numerischer Typ, default=np.float64 Gewünschter dtype der Ausgabe.	<class 'numpy.float64'>
	handle_unknown handle_unknown: {'error', 'use_encoded_value'}, default='error' Wenn auf 'error' gesetzt, wird ein Fehler ausgelöst, wenn während des Transforms eine unbekannte kategoriale Funktion vorhanden ist. Wenn auf 'use_encoded_value' gesetzt, wird der kodierte Wert unbekannter Kategorien auf den Wert gesetzt, der für den Parameter `unknown_value` angegeben wurde. Im :meth:`inverse_transform` wird eine unbekannte Kategorie als None dargestellt. .. versionadded:: 0.24	'use_encoded_value'
	unknown_value unknown_value: int oder np.nan, default=None Wenn der Parameter handle_unknown auf 'use_encoded_value' gesetzt ist, ist dieser Parameter erforderlich und setzt den kodierten Wert unbekannter Kategorien. Er muss sich von den Werten unterscheiden, die zum Kodieren von Kategorien in `fit` verwendet wurden. Wenn er auf np.nan gesetzt ist, muss der `dtype`-Parameter einen Fließkomma-dtype haben. .. versionadded:: 0.24	-1
	encoded_missing_value encoded_missing_value: int oder np.nan, default=np.nan Kodierter Wert für fehlende Kategorien. Wenn auf `np.nan` gesetzt, muss der `dtype`-Parameter einen Fließkomma-dtype haben. .. versionadded:: 1.1	nan
	min_frequency min_frequency: int oder float, default=None Gibt die Mindesthäufigkeit an, unterhalb derer eine Kategorie als wenig häufig gilt. - Wenn `int`, gelten Kategorien mit geringerer Kardinalität als wenig häufig. - Wenn `float`, gelten Kategorien mit geringerer Kardinalität als `min_frequency * n_samples` als wenig häufig. .. versionadded:: 1.3 Weiterlesen im :ref:`Benutzerhandbuch `.	None
	max_categories max_categories: int, default=None Gibt eine Obergrenze für die Anzahl der Ausgabekategorien für jedes Eingabemerkmal an, wenn wenig häufige Kategorien berücksichtigt werden. Wenn wenig häufige Kategorien vorhanden sind, enthält `max_categories` die Kategorie, die die wenig häufigen Kategorien repräsentiert, zusammen mit den häufigen Kategorien. Wenn `None`, gibt es keine Obergrenze für die Anzahl der Ausgabemerkmale. `max_categories` berücksichtigt keine fehlenden oder unbekannten Kategorien. Das Setzen von `unknown_value` oder `encoded_missing_value` auf eine Ganzzahl erhöht die Anzahl der eindeutigen Ganzzahlcodes um jeweils eins. Dies kann zu bis zu `max_categories + 2` Ganzzahlcodes führen. .. versionadded:: 1.3 Weiterlesen im :ref:`Benutzerhandbuch `.	None

	loss loss: {'squared_error', 'absolute_error', 'gamma', 'poisson', 'quantile'}, default='squared_error' Die Verlustfunktion, die im Boosting-Prozess verwendet wird. Beachten Sie, dass die "squared error", "gamma" und "poisson" Verluste tatsächlich "half least squares loss", "half gamma deviance" und "half poisson deviance" implementieren, um die Berechnung des Gradienten zu vereinfachen. Darüber hinaus verwenden die Verluste "gamma" und "poisson" intern einen Log-Link, "gamma" erfordert ``y > 0`` und "poisson" erfordert ``y >= 0``. "quantile" verwendet den Pinball-Verlust. .. versionchanged:: 0.23 Option 'poisson' hinzugefügt. .. versionchanged:: 1.1 Option 'quantile' hinzugefügt. .. versionchanged:: 1.3 Option 'gamma' hinzugefügt.	'squared_error'
	quantile quantile: float, default=None Wenn loss "quantile" ist, gibt dieser Parameter an, welches Quantil geschätzt werden soll, und muss zwischen 0 und 1 liegen.	None
	learning_rate learning_rate: float, default=0.1 Die Lernrate, auch bekannt als Shrinkage. Sie wird als multiplikativer Faktor für die Blattwerte verwendet. Verwenden Sie ``1`` für keine Schrumpfung.	0.1
	max_iter max_iter: int, default=100 Die maximale Anzahl von Iterationen des Boosting-Prozesses, d.h. die maximale Anzahl von Bäumen.	20
	max_leaf_nodes max_leaf_nodes: int oder None, default=31 Die maximale Anzahl von Blättern pro Baum. Muss strikt größer als 1 sein. Wenn None, gibt es keine maximale Grenze.	31
	max_depth max_depth: int oder None, default=None Die maximale Tiefe jedes Baumes. Die Tiefe eines Baumes ist die Anzahl der Kanten, die vom Wurzelknoten zum tiefsten Blatt führen. Die Tiefe ist standardmäßig nicht begrenzt.	None
	min_samples_leaf min_samples_leaf: int, default=20 Die Mindestanzahl von Samples pro Blatt. Bei kleinen Datensätzen mit weniger als einigen hundert Samples wird empfohlen, diesen Wert zu senken, da nur sehr flache Bäume gebaut würden.	20
	l2_regularization l2_regularization: float, default=0 Der L2-Regularisierungsparameter, der Blätter mit kleinen Hessianen bestraft. Verwenden Sie ``0`` für keine Regularisierung (Standard).	0.0
	max_features max_features: float, default=1.0 Anteil zufällig ausgewählter Merkmale in jedem Knoten-Split. Dies ist eine Form der Regularisierung, kleinere Werte machen die Bäume zu schwächeren Lernern und können Überanpassung verhindern. Wenn Interaktionsbeschränkungen aus `interaction_cst` vorhanden sind, werden nur erlaubte Merkmale für die Unterstichprobe berücksichtigt. .. versionadded:: 1.4	1.0
	max_bins max_bins: int, default=255 Die maximale Anzahl von Bins, die für nicht fehlende Werte verwendet werden sollen. Vor dem Training wird jedes Merkmal des Eingabearrays `X` in ganzzahlige Bins eingeteilt, was eine viel schnellere Trainingsphase ermöglicht. Merkmale mit einer kleinen Anzahl von eindeutigen Werten verwenden möglicherweise weniger als ``max_bins`` Bins. Zusätzlich zu den ``max_bins`` Bins ist immer ein weiterer Bin für fehlende Werte reserviert. Muss nicht größer als 255 sein.	255
	categorical_features categorical_features: array-ähnlich von {bool, int, str} mit shape (n_features) oder shape (n_categorical_features,), default='from_dtype' Zeigt die kategorialen Merkmale an. - None : kein Merkmal wird als kategorial betrachtet. - Boolean array-ähnlich : boolesche Maske, die kategoriale Merkmale anzeigt. - Integer array-ähnlich : Integer-Indizes, die kategoriale Merkmale anzeigen. - String array-ähnlich: Namen von kategorialen Merkmalen (unter der Annahme, dass die Trainingsdaten Merkmalnamen haben). - `"from_dtype"`: DataFrame-Spalten mit dtype "category" werden als kategoriale Merkmale betrachtet. Die Eingabe muss ein Objekt sein, das eine ``__dataframe__`` Methode exponiert, wie z.B. pandas oder polars DataFrames, um dieses Merkmal zu verwenden. Für jedes kategoriale Merkmal muss es höchstens `max_bins` eindeutige Kategorien geben. Negative Werte für kategoriale Merkmale, die als numerische Dtypes kodiert sind, werden als fehlende Werte behandelt. Alle kategorialen Werte werden in Gleitkommazahlen umgewandelt. Das bedeutet, dass kategoriale Werte von 1.0 und 1 als dieselbe Kategorie behandelt werden. Weiterlesen im :ref:`Benutzerhandbuch ` und :ref:`sphx_glr_auto_examples_ensemble_plot_gradient_boosting_categorical.py`. .. versionadded:: 0.24 .. versionchanged:: 1.2 Unterstützung für Merkmalnamen hinzugefügt. .. versionchanged:: 1.4 Option `"from_dtype"` hinzugefügt. .. versionchanged:: 1.6 Der Standardwert änderte sich von `None` zu `"from_dtype"`.	Index(['count...type='object')
	monotonic_cst monotonic_cst: array-ähnlich von int mit shape (n_features) oder dict, default=None Monotone Einschränkungen, die für jedes Merkmal durchgesetzt werden sollen, werden mit den folgenden Integer-Werten angegeben: - 1: monoton steigend - 0: keine Einschränkung - -1: monoton fallend Wenn ein Dict mit String-Schlüsseln, ordnet es Merkmale zu monotonen Einschränkungen nach Namen zu. Wenn ein Array, werden die Merkmale Einschränkungen nach Position zugeordnet. Siehe :ref:`monotonic_cst_features_names` für ein Anwendungsbeispiel. Weiterlesen im :ref:`Benutzerhandbuch `. .. versionadded:: 0.23 .. versionchanged:: 1.2 Akzeptiert Dict von Einschränkungen mit Merkmalnamen als Schlüssel.	None
	interaction_cst interaction_cst: {"pairwise", "no_interactions"} oder Sequenz von Listen/Tupeln/Sets von int, default=None Definiert Interaktionsbeschränkungen, d.h. die Mengen von Merkmalen, die miteinander in Knoten-Splits interagieren können. Jedes Element spezifiziert die Menge der Merkmalsindizes, die miteinander interagieren dürfen. Wenn es mehr Merkmale als in diesen Einschränkungen angegeben gibt, werden sie so behandelt, als wären sie als zusätzliche Menge spezifiziert. Die Strings "pairwise" und "no_interactions" sind Abkürzungen für die Zulassung von nur paarweisen bzw. keinen Interaktionen. Zum Beispiel mit insgesamt 5 Merkmalen ist `interaction_cst=[{0, 1}]` äquivalent zu `interaction_cst=[{0, 1}, {2, 3, 4}]`, und spezifiziert, dass jeder Zweig eines Baumes entweder nur nach Merkmalen 0 und 1 teilt oder nur nach Merkmalen 2, 3 und 4. Siehe :ref:`dieses Beispiel `, wie `interaction_cst` verwendet wird. .. versionadded:: 1.2	None
	warm_start warm_start: bool, default=False Wenn ``True`` gesetzt, wird die Lösung des vorherigen fit-Aufrufs wiederverwendet und weitere Schätzer zum Ensemble hinzugefügt. Damit die Ergebnisse gültig sind, sollte der Schätzer nur auf denselben Daten neu trainiert werden. Siehe :term:`Glossar `.	False
	early_stopping early_stopping: 'auto' oder bool, default='auto' Wenn 'auto', ist Early Stopping aktiviert, wenn die Stichprobengröße größer als 10000 ist oder wenn `X_val` und `y_val` an `fit` übergeben werden. Wenn True, ist Early Stopping aktiviert, andernfalls ist Early Stopping deaktiviert. .. versionadded:: 0.23	'auto'
	scoring scoring: str oder callable oder None, default='loss' Scoring-Methode, die für Early Stopping verwendet wird. Wird nur verwendet, wenn `early_stopping` aktiviert ist. Optionen: - str: siehe :ref:`scoring_string_names` für Optionen. - callable: ein Scorer-Callable-Objekt (z.B. Funktion) mit der Signatur ``scorer(estimator, X, y)``. Siehe :ref:`scoring_callable` für Details. - `None`: der :ref:`Bestimmtheitskoeffizient ` (:math:`R^2`) wird verwendet. - 'loss': Early Stopping wird im Vergleich zum Verlustwert überprüft.	'loss'
	validation_fraction validation_fraction: int oder float oder None, default=0.1 Anteil (oder absolute Größe) der Trainingsdaten, der als Validierungsdaten für Early Stopping zurückgestellt wird. Wenn None, erfolgt Early Stopping auf den Trainingsdaten. Der Wert wird ignoriert, wenn entweder kein Early Stopping durchgeführt wird (z.B. `early_stopping=False`) oder wenn `X_val` und `y_val` an fit übergeben werden.	0.1
	n_iter_no_change n_iter_no_change: int, default=10 Wird verwendet, um zu bestimmen, wann "Early Stop" erfolgen soll. Der Anpassungsprozess wird gestoppt, wenn keiner der letzten ``n_iter_no_change`` Scores besser ist als der ``n_iter_no_change - 1``-te-letzte, bis zu einer gewissen Toleranz. Nur verwendet, wenn Early Stopping durchgeführt wird.	10
	tol tol: float, default=1e-7 Die absolute Toleranz, die beim Vergleichen von Scores während des Early Stoppings verwendet wird. Je höher die Toleranz, desto wahrscheinlicher ist es, dass ein frühes Stoppen erfolgt: eine höhere Toleranz bedeutet, dass es für nachfolgende Iterationen schwieriger ist, als Verbesserung gegenüber dem Referenz-Score zu gelten.	1e-07
	verbose verbose: int, default=0 Die Ausführlichkeitsstufe. Wenn nicht null, werden einige Informationen über den Anpassungsprozess ausgegeben. ``1`` gibt nur eine Zusammenfassung aus, ``2`` gibt Informationen pro Iteration aus.	0
	random_state random_state: int, RandomState-Instanz oder None, default=None Pseudozufallszahlengenerator zur Steuerung der Unterabtastung im Binning-Prozess und der Trainings-/Validierungsdatensatzaufteilung, wenn Early Stopping aktiviert ist. Geben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	0