Hinweis

Gehen Sie zum Ende, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Beispiel-Pipeline zur Extraktion und Bewertung von Textmerkmalen#

Der in diesem Beispiel verwendete Datensatz ist Der 20 Newsgroups Textdatensatz, der automatisch heruntergeladen, zwischengespeichert und für das Dokumentklassifizierungsbeispiel wiederverwendet wird.

In diesem Beispiel stimmen wir die Hyperparameter eines bestimmten Klassifikators mithilfe von RandomizedSearchCV ab. Eine Demo zur Leistung einiger anderer Klassifikatoren finden Sie im Notebook Klassifizierung von Textdokumenten unter Verwendung von spärlichen Merkmalen.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Daten laden#

Wir laden zwei Kategorien aus dem Trainingssatz. Sie können die Anzahl der Kategorien anpassen, indem Sie ihre Namen zur Liste hinzufügen oder categories=None beim Aufruf des Datensatzladers fetch_20newsgroups einstellen, um alle 20 zu erhalten.

from sklearn.datasets import fetch_20newsgroups

categories = [
    "alt.atheism",
    "talk.religion.misc",
]

data_train = fetch_20newsgroups(
    subset="train",
    categories=categories,
    shuffle=True,
    random_state=42,
    remove=("headers", "footers", "quotes"),
)

data_test = fetch_20newsgroups(
    subset="test",
    categories=categories,
    shuffle=True,
    random_state=42,
    remove=("headers", "footers", "quotes"),
)

print(f"Loading 20 newsgroups dataset for {len(data_train.target_names)} categories:")
print(data_train.target_names)
print(f"{len(data_train.data)} documents")

Loading 20 newsgroups dataset for 2 categories:
['alt.atheism', 'talk.religion.misc']
857 documents

Pipeline mit Hyperparameter-Tuning#

Wir definieren eine Pipeline, die einen Textmerkmal-Vektorisierer mit einem einfachen, aber für die Textklassifizierung effektiven Klassifikator kombiniert.

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import ComplementNB
from sklearn.pipeline import Pipeline

pipeline = Pipeline(
    [
        ("vect", TfidfVectorizer()),
        ("clf", ComplementNB()),
    ]
)
pipeline

Pipeline(steps=[('vect', TfidfVectorizer()), ('clf', ComplementNB())])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Wir definieren ein Gitter von Hyperparametern, die von der RandomizedSearchCV untersucht werden sollen. Die Verwendung einer GridSearchCV würde stattdessen alle möglichen Kombinationen im Gitter untersuchen, was rechenintensiv sein kann, während der Parameter n_iter der RandomizedSearchCV die Anzahl der zu bewertenden verschiedenen Zufallskombinationen steuert. Beachten Sie, dass das Setzen von n_iter größer als die Anzahl der möglichen Kombinationen in einem Gitter dazu führen würde, bereits untersuchte Kombinationen zu wiederholen. Wir suchen nach der besten Parameterkombination sowohl für die Merkmalsextraktion (vect__) als auch für den Klassifikator (clf__).

import numpy as np

parameter_grid = {
    "vect__max_df": (0.2, 0.4, 0.6, 0.8, 1.0),
    "vect__min_df": (1, 3, 5, 10),
    "vect__ngram_range": ((1, 1), (1, 2)),  # unigrams or bigrams
    "vect__norm": ("l1", "l2"),
    "clf__alpha": np.logspace(-6, 6, 13),
}

In diesem Fall ist n_iter=40 keine erschöpfende Suche im Gitter der Hyperparameter. In der Praxis wäre es interessant, den Parameter n_iter zu erhöhen, um eine aussagekräftigere Analyse zu erhalten. Folglich erhöht sich die Rechenzeit. Wir können sie reduzieren, indem wir die Parallelisierung über die Bewertung von Parameterkombinationen nutzen, indem wir die Anzahl der verwendeten CPUs über den Parameter n_jobs erhöhen.

from pprint import pprint

from sklearn.model_selection import RandomizedSearchCV

random_search = RandomizedSearchCV(
    estimator=pipeline,
    param_distributions=parameter_grid,
    n_iter=40,
    random_state=0,
    n_jobs=2,
    verbose=1,
)

print("Performing grid search...")
print("Hyperparameters to be evaluated:")
pprint(parameter_grid)

Performing grid search...
Hyperparameters to be evaluated:
{'clf__alpha': array([1.e-06, 1.e-05, 1.e-04, 1.e-03, 1.e-02, 1.e-01, 1.e+00, 1.e+01,
       1.e+02, 1.e+03, 1.e+04, 1.e+05, 1.e+06]),
 'vect__max_df': (0.2, 0.4, 0.6, 0.8, 1.0),
 'vect__min_df': (1, 3, 5, 10),
 'vect__ngram_range': ((1, 1), (1, 2)),
 'vect__norm': ('l1', 'l2')}

from time import time

t0 = time()
random_search.fit(data_train.data, data_train.target)
print(f"Done in {time() - t0:.3f}s")

Fitting 5 folds for each of 40 candidates, totalling 200 fits
Done in 24.387s

print("Best parameters combination found:")
best_parameters = random_search.best_estimator_.get_params()
for param_name in sorted(parameter_grid.keys()):
    print(f"{param_name}: {best_parameters[param_name]}")

Best parameters combination found:
clf__alpha: 0.01
vect__max_df: 0.2
vect__min_df: 1
vect__ngram_range: (1, 1)
vect__norm: l1

test_accuracy = random_search.score(data_test.data, data_test.target)
print(
    "Accuracy of the best parameters using the inner CV of "
    f"the random search: {random_search.best_score_:.3f}"
)
print(f"Accuracy on test set: {test_accuracy:.3f}")

Accuracy of the best parameters using the inner CV of the random search: 0.816
Accuracy on test set: 0.709

Die Präfixe vect und clf sind erforderlich, um mögliche Mehrdeutigkeiten in der Pipeline zu vermeiden, sind aber für die Visualisierung der Ergebnisse nicht notwendig. Aus diesem Grund definieren wir eine Funktion, die die abgestimmten Hyperparameter umbenennt und die Lesbarkeit verbessert.

import pandas as pd


def shorten_param(param_name):
    """Remove components' prefixes in param_name."""
    if "__" in param_name:
        return param_name.rsplit("__", 1)[1]
    return param_name


cv_results = pd.DataFrame(random_search.cv_results_)
cv_results = cv_results.rename(shorten_param, axis=1)

Wir können ein plotly.express.scatter verwenden, um den Kompromiss zwischen Scoring-Zeit und mittlerem Test-Score (d. h. "CV-Score") zu visualisieren. Das Überfahren eines bestimmten Punkts mit der Maus zeigt die entsprechenden Parameter an. Fehlerbalken entsprechen einer Standardabweichung, wie sie in den verschiedenen Folds der Kreuzvalidierung berechnet wurde.

import plotly.express as px

param_names = [shorten_param(name) for name in parameter_grid.keys()]
labels = {
    "mean_score_time": "CV Score time (s)",
    "mean_test_score": "CV score (accuracy)",
}
fig = px.scatter(
    cv_results,
    x="mean_score_time",
    y="mean_test_score",
    error_x="std_score_time",
    error_y="std_test_score",
    hover_data=param_names,
    labels=labels,
)
fig.update_layout(
    title={
        "text": "trade-off between scoring time and mean test score",
        "y": 0.95,
        "x": 0.5,
        "xanchor": "center",
        "yanchor": "top",
    }
)
fig

Beachten Sie, dass die Modelle im Cluster in der oberen linken Ecke des Diagramms den besten Kompromiss zwischen Genauigkeit und Scoring-Zeit aufweisen. In diesem Fall erhöht die Verwendung von Bigrammen die erforderliche Scoring-Zeit, ohne die Genauigkeit der Pipeline erheblich zu verbessern.

Hinweis

Weitere Informationen zur Anpassung eines automatisierten Tunings zur Maximierung des Scores und Minimierung der Scoring-Zeit finden Sie im Beispiel-Notebook Benutzerdefinierte Nachverarbeitungsstrategie einer Gitter-Suche mit Kreuzvalidierung.

Wir können auch plotly.express.parallel_coordinates verwenden, um den mittleren Test-Score als Funktion der abgestimmten Hyperparameter weiter zu visualisieren. Dies hilft, Wechselwirkungen zwischen mehr als zwei Hyperparametern zu finden und Einblicke in ihre Relevanz für die Verbesserung der Leistung einer Pipeline zu geben.

Wir wenden eine math.log10-Transformation auf der alpha-Achse an, um den aktiven Bereich zu erweitern und die Lesbarkeit des Diagramms zu verbessern. Ein Wert \(x\) auf dieser Achse ist als \(10^x\) zu verstehen.

import math

column_results = param_names + ["mean_test_score", "mean_score_time"]

transform_funcs = dict.fromkeys(column_results, lambda x: x)
# Using a logarithmic scale for alpha
transform_funcs["alpha"] = math.log10
# L1 norms are mapped to index 1, and L2 norms to index 2
transform_funcs["norm"] = lambda x: 2 if x == "l2" else 1
# Unigrams are mapped to index 1 and bigrams to index 2
transform_funcs["ngram_range"] = lambda x: x[1]

fig = px.parallel_coordinates(
    cv_results[column_results].apply(transform_funcs),
    color="mean_test_score",
    color_continuous_scale=px.colors.sequential.Viridis_r,
    labels=labels,
)
fig.update_layout(
    title={
        "text": "Parallel coordinates plot of text classifier pipeline",
        "y": 0.99,
        "x": 0.5,
        "xanchor": "center",
        "yanchor": "top",
    }
)
fig

Das Parallelkoordinaten-Diagramm zeigt die Werte der Hyperparameter auf verschiedenen Spalten, während die Leistungskennzahl farblich kodiert ist. Es ist möglich, einen Bereich von Ergebnissen auszuwählen, indem Sie auf einer beliebigen Achse des Parallelkoordinaten-Diagramms klicken und halten. Sie können dann den Bereich auswählen und zwei Auswahlen kreuzen, um die Schnittpunkte zu sehen. Sie können eine Auswahl rückgängig machen, indem Sie erneut auf dieselbe Achse klicken.

Insbesondere bei dieser Hyperparameter-Suche ist interessant zu bemerken, dass die Top-Performing-Modelle nicht von der Regularisierung norm abzuhängen scheinen, sondern von einem Kompromiss zwischen max_df, min_df und der Regularisierungsstärke alpha. Der Grund dafür ist, dass das Einbeziehen von verrauschten Merkmalen (d. h. max_df nahe \(1.0\) oder min_df nahe \(0\)) dazu neigt, zu überanpassen, und daher eine stärkere Regularisierung erfordert, um dies auszugleichen. Weniger Merkmale zu haben, erfordert weniger Regularisierung und weniger Scoring-Zeit.

Die besten Genauigkeitswerte werden erzielt, wenn alpha zwischen \(10^{-6}\) und \(10^0\) liegt, unabhängig vom Hyperparameter norm.

Gesamtlaufzeit des Skripts: (0 Minuten 26,612 Sekunden)

Jupyter-Notebook herunterladen: plot_grid_search_text_feature_extraction.ipynb

Python-Quellcode herunterladen: plot_grid_search_text_feature_extraction.py

Gepackt herunterladen: plot_grid_search_text_feature_extraction.zip

Verwandte Beispiele

Klassifikation von Textdokumenten mit spärlichen Merkmalen

Vergleich von Random Forests und Histogram Gradient Boosting Modellen

Column Transformer mit gemischten Typen

Vergleich von zufälliger Suche und Gitter-Suche zur Hyperparameter-Schätzung

Galerie generiert von Sphinx-Gallery

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('vect', ...), ('clf', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	input input: {'filename', 'file', 'content'}, Standard='content' - Wenn `'filename'`, wird erwartet, dass die als Argument an fit übergebene Sequenz eine Liste von Dateinamen ist, die gelesen werden müssen, um den zu analysierenden Rohinhalt zu ermitteln. - Wenn `'file'`, müssen die Sequenzelemente über eine `'read'`-Methode (file-ähnliches Objekt) verfügen, die aufgerufen wird, um die Bytes im Speicher abzurufen. - Wenn `'content'`, wird erwartet, dass die Eingabe eine Sequenz von Elementen ist, die vom Typ String oder Byte sein können.	'content'
	encoding encoding: str, Standard='utf-8' Wenn Bytes oder Dateien zur Analyse gegeben werden, wird diese Kodierung verwendet, um zu dekodieren.	'utf-8'
	decode_error decode_error: {'strict', 'ignore', 'replace'}, Standard='strict' Anweisung, was zu tun ist, wenn eine Byte-Sequenz zur Analyse übergeben wird, die Zeichen enthält, die nicht zur angegebenen `encoding` gehören. Standardmäßig ist es `'strict'`, was bedeutet, dass ein UnicodeDecodeError ausgelöst wird. Andere Werte sind 'ignore' und 'replace'.	'strict'
	strip_accents strip_accents: {'ascii', 'unicode'} oder aufrufbar, Standard=None Entfernt Akzente und führt während des Vorverarbeitungsschritts eine weitere Zeichennormalisierung durch. 'ascii' ist eine schnelle Methode, die nur auf Zeichen funktioniert, die eine direkte ASCII-Entsprechung haben. 'unicode' ist eine etwas langsamere Methode, die auf beliebige Zeichen funktioniert. None (Standard) bedeutet, dass keine Zeichennormalisierung durchgeführt wird. Sowohl 'ascii' als auch 'unicode' verwenden die NFKD-Normalisierung von :func:`unicodedata.normalize`.	None
	lowercase lowercase: bool, Standard=True Konvertiert alle Zeichen vor der Tokenisierung in Kleinbuchstaben.	True
	preprocessor preprocessor: aufrufbar, Standard=None Überschreibt die Vorverarbeitungsstufe (String-Transformation) unter Beibehaltung der Tokenisierungs- und N-Gramm-Generierungsschritte. Gilt nur, wenn ``analyzer`` nicht aufrufbar ist.	None
	tokenizer tokenizer: aufrufbar, Standard=None Überschreibt den String-Tokenisierungsschritt unter Beibehaltung der Vorverarbeitungs- und N-Gramm-Generierungsschritte. Gilt nur, wenn ``analyzer == 'word'``.	None
	analyzer analyzer: {'word', 'char', 'char_wb'} oder aufrufbar, Standard='word' Ob das Merkmal aus Wort- oder Zeichen-N-Grammen gebildet werden soll. Die Option 'char_wb' erstellt Zeichen-N-Gramme nur aus Text innerhalb von Wortgrenzen; N-Gramme an den Worträndern werden mit Leerzeichen aufgefüllt. Wenn eine aufrufbare Funktion übergeben wird, wird diese verwendet, um die Sequenz der Merkmale aus der rohen, unverarbeiteten Eingabe zu extrahieren. .. versionchanged:: 0.21 Seit v0.21 wird, wenn ``input`` ``'filename'`` oder ``'file'`` ist, die Datensatz zuerst aus der Datei gelesen und dann an den angegebenen aufrufbaren Analyzer übergeben.	'word'
	stop_words stop_words: {'english'}, Liste, Standard=None Wenn eine Zeichenkette, wird sie an _check_stop_list übergeben und die entsprechende Stoppwortliste zurückgegeben. 'english' ist derzeit der einzige unterstützte Zeichenkettenwert. Es gibt mehrere bekannte Probleme mit 'english' und Sie sollten eine Alternative in Betracht ziehen (siehe :ref:`stop_words`). Wenn eine Liste, wird angenommen, dass diese Liste Stoppwörter enthält, von denen alle aus den resultierenden Token entfernt werden. Gilt nur, wenn ``analyzer == 'word'``. Wenn None, werden keine Stoppwörter verwendet. In diesem Fall kann das Setzen von `max_df` auf einen höheren Wert, z. B. im Bereich (0,7, 1,0), automatisch Stoppwörter basierend auf der intra-Korpus-Dokumentfrequenz von Begriffen erkennen und filtern.	None
	token_pattern token_pattern: str, Standard=r"(?u)\\b\\w\\w+\\b" Regulärer Ausdruck, der angibt, was ein "Token" ausmacht. Nur verwendet, wenn ``analyzer == 'word'``. Der Standard-RegExp wählt Token mit 2 oder mehr alphanumerischen Zeichen aus (Satzzeichen werden vollständig ignoriert und immer als Token-Trenner behandelt). Wenn im token_pattern eine Erfassungsgruppe vorhanden ist, wird der Inhalt der erfassten Gruppe, nicht der gesamte Treffer, zum Token. Es ist höchstens eine Erfassungsgruppe zulässig.	'(?u)\\b\\w\\w+\\b'
	ngram_range ngram_range: Tupel (min_n, max_n), Standard=(1, 1) Die untere und obere Grenze des Bereichs von n-Werten für verschiedene zu extrahierende N-Gramme. Alle Werte von n, für die min_n <= n <= max_n gilt, werden verwendet. Zum Beispiel bedeutet ein ``ngram_range`` von ``(1, 1)`` nur Unigramme, ``(1, 2)`` bedeutet Unigramme und Bigramme, und ``(2, 2)`` bedeutet nur Bigramme. Gilt nur, wenn ``analyzer`` nicht aufrufbar ist.	(1, ...)
	max_df max_df: float oder int, Standard=1.0 Beim Aufbau des Vokabulars werden Begriffe ignoriert, die eine Dokumentfrequenz haben, die streng höher als der angegebene Schwellenwert ist (korpus-spezifische Stoppwörter). Wenn float im Bereich [0,0, 1,0] liegt, repräsentiert der Parameter einen Anteil der Dokumente, integer absolute Zählungen. Dieser Parameter wird ignoriert, wenn vocabulary nicht None ist.	1.0
	min_df min_df: float oder int, Standard=1 Beim Aufbau des Vokabulars werden Begriffe ignoriert, die eine Dokumentfrequenz haben, die streng niedriger als der angegebene Schwellenwert ist. Dieser Wert wird in der Literatur auch als Cut-off bezeichnet. Wenn float im Bereich von [0,0, 1,0] liegt, repräsentiert der Parameter einen Anteil der Dokumente, integer absolute Zählungen. Dieser Parameter wird ignoriert, wenn vocabulary nicht None ist.	1
	max_features max_features: int, Standard=None Wenn nicht None, wird ein Vokabular aufgebaut, das nur die Top `max_features` berücksichtigt, geordnet nach der Termfrequenz über den Korpus. Andernfalls werden alle Merkmale verwendet. Dieser Parameter wird ignoriert, wenn vocabulary nicht None ist.	None
	vocabulary vocabulary: Mapping oder Iterable, Standard=None Entweder ein Mapping (z.B. ein dict), bei dem die Schlüssel Begriffe und die Werte Indizes in der Feature-Matrix sind, oder ein Iterable über Begriffe. Wenn nicht angegeben, wird ein Vokabular aus den Eingabedokumenten bestimmt.	None
	binary binary: bool, Standard=False Wenn True, werden alle von Null verschiedenen Termhäufigkeiten auf 1 gesetzt. Das bedeutet nicht, dass Ausgaben nur 0/1-Werte haben, sondern nur, dass der tf-Term in tf-idf binär ist. (Setzen Sie `binary` auf True, `use_idf` auf False und `norm` auf None, um 0/1-Ausgaben zu erhalten).	False
	dtype dtype: dtype, Standard=float64 Typ der von fit_transform() oder transform() zurückgegebenen Matrix.	<class 'numpy.float64'>
	norm norm: {'l1', 'l2'} oder None, Standard='l2' Jede Ausgabezeile hat eine Einheitsnorm, entweder: - 'l2': Summe der Quadrate der Vektorelemente ist 1. Die Kosinus- Ähnlichkeit zwischen zwei Vektoren ist ihr Skalarprodukt, wenn l2-Norm angewendet wurde. - 'l1': Summe der Absolutwerte der Vektorelemente ist 1. Siehe :func:`~sklearn.preprocessing.normalize`. - None: Keine Normalisierung.	'l2'
	use_idf use_idf: bool, Standard=True Aktiviert die Inverse-Dokumentfrequenz-Gewichtung. Wenn False, ist idf(t) = 1.	True
	smooth_idf smooth_idf: bool, Standard=True Glättet die IDF-Gewichte, indem Eins zu den Dokumentfrequenzen addiert wird, als ob ein zusätzliches Dokument gesehen worden wäre, das jeden Begriff in der Sammlung genau einmal enthält. Verhindert Nullteilungen.	True
	sublinear_tf sublinear_tf: bool, Standard=False Wendet sublineare tf-Skalierung an, d.h. ersetzt tf durch 1 + log(tf).	False

	alpha alpha: float oder Array-ähnlich der Form (n_features,), Standard=1.0 Additiver (Laplace/Lidstone) Glättungsparameter (setze alpha=0 und force_alpha=True für keine Glättung).	1.0
	force_alpha force_alpha: bool, Standard=True Wenn False und alpha kleiner als 1e-10 ist, wird alpha auf 1e-10 gesetzt. Wenn True, bleibt alpha unverändert. Dies kann zu numerischen Fehlern führen, wenn alpha zu nahe bei 0 liegt. .. versionadded:: 1.2 .. versionchanged:: 1.4 Der Standardwert von `force_alpha` wurde auf `True` geändert.	True
	fit_prior fit_prior: bool, Standard=True Nur in einem Randfall mit einer einzelnen Klasse im Trainingssatz verwendet.	True
	class_prior class_prior: Array-ähnlich der Form (n_classes,), Standard=None A-priori-Wahrscheinlichkeiten der Klassen. Nicht verwendet.	None
	norm norm: bool, Standard=False Ob eine zweite Normalisierung der Gewichte durchgeführt wird oder nicht. Das Standardverhalten spiegelt die Implementierungen in Mahout und Weka wider, die nicht dem vollständigen Algorithmus aus Tabelle 9 des Papiers folgen.	False

Beispiel-Pipeline zur Extraktion und Bewertung von Textmerkmalen#

Daten laden#

Pipeline mit Hyperparameter-Tuning#

Diese Seite