Hinweis

Zum Ende springen, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Release Highlights für scikit-learn 1.8#

Wir freuen uns, die Veröffentlichung von scikit-learn 1.8 bekannt zu geben! Viele Fehlerbehebungen und Verbesserungen wurden hinzugefügt, ebenso wie einige wichtige neue Funktionen. Nachfolgend erläutern wir die Highlights dieser Version. **Für eine vollständige Liste aller Änderungen** konsultieren Sie bitte die Release Notes.

Um die neueste Version zu installieren (mit pip)

pip install --upgrade scikit-learn

oder mit conda

conda install -c conda-forge scikit-learn

Array API-Unterstützung (ermöglicht GPU-Berechnungen)#

Die schrittweise Einführung des Python Array API-Standards in scikit-learn bedeutet, dass PyTorch und CuPy Eingangsarrays direkt verwendet werden. Dies bedeutet, dass in scikit-learn-Estimators und -Funktionen Nicht-CPU-Geräte, wie z. B. GPUs, zur Durchführung der Berechnungen verwendet werden können. Dies führt zu einer verbesserten Leistung und einer einfacheren Integration mit diesen Bibliotheken.

In scikit-learn 1.8 wurden mehrere Estimators und Funktionen aktualisiert, um Array API-kompatible Eingaben zu unterstützen, z. B. PyTorch-Tensoren und CuPy-Arrays.

Die Array API-Unterstützung wurde zu den folgenden Estimators hinzugefügt: preprocessing.StandardScaler, preprocessing.PolynomialFeatures, linear_model.RidgeCV, linear_model.RidgeClassifierCV, mixture.GaussianMixture und calibration.CalibratedClassifierCV.

Die Array API-Unterstützung wurde auch zu mehreren Metriken im sklearn.metrics-Modul hinzugefügt. Weitere Details finden Sie unter Unterstützung für Array API-kompatible Eingaben.

Bitte beachten Sie die Seite Array API-Unterstützung für Anleitungen zur Verwendung von scikit-learn mit Array API-kompatiblen Bibliotheken wie PyTorch oder CuPy. Hinweis: Die Array API-Unterstützung ist experimentell und muss sowohl in SciPy als auch in scikit-learn explizit aktiviert werden.

Hier ist ein Auszug aus der Verwendung eines Feature-Engineering-Präprozessors auf der CPU, gefolgt von calibration.CalibratedClassifierCV und linear_model.RidgeCV zusammen auf einer GPU mit Hilfe von PyTorch.

ridge_pipeline_gpu = make_pipeline(
    # Ensure that all features (including categorical features) are preprocessed
    # on the CPU and mapped to a numerical representation.
    feature_preprocessor,
    # Move the results to the GPU and perform computations there
    FunctionTransformer(
        lambda x: torch.tensor(x.to_numpy().astype(np.float32), device="cuda"))
    ,
    CalibratedClassifierCV(
        RidgeClassifierCV(alphas=alphas), method="temperature"
    ),
)
with sklearn.config_context(array_api_dispatch=True):
    cv_results = cross_validate(ridge_pipeline_gpu, features, target)

Sehen Sie sich das vollständige Notebook auf Google Colab für weitere Details an. In diesem speziellen Beispiel führt die Verwendung der Colab GPU gegenüber einem einzelnen CPU-Kern zu einer 10-fachen Beschleunigung, was für solche Workloads recht typisch ist.

Unterstützung für Free-Threaded CPython 3.14#

scikit-learn unterstützt free-threaded CPython, insbesondere sind free-threaded Wheels für alle unsere unterstützten Plattformen unter Python 3.14 verfügbar.

Wir wären sehr an Benutzerfeedback interessiert. Hier sind einige Dinge, die Sie ausprobieren können:

Installieren Sie free-threaded CPython 3.14, führen Sie Ihr bevorzugtes scikit-learn-Skript aus und überprüfen Sie, ob nichts unerwartet kaputt geht. Beachten Sie, dass CPython 3.14 (anstelle von 3.13) dringend empfohlen wird, da seit CPython 3.13 einige Fehler bei free-threaded behoben wurden.
Wenn Sie Estimators mit einem n_jobs-Parameter verwenden, versuchen Sie, das Standard-Backend mit joblib.parallel_config wie im folgenden Snippet zu ändern. Dies könnte Ihren Code potenziell beschleunigen, da das Standard-Joblib-Backend prozessbasiert ist und mehr Overhead als Threads verursacht.
```
grid_search = GridSearchCV(clf, param_grid=param_grid, n_jobs=4)
with joblib.parallel_config(backend="threading"):
    grid_search.fit(X, y)
```
Zögern Sie nicht, Probleme oder unerwartetes Leistungsverhalten zu melden, indem Sie ein GitHub-Issue eröffnen!

Free-threaded (auch bekannt als nogil) CPython ist eine Version von CPython, die darauf abzielt, effiziente Multi-Threading-Anwendungsfälle zu ermöglichen, indem der Global Interpreter Lock (GIL) entfernt wird.

Weitere Details zu free-threaded CPython finden Sie in der py-free-threading-Dokumentation, insbesondere wie man ein free-threaded CPython installiert und Ecosystem-Kompatibilitätsverfolgung.

In scikit-learn hoffen wir mit free-threaded Python, Multi-Core-CPUs effizienter nutzen zu können, indem wir Thread-Worker anstelle von Subprozess-Workern für parallele Berechnungen verwenden, wenn n_jobs>1 in Funktionen oder Estimators übergeben wird. Effizienzsteigerungen werden durch die Vermeidung der Notwendigkeit der Interprozesskommunikation erwartet. Beachten Sie, dass die Änderung des Standard-Joblib-Backends und das Testen, ob alles gut mit free-threaded Python funktioniert, eine fortlaufende langfristige Anstrengung ist.

Temperaturskalierung in `CalibratedClassifierCV`#

Die Wahrscheinlichkeitskalibrierung von Klassifikatoren mit Temperaturskalierung ist in calibration.CalibratedClassifierCV durch Setzen von method="temperature" verfügbar. Diese Methode eignet sich besonders gut für Multiklassenprobleme, da sie (besser) kalibrierte Wahrscheinlichkeiten mit einem einzigen freien Parameter liefert. Dies steht im Gegensatz zu allen anderen verfügbaren Kalibrierungsmethoden, die ein „One-vs-Rest“-Schema verwenden, das zusätzliche Parameter für jede Klasse hinzufügt.

from sklearn.calibration import CalibratedClassifierCV
from sklearn.datasets import make_classification
from sklearn.naive_bayes import GaussianNB

X, y = make_classification(n_classes=3, n_informative=8, random_state=42)
clf = GaussianNB().fit(X, y)
sig = CalibratedClassifierCV(clf, method="sigmoid", ensemble=False).fit(X, y)
ts = CalibratedClassifierCV(clf, method="temperature", ensemble=False).fit(X, y)

Das folgende Beispiel zeigt, dass die Temperaturskalierung bei Multiklassen-Klassifizierungsproblemen mit 3 Klassen zu besser kalibrierten Wahrscheinlichkeiten führen kann als die Sigmoid-Kalibrierung.

import matplotlib.pyplot as plt

from sklearn.calibration import CalibrationDisplay

fig, axes = plt.subplots(
    figsize=(8, 4.5),
    ncols=3,
    sharey=True,
)
for i, c in enumerate(ts.classes_):
    CalibrationDisplay.from_predictions(
        y == c, clf.predict_proba(X)[:, i], name="Uncalibrated", ax=axes[i], marker="s"
    )
    CalibrationDisplay.from_predictions(
        y == c,
        ts.predict_proba(X)[:, i],
        name="Temperature scaling",
        ax=axes[i],
        marker="o",
    )
    CalibrationDisplay.from_predictions(
        y == c, sig.predict_proba(X)[:, i], name="Sigmoid", ax=axes[i], marker="v"
    )
    axes[i].set_title(f"Class {c}")
    axes[i].set_xlabel(None)
    axes[i].set_ylabel(None)
    axes[i].get_legend().remove()
fig.suptitle("Reliability Diagrams per Class")
fig.supxlabel("Mean Predicted Probability")
fig.supylabel("Fraction of Class")
fig.legend(*axes[0].get_legend_handles_labels(), loc=(0.72, 0.5))
plt.subplots_adjust(right=0.7)
_ = fig.show()

Reliability Diagrams per Class, Class 0, Class 1, Class 2

Effizienzverbesserungen bei linearen Modellen#

Die Trainingszeit wurde für Schätzer, die auf quadratischen Fehlern basieren und eine L1-Strafe verwenden, massiv reduziert: ElasticNet, Lasso, MultiTaskElasticNet, MultiTaskLasso und ihre CV-Varianten. Die Verbesserung der Trainingszeit wird hauptsächlich durch **Gap Safe Screening Rules** erreicht. Diese ermöglichen es dem Coordinate Descent-Solver, Koeffizienten von Merkmalen frühzeitig auf Null zu setzen und sie nicht erneut zu betrachten. Je stärker die L1-Strafe, desto früher können Merkmale von weiteren Aktualisierungen ausgeschlossen werden.

from time import time

from sklearn.datasets import make_regression
from sklearn.linear_model import ElasticNetCV

X, y = make_regression(n_features=10_000, random_state=0)
model = ElasticNetCV()
tic = time()
model.fit(X, y)
toc = time()
print(f"Fitting ElasticNetCV took {toc - tic:.3} seconds.")

Fitting ElasticNetCV took 12.9 seconds.

HTML-Darstellung von Estimators#

Hyperparameter in der Dropdown-Tabelle der HTML-Darstellung enthalten jetzt Links zur Online-Dokumentation. Docstring-Beschreibungen werden auch als Tooltips beim Überfahren angezeigt.

from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler

clf = make_pipeline(StandardScaler(), LogisticRegression(random_state=0, C=10))

Erweitern Sie das untenstehende Estimator-Diagramm, indem Sie auf „LogisticRegression“ und dann auf „Parameters“ klicken.

clf

Pipeline(steps=[('standardscaler', StandardScaler()),
                ('logisticregression',
                 LogisticRegression(C=10, random_state=0))])

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

DecisionTreeRegressor mit `criterion="absolute_error"`#

tree.DecisionTreeRegressor mit criterion="absolute_error" läuft jetzt viel schneller. Es hat jetzt eine Komplexität von O(n * log(n)) im Vergleich zu O(n**2) zuvor, was die Skalierung auf Millionen von Datenpunkten ermöglicht.

Zur Veranschaulichung: Bei einem Datensatz mit 100.000 Samples und 1 Merkmal dauert ein einzelner Split etwa 100 ms, verglichen mit ca. 20 Sekunden zuvor.

import time

from sklearn.datasets import make_regression
from sklearn.tree import DecisionTreeRegressor

X, y = make_regression(n_samples=100_000, n_features=1)
tree = DecisionTreeRegressor(criterion="absolute_error", max_depth=1)

tic = time.time()
tree.fit(X, y)
elapsed = time.time() - tic
print(f"Fit took {elapsed:.2f} seconds")

Fit took 0.13 seconds

ClassicalMDS#

Classical MDS, auch bekannt als „Principal Coordinates Analysis“ (PCoA) oder „Torgerson’s Scaling“, ist jetzt im Modul sklearn.manifold verfügbar. Classical MDS ist ähnlich wie PCA und approximiert anstelle von Abständen paarweise Skalarprodukte, was eine exakte analytische Lösung in Form einer Eigenzerlegung hat.

Lassen Sie uns diese neue Ergänzung veranschaulichen, indem wir sie auf einem S-Kurven-Datensatz verwenden, um eine niedrigdimensionale Darstellung der Daten zu erhalten.

import matplotlib.pyplot as plt
from matplotlib import ticker

from sklearn import datasets, manifold

n_samples = 1500
S_points, S_color = datasets.make_s_curve(n_samples, random_state=0)
md_classical = manifold.ClassicalMDS(n_components=2)
S_scaling = md_classical.fit_transform(S_points)

fig = plt.figure(figsize=(8, 4))
ax1 = fig.add_subplot(1, 2, 1, projection="3d")
x, y, z = S_points.T
ax1.scatter(x, y, z, c=S_color, s=50, alpha=0.8)
ax1.set_title("Original S-curve samples", size=16)
ax1.view_init(azim=-60, elev=9)
for axis in (ax1.xaxis, ax1.yaxis, ax1.zaxis):
    axis.set_major_locator(ticker.MultipleLocator(1))

ax2 = fig.add_subplot(1, 2, 2)
x2, y2 = S_scaling.T
ax2.scatter(x2, y2, c=S_color, s=50, alpha=0.8)
ax2.set_title("Classical MDS", size=16)
for axis in (ax2.xaxis, ax2.yaxis):
    axis.set_major_formatter(ticker.NullFormatter())

plt.show()

Gesamtlaufzeit des Skripts: (0 Minuten 13,717 Sekunden)

Verwandte Beispiele

Release Highlights für scikit-learn 1.6

Release Highlights für scikit-learn 1.7

Release Highlights für scikit-learn 1.0

Release Highlights für scikit-learn 1.2

Galerie generiert von Sphinx-Gallery

	steps steps: list of tuples Liste von Tupeln (Name des Schritts, Schätzer), die in sequenzieller Reihenfolge verkettet werden sollen. Um mit der scikit-learn API kompatibel zu sein, müssen alle Schritte `fit` definieren. Alle nicht letzten Schritte müssen auch `transform` definieren. Siehe :ref:`Kombination von Schätzern ` für weitere Details.	[('standardscaler', ...), ('logisticregression', ...)]
	transform_input transform_input: list of str, default=None Die Namen der :term:`Metadaten`-Parameter, die von der Pipeline transformiert werden sollen, bevor sie an den Schritt übergeben werden, der sie benötigt. Dies ermöglicht die Transformation einiger Eingabeparameter zu ``fit`` (außer ``X``), die von den Schritten der Pipeline bis zu dem Schritt transformiert werden, der sie benötigt. Die Anforderung wird über :ref:`Metadaten-Routing ` definiert. Dies kann beispielsweise verwendet werden, um einen Validierungsdatensatz durch die Pipeline zu leiten. Sie können dies nur festlegen, wenn das Metadaten-Routing aktiviert ist, was Sie mit ``sklearn.set_config(enable_metadata_routing=True)`` aktivieren können. .. versionadded:: 1.6	None
	memory memory: str oder Objekt mit der joblib.Memory-Schnittstelle, default=None Wird zum Zwischenspeichern der angepassten Transformer der Pipeline verwendet. Der letzte Schritt wird niemals zwischengespeichert, auch wenn es sich um einen Transformer handelt. Standardmäßig erfolgt keine Zwischenspeicherung. Wenn ein String angegeben wird, ist dies der Pfad zum Zwischenspeicherverzeichnis. Durch Aktivieren der Zwischenspeicherung wird eine Kopie der Transformer vor dem Anpassen ausgelöst. Daher kann die an die Pipeline übergebene Transformer-Instanz nicht direkt inspiziert werden. Verwenden Sie das Attribut `named_steps` oder `steps`, um Schätzer innerhalb der Pipeline zu inspizieren. Das Zwischenspeichern der Transformer ist vorteilhaft, wenn das Anpassen zeitaufwändig ist. Siehe :ref:`sphx_glr_auto_examples_neighbors_plot_caching_nearest_neighbors.py` für ein Beispiel zur Aktivierung der Zwischenspeicherung.	None
	verbose verbose: bool, default=False Wenn True, wird die verstrichene Zeit während des Anpassens jedes Schritts gedruckt, wenn es abgeschlossen ist.	False

	penalty penalty: {'l1', 'l2', 'elasticnet', None}, default='l2' Gibt die Norm der Strafe an: - `None`: keine Strafe wird hinzugefügt; - `'l2'`: fügt einen L2-Strafbegriff hinzu und ist die Standardwahl; - `'l1'`: fügt einen L1-Strafbegriff hinzu; - `'elasticnet'`: beide L1- und L2-Strafbegriffe werden hinzugefügt. .. warning:: Einige Strafen funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionadded:: 0.19 l1-Strafe mit SAGA-Solver (erlaubt 'multinomial' + L1) .. deprecated:: 1.8 `penalty` wurde in Version 1.8 als veraltet markiert und wird in 1.10 entfernt. Verwenden Sie stattdessen `l1_ratio`. `l1_ratio=0` für `penalty='l2'`, `l1_ratio=1` für `penalty='l1'` und `l1_ratio` auf eine Gleitkommazahl zwischen 0 und 1 gesetzt für `'penalty='elasticnet'`.	'deprecated'
	C C: float, default=1.0 Kehrwert der Regularisierungsstärke; muss eine positive Gleitkommazahl sein. Wie bei Support Vector Machines geben kleinere Werte eine stärkere Regularisierung an. `C=np.inf` führt zu ungestrafter logistischer Regression. Für ein visuelles Beispiel der Auswirkung der Abstimmung des Parameters `C` mit einer L1-Strafe siehe: :ref:`sphx_glr_auto_examples_linear_model_plot_logistic_path.py`.	10
	l1_ratio l1_ratio: float, default=0.0 Der Elastic-Net-Mischungsparameter, mit `0 <= l1_ratio <= 1`. Das Setzen von `l1_ratio=1` ergibt eine reine L1-Strafe, das Setzen von `l1_ratio=0` eine reine L2-Strafe. Jeder Wert zwischen 0 und 1 ergibt eine Elastic-Net-Strafe der Form `l1_ratio * L1 + (1 - l1_ratio) * L2`. .. warning:: Bestimmte Werte von `l1_ratio`, d. h. einige Strafen, funktionieren möglicherweise nicht mit einigen Solvern. Siehe den Parameter `solver` unten, um die Kompatibilität zwischen der Strafe und dem Solver zu erfahren. .. versionchanged:: 1.8 Der Standardwert wurde von None auf 0.0 geändert. .. deprecated:: 1.8 `None` ist veraltet und wird in Version 1.10 entfernt. Verwenden Sie immer `l1_ratio`, um den Strafentyp anzugeben.	0.0
	dual dual: bool, default=False Duale (beschränkte) oder primale (regularisierte, siehe auch :ref:`diese Gleichung `) Formulierung. Die duale Formulierung ist nur für die L2-Strafe mit dem liblinear-Solver implementiert. Bevorzugen Sie `dual=False` wenn n_samples > n_features.	False
	tol tol: float, default=1e-4 Toleranz für Abbruchkriterien.	0.0001
	fit_intercept fit_intercept: bool, default=True Gibt an, ob eine Konstante (auch Bias oder Achsenabschnitt genannt) zur Entscheidungsfunktion hinzugefügt werden soll.	True
	intercept_scaling intercept_scaling: float, default=1 Nur nützlich, wenn der Solver `liblinear` verwendet wird und `self.fit_intercept` auf `True` gesetzt ist. In diesem Fall wird `x` zu `[x, self.intercept_scaling]`, d. h. ein "synthetisches" Merkmal mit konstantem Wert gleich `intercept_scaling` wird an den Instanzvektor angehängt. Der Achsenabschnitt wird dann ``intercept_scaling * synthetisches Merkmalsgewicht``. .. note:: Das Gewicht des synthetischen Merkmals unterliegt der L1- oder L2- Regularisierung wie alle anderen Merkmale. Um die Auswirkung der Regularisierung auf das synthetische Merkmalsgewicht (und damit auf den Achsenabschnitt) zu verringern, muss `intercept_scaling` erhöht werden.	1
	class_weight class_weight: dict oder 'balanced', default=None Mit Klassen assoziierte Gewichte in der Form ``{class_label: weight}``. Wenn nicht angegeben, wird angenommen, dass alle Klassen das Gewicht eins haben. Der Modus "balanced" verwendet die Werte von y, um die Gewichte automatisch invers proportional zu den Klassenhaüfigkeiten in den Eingabedaten als ``n_samples / (n_classes * np.bincount(y))`` anzupassen. Beachten Sie, dass diese Gewichte mit sample_weight (übergeben durch die fit-Methode) multipliziert werden, wenn sample_weight angegeben ist. .. versionadded:: 0.17 class_weight='balanced'	None
	random_state random_state: int, RandomState-Instanz, default=None Wird verwendet, wenn ``solver`` == 'sag', 'saga' oder 'liblinear', um die Daten zu mischen. Siehe :term:`Glossar ` für Details.	0
	solver solver: {'lbfgs', 'liblinear', 'newton-cg', 'newton-cholesky', 'sag', 'saga'}, default='lbfgs' Algorithmus zur Verwendung im Optimierungsproblem. Standardmäßig 'lbfgs'. Bei der Auswahl eines Solvers sollten Sie möglicherweise die folgenden Aspekte berücksichtigen: - 'lbfgs' ist ein guter Standard-Solver, da er für eine breite Palette von Problemen einigermaßen gut funktioniert. - Für :term:`Multiklassen`-Probleme (`n_klassen >= 3`) minimieren alle Solver außer 'liblinear' die vollständige multinomiale Verlustfunktion, 'liblinear' löst einen Fehler aus. - 'newton-cholesky' ist eine gute Wahl für `n_samples` >> `n_features * n_classes`, insbesondere mit One-Hot-kodierten kategorischen Merkmalen mit seltenen Kategorien. Beachten Sie, dass die Speichernutzung dieses Solvers eine quadratische Abhängigkeit von `n_features * n_classes` hat, da er die vollständige Hesse-Matrix explizit berechnet. - Für kleine Datensätze ist 'liblinear' eine gute Wahl, während 'sag' und 'saga' für größere schneller sind; - 'liblinear' kann standardmäßig nur binäre Klassifizierung verarbeiten. Um ein One-vs-Rest-Schema für den Multiklassenfall anzuwenden, kann es mit der :class:`~sklearn.multiclass.OneVsRestClassifier`-Klasse verpackt werden. .. warning:: Die Wahl des Algorithmus hängt von der gewählten Strafe ab (`l1_ratio=0` für L2-Strafe, `l1_ratio=1` für L1-Strafe und `0 < l1_ratio < 1` für Elastic-Net) und von der Unterstützung für (multinomiale) Multiklassen: =============== ======================== ====================== solver l1_ratio multinomial multiclass =============== ======================== ====================== 'lbfgs' l1_ratio=0 ja 'liblinear' l1_ratio=1 oder l1_ratio=0 nein 'newton-cg' l1_ratio=0 ja 'newton-cholesky' l1_ratio=0 ja 'sag' l1_ratio=0 ja 'saga' 0<=l1_ratio<=1 ja =============== ======================== ====================== .. note:: Die schnelle Konvergenz von 'sag' und 'saga' ist nur garantiert bei Merkmalen mit ungefähr gleicher Skala. Sie können die Daten mit einem Scaler aus :mod:`sklearn.preprocessing` vorverarbeiten. .. seealso:: Beachten Sie das :ref:`Benutzerhandbuch ` für weitere Informationen zu :class:`LogisticRegression` und insbesondere die :ref:`Tabelle ` die Solver/Strafe-Unterstützungen zusammenfasst. .. versionadded:: 0.17 Stochastic Average Gradient (SAG) Descent Solver. Multiklassen-Unterstützung in Version 0.18. .. versionadded:: 0.19 SAGA Solver. .. versionchanged:: 0.22 Der Standard-Solver wurde in 0.22 von 'liblinear' auf 'lbfgs' geändert. .. versionadded:: 1.2 Newton-Cholesky Solver. Multiklassen-Unterstützung in Version 1.6.	'lbfgs'
	max_iter max_iter: int, default=100 Maximale Anzahl von Iterationen, die die Solver zur Konvergenz benötigen.	100
	verbose verbose: int, default=0 Für die Solver liblinear und lbfgs setzen Sie verbose auf eine beliebige positive Zahl für die Ausführlichkeit.	0
	warm_start warm_start: bool, default=False Wenn auf True gesetzt, wird die Lösung des vorherigen Aufrufs von fit als Initialisierung wiederverwendet, andernfalls wird die vorherige Lösung einfach gelöscht. Nützlich für den liblinear-Solver. Siehe :term:`das Glossar `. .. versionadded:: 0.17 warm_start zur Unterstützung der Solver lbfgs, newton-cg, sag, saga.	False
	n_jobs n_jobs: int, default=None Hat keine Auswirkung. .. deprecated:: 1.8 `n_jobs` ist in Version 1.8 veraltet und wird in 1.10 entfernt.	None

	copy copy: bool, Standard=True Wenn False, versuchen Sie, eine Kopie zu vermeiden und stattdessen direkt zu skalieren. Dies ist nicht garantiert, dass es immer direkt funktioniert; z.B. wenn die Daten kein NumPy-Array oder eine scipy.sparse CSR-Matrix sind, kann immer noch eine Kopie zurückgegeben werden.	True
	with_mean with_mean: bool, Standard=True Wenn True, zentrieren Sie die Daten vor der Skalierung. Dies funktioniert nicht (und löst eine Ausnahme aus), wenn versucht, auf Sparse-Matrizen angewendet zu werden, da deren Zentrierung den Aufbau einer dichten Matrix erfordert, die in gängigen Anwendungsfällen wahrscheinlich zu groß ist, um in den Speicher zu passen.	True
	with_std with_std: bool, Standard=True Wenn True, skalieren Sie die Daten auf Einheitsvarianz (oder äquivalent, Einheitsstandardabweichung).	True