Version 1.6#

Eine kurze Beschreibung der wichtigsten Highlights des Releases finden Sie unter Release Highlights für scikit-learn 1.6.

Legende für Changelogs

Hauptmerkmal etwas Großes, das Sie vorher nicht tun konnten.
Merkmal etwas, das Sie vorher nicht tun konnten.
Effizienz Ein bestehendes Merkmal erfordert nun möglicherweise weniger Rechenleistung oder Speicher.
Verbesserung eine sonstige kleinere Verbesserung.
Korrektur Etwas, das zuvor nicht wie dokumentiert – oder nach vernünftigen Erwartungen – funktionierte, sollte nun funktionieren.
API-Änderung Sie müssen Ihren Code ändern, um in Zukunft die gleiche Wirkung zu erzielen; oder ein Merkmal wird in Zukunft entfernt.

Version 1.6.1#

Januar 2025

Geänderte Modelle#

Fix Das Flag tags.input_tags.sparse wurde für die Mehrheit der Schätzer korrigiert. Von Antoine Baker #30187

Änderungen, die viele Module betreffen#

Fix _more_tags, _get_tags und _safe_tags lösen jetzt eine DeprecationWarning anstelle einer FutureWarning aus, um nur Entwickler und nicht Endbenutzer zu benachrichtigen. Von Guillaume Lemaitre in #30573

`sklearn.metrics`#

Fix Regression behoben, bei der ein scikit-learn-Metrik, der auf PyTorch CPU-Tensoren aufgerufen wurde, einen Fehler auslöste (mit deaktivierter Array-API-Verteilung, was der Standard ist). Von Loïc Estève #30454

`sklearn.model_selection`#

Fix cross_validate, cross_val_predict und cross_val_score akzeptieren jetzt params=None, wenn das Metadaten-Routing aktiviert ist. Von Adrin Jalali #30451

`sklearn.tree`#

Fix Verwenden Sie log2 anstelle von ln zum Aufbau von Bäumen, um das Verhalten früherer Versionen beizubehalten. Von Thomas Fan #30557

`sklearn.utils`#

Enhancement utils.estimator_checks.check_estimator_sparse_tag stellt sicher, dass der Estimator-Tag input_tags.sparse mit seiner fit-Methode konsistent ist (Akzeptieren von spärlichen Eingaben X oder Auslösen des entsprechenden Fehlers). Von Antoine Baker #30187
Fix Lösen Sie eine DeprecationWarning aus, wenn keine konkrete Implementierung von __sklearn_tags__ im MRO des Estimators vorhanden ist. Wir bitten darum, von BaseEstimator zu erben, das __sklearn_tags__ implementiert. Von Guillaume Lemaitre #30516

Version 1.6.0#

Dezember 2024

Änderungen, die viele Module betreffen#

Enhancement __sklearn_tags__ wurde zur Einstellung von Tags in Estimators eingeführt. Weitere Details unter Estimator-Tags. Von Thomas Fan und Adrin Jalali #29677
Enhancement Scikit-learn-Klassen und -Funktionen können verwendet werden, während nur eine import sklearn Importzeile vorhanden ist. Zum Beispiel funktioniert import sklearn; sklearn.svm.SVC() jetzt. Von Thomas Fan #29793
Fix Die Klassen metrics.ConfusionMatrixDisplay, metrics.RocCurveDisplay, calibration.CalibrationDisplay, metrics.PrecisionRecallDisplay, metrics.PredictionErrorDisplay und inspection.PartialDependenceDisplay behandeln jetzt korrekt Matplotlib-Aliase für Stilparameter (z. B. c und color, ls und linestyle usw.). Von Joseph Barbier #30023
API Change utils.validation.validate_data wurde eingeführt und ersetzt die bisher private Methode base.BaseEstimator._validate_data. Dies ist für Entwickler von Drittanbieter-Estimators gedacht, die diese Funktion in den meisten Fällen anstelle von utils.check_array und utils.check_X_y verwenden sollten. Von Adrin Jalali #29696

Unterstützung für Array API#

Zusätzliche Schätzer und Funktionen wurden aktualisiert, um Unterstützung für alle Array API-konformen Eingaben zu bieten.

Weitere Details finden Sie in Array API-Unterstützung (experimentell).

Feature model_selection.GridSearchCV, model_selection.RandomizedSearchCV, model_selection.HalvingGridSearchCV und model_selection.HalvingRandomSearchCV unterstützen jetzt Array API-kompatible Eingaben, wenn ihre Basis-Estimators dies tun. Von Tim Head und Olivier Grisel #27096
Feature sklearn.metrics.f1_score unterstützt jetzt Array API-kompatible Eingaben. Von Omar Salman #27369
Feature preprocessing.LabelEncoder unterstützt jetzt Array API-kompatible Eingaben. Von Omar Salman #27381
Feature sklearn.metrics.mean_absolute_error unterstützt jetzt Array API-kompatible Eingaben. Von Edoardo Abati #27736
Feature sklearn.metrics.mean_tweedie_deviance unterstützt jetzt Array API-kompatible Eingaben. Von Thomas Li #28106
Feature sklearn.metrics.pairwise.cosine_similarity unterstützt jetzt Array API-kompatible Eingaben. Von Edoardo Abati #29014
Feature sklearn.metrics.pairwise.paired_cosine_distances unterstützt jetzt Array API-kompatible Eingaben. Von Edoardo Abati #29112
Feature sklearn.metrics.cluster.entropy unterstützt jetzt Array API-kompatible Eingaben. Von Yaroslav Korobko #29141
Feature sklearn.metrics.mean_squared_error unterstützt jetzt Array API-kompatible Eingaben. Von Yaroslav Korobko #29142
Feature sklearn.metrics.pairwise.additive_chi2_kernel unterstützt jetzt Array API-kompatible Eingaben. Von Yaroslav Korobko #29144
Feature sklearn.metrics.d2_tweedie_score unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29207
Feature sklearn.metrics.max_error unterstützt jetzt Array API-kompatible Eingaben. Von Edoardo Abati #29212
Feature sklearn.metrics.mean_poisson_deviance unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29227
Feature sklearn.metrics.mean_gamma_deviance unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29239
Feature sklearn.metrics.pairwise.cosine_distances unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29265
Feature sklearn.metrics.pairwise.chi2_kernel unterstützt jetzt Array API-kompatible Eingaben. Von Yaroslav Korobko #29267
Feature sklearn.metrics.mean_absolute_percentage_error unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29300
Feature sklearn.metrics.pairwise.paired_euclidean_distances unterstützt jetzt Array API-kompatible Eingaben. Von Emily Chen #29389
Feature sklearn.metrics.pairwise.euclidean_distances und sklearn.metrics.pairwise.rbf_kernel unterstützen jetzt Array API-kompatible Eingaben. Von Omar Salman #29433
Feature sklearn.metrics.pairwise.linear_kernel, sklearn.metrics.pairwise.sigmoid_kernel und sklearn.metrics.pairwise.polynomial_kernel unterstützen jetzt Array API-kompatible Eingaben. Von Omar Salman #29475
Feature sklearn.metrics.mean_squared_log_error und sklearn.metrics.root_mean_squared_log_error unterstützen jetzt Array API-kompatible Eingaben. Von Virgil Chan #29709
Feature preprocessing.MinMaxScaler mit clip=True unterstützt jetzt Array API-kompatible Eingaben. Von Shreekant Nandiyawar #29751
Die Unterstützung für das bald als veraltet geltende Modul cupy.array_api wurde zugunsten der direkten Unterstützung des Top-Level-Moduls cupy entfernt, möglicherweise über den Kompatibilitäts-Wrapper array_api_compat.cupy. Von Olivier Grisel #29639

Metadaten-Routing#

Weitere Details finden Sie in Metadaten-Routing Benutzerhandbuch.

Feature semi_supervised.SelfTrainingClassifier unterstützt jetzt Metadaten-Routing. Die `fit`-Methode akzeptiert jetzt **fit_params, die über ihre fit-Methoden an die zugrundeliegenden Estimators weitergegeben werden. Darüber hinaus akzeptieren die Methoden predict, predict_proba, predict_log_proba, score und decision_function ebenfalls **params, die über ihre jeweiligen Methoden an die zugrundeliegenden Estimators weitergegeben werden. Von Adam Li #28494
Feature ensemble.StackingClassifier und ensemble.StackingRegressor unterstützen jetzt Metadaten-Routing und geben **fit_params über ihre fit-Methoden an die zugrundeliegenden Estimators weiter. Von Stefanie Senger #28701
Feature model_selection.learning_curve unterstützt jetzt Metadaten-Routing für die fit-Methode seines Estimators und für seinen zugrundeliegenden CV-Splitter und Scorer. Von Stefanie Senger #28975
Feature compose.TransformedTargetRegressor unterstützt jetzt Metadaten-Routing in seinen Methoden fit und predict und leitet die entsprechenden Parameter an den zugrundeliegenden Regressor weiter. Von Omar Salman #29136
Feature feature_selection.SequentialFeatureSelector unterstützt jetzt Metadaten-Routing in seiner fit-Methode und leitet die entsprechenden Parameter an die Funktion model_selection.cross_val_score weiter. Von Omar Salman #29260
Feature model_selection.permutation_test_score unterstützt jetzt Metadaten-Routing für die fit-Methode seines Estimators und für seinen zugrundeliegenden CV-Splitter und Scorer. Von Adam Li #29266
Feature feature_selection.RFE und feature_selection.RFECV unterstützen jetzt Metadaten-Routing. Von Omar Salman #29312
Feature model_selection.validation_curve unterstützt jetzt Metadaten-Routing für die fit-Methode seines Estimators und für seinen zugrundeliegenden CV-Splitter und Scorer. Von Stefanie Senger #29329
Fix Metadaten werden korrekt an gruppierte CV-Splitter über linear_model.RidgeCV und linear_model.RidgeClassifierCV weitergeleitet, und UnsetMetadataPassedError wurde für linear_model.RidgeClassifierCV mit Standard-Scoring behoben. Von Stefanie Senger #29634
Fix Viele Methodenargumente, die nicht in den Routing-Mechanismus einbezogen werden sollten, sind jetzt ausgeschlossen und die Methoden set_{method}_request werden für sie nicht mehr generiert. Von Adrin Jalali #29920

Offizielle Unterstützung für PyPy eingestellt#

Aufgrund begrenzter Wartungsressourcen und einer geringen Nutzerzahl wurde die offizielle PyPy-Unterstützung eingestellt. Einige Teile von scikit-learn funktionieren möglicherweise weiterhin, aber PyPy wird in der Continuous Integration von scikit-learn nicht mehr getestet. Von Loïc Estève #29128

Unterstützung für die Erstellung mit setuptools eingestellt#

Ab scikit-learn 1.6 wurde die Unterstützung für die Erstellung mit setuptools entfernt. Meson ist die einzig unterstützte Methode zum Erstellen von scikit-learn. Von Loïc Estève #29400

Unterstützung für freigethreadetes CPython 3.13#

scikit-learn hat eine vorläufige Unterstützung für freigethreadetes CPython, insbesondere sind freigethreadete Wheels für alle unsere unterstützten Plattformen verfügbar.

Freigethreadetes (auch bekannt als nogil) CPython 3.13 ist eine experimentelle Version von CPython 3.13, die darauf abzielt, effiziente Multi-Threading-Anwendungsfälle durch die Entfernung des Global Interpreter Lock (GIL) zu ermöglichen.

Weitere Details zu free-threaded CPython finden Sie in der py-free-threading Dokumentation, insbesondere wie Sie ein free-threaded CPython installieren und Ecosystem-Kompatibilität-Tracking.

Probieren Sie freigethreadetes CPython gerne in Ihrem Anwendungsfall aus und melden Sie etwaige Probleme!

Von Loïc Estève und vielen anderen Personen aus dem breiteren Scientific Python- und CPython-Ökosystem, zum Beispiel Nathan Goldbaum, Ralf Gommers, Edgar Andrés Margffoy Tuay. #30360

`sklearn.base`#

Enhancement Eine Funktion base.is_clusterer wurde hinzugefügt, die bestimmt, ob ein gegebener Estimator zur Kategorie "Clusterer" gehört. Von Christian Veenhuis #28936
API Change Das Übergeben eines Klassenobjekts an is_classifier, is_regressor und is_outlier_detector ist jetzt veraltet. Übergeben Sie stattdessen eine Instanz. Von Adrin Jalali #30122

`sklearn.calibration`#

API Change cv="prefit" ist für CalibratedClassifierCV veraltet. Verwenden Sie stattdessen FrozenEstimator, wie z. B. CalibratedClassifierCV(FrozenEstimator(estimator)). Von Adrin Jalali #30171

`sklearn.cluster`#

API Change Der Parameter copy von cluster.Birch wurde in Version 1.6 als veraltet markiert und wird in Version 1.8 entfernt. Er hat keine Auswirkung, da der Estimator keine In-Place-Operationen an den Eingabedaten durchführt. Von Yao Xiao #29124

`sklearn.compose`#

Enhancement sklearn.compose.ColumnTransformer verbose_feature_names_out akzeptiert jetzt Zeichenkettenformate oder aufrufbare Objekte zur Generierung von Feature-Namen. Von Marc Bresson #28934

`sklearn.covariance`#

Efficiency Das Training von covariance.MinCovDet ist jetzt etwas schneller. Von Antony Lee #29835

`sklearn.cross_decomposition`#

Fix cross_decomposition.PLSRegression löst nun korrekt einen Fehler aus, wenn n_components größer als n_samples ist. Von Thomas Fan #29710

`sklearn.datasets`#

Feature datasets.fetch_file ermöglicht das Herunterladen beliebiger Datendateien aus dem Web. Es unterstützt lokales Caching, Integritätsprüfungen mit SHA256-Digests und automatische Wiederholungsversuche bei HTTP-Fehlern. Von Olivier Grisel #29354

`sklearn.decomposition`#

Enhancement LatentDirichletAllocation verfügt nun über den Parameter normalize in den Methoden transform und fit_transform, um zu steuern, ob die Dokumenten-Themenverteilung normalisiert wird. Von Adrin Jalali #30097
Fix IncrementalPCA löst nun nur dann einen ValueError aus, wenn die Anzahl der Stichproben in den Eingabedaten für partial_fit bei der ersten Aufruf von partial_fit kleiner als die Anzahl der Komponenten ist. Nachfolgende Aufrufe von partial_fit unterliegen dieser Einschränkung nicht mehr. Von Thomas Gessey-Jones #30224

`sklearn.discriminant_analysis`#

Fix discriminant_analysis.QuadraticDiscriminantAnalysis löst nun eine LinAlgWarning aus, wenn kollinare Variablen vorhanden sind. Diese Fehler können mit dem Attribut reg_param unterdrückt werden. Von Alihan Zihna #19731

`sklearn.ensemble`#

Feature ensemble.ExtraTreesClassifier und ensemble.ExtraTreesRegressor unterstützen nun fehlende Werte in der Datenmatrix X. Fehlende Werte werden behandelt, indem alle Stichproben beim Durchlaufen des Baumes zufällig auf den linken oder rechten Kindknoten verschoben werden. Von Adam Li #28268
Efficiency Geringfügige Laufzeitverbesserung beim Trainieren von ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor durch Parallelisierung der anfänglichen Suche nach Schwellenwerten für die Bins. Von Christian Lorentzen #28064
Efficiency ensemble.IsolationForest führt nun parallele Jobs während predict aus, was zu einer Beschleunigung von bis zu 2-4x bei Stichprobengrößen über 2000 mit joblib führt. Von Adam Li und Sérgio Pereira #28622
Enhancement Die Ausführlichkeit von ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor ist nun granularer steuerbar. Mit verbose = 1 werden nur Zusammenfassungsnachrichten ausgegeben, mit verbose >= 2 wird die vollständige Information wie zuvor ausgegeben. Von Christian Lorentzen #28179
API Change Der Parameter algorithm von ensemble.AdaBoostClassifier ist veraltet und wird in Version 1.8 entfernt. Von Jérémie du Boisberranger #29997

`sklearn.feature_extraction`#

Fix feature_extraction.text.TfidfVectorizer behält nun korrekt den dtype von idf_ basierend auf den Eingabedaten. Von Guillaume Lemaitre #30022

`sklearn.frozen`#

Major Feature FrozenEstimator wird nun eingeführt und ermöglicht das Einfrieren eines Schätzers. Das bedeutet, dass der Aufruf von .fit darauf keine Auswirkung hat und ein clone(frozenestimator) denselben Schätzer und nicht einen nicht trainierten Klon zurückgibt. #29705 Von Adrin Jalali #29705

`sklearn.impute`#

Fix impute.KNNImputer schließt Stichproben mit NaN-Distanzen aus, wenn der Mittelwert für gleichmäßige Gewichte berechnet wird. Von Xuefeng Xu #29135
Fix Wenn min_value und max_value Array-ähnlich sind und einige Merkmale aufgrund von keep_empty_features=False fallen gelassen werden, löst impute.IterativeImputer keinen Fehler mehr aus und indiziert nun korrekt. Von Guntitat Sawadwuthikul #29451
Fix impute.IterativeImputer wurde korrigiert, um sicherzustellen, dass der iterative Prozess nicht übersprungen wird, wenn keep_empty_features auf True gesetzt ist. Von Arif Qodari #29779
API Change Fügt eine Warnung in impute.SimpleImputer hinzu, wenn keep_empty_feature=False und strategy="constant" sind. In diesem Fall werden leere Merkmale nicht verworfen, und dieses Verhalten wird sich in Version 1.8 ändern. Von Arthur Courselle und Simon Riou #29950

`sklearn.linear_model`#

Enhancement Der solver="newton-cholesky" in linear_model.LogisticRegression und linear_model.LogisticRegressionCV wurde erweitert, um den vollständigen multinomialen Verlust in einem multiklassen-Szenario zu unterstützen. Von Christian Lorentzen #28840
Fix In linear_model.Ridge und linear_model.RidgeCV hat das Attribut coef_ nach fit nun die Form (n_samples,), wie bei anderen linearen Modellen. Von Maxwell Liu, Guillaume Lemaitre und Adrin Jalali #19746
Fix linear_model.LogisticRegressionCV korrigiert die Handhabung von Stichprobengewichten für die Berechnung von Testbewertungen. Von Shruti Nath #29419
Fix linear_model.LassoCV und linear_model.ElasticNetCV berücksichtigen nun Stichprobengewichte zur Definition des Suchgitters für den intern abgestimmten Hyperparameter alpha. Von John Hopfensperger und Shruti Nath #29442
Fix linear_model.LogisticRegression, linear_model.PoissonRegressor, linear_model.GammaRegressor, linear_model.TweedieRegressor berücksichtigen nun Stichprobengewichte, um zu entscheiden, wann auf solver='lbfgs' zurückgegriffen wird, falls solver='newton-cholesky' numerisch instabil wird. Von Antoine Baker #29818
Fix linear_model.RidgeCV verwendet nun korrekt Vorhersagen auf derselben Skala wie das Ziel, das während fit gesehen wurde. Diese Vorhersagen werden in cv_results_ gespeichert, wenn scoring != None ist. Zuvor wurden die Vorhersagen mit der Quadratwurzel der Stichprobengewichte skaliert und um den Mittelwert des Ziels verschoben, was zu einer falschen Einschätzung der Bewertung führte. Von Guillaume Lemaitre, Jérôme Dockes und Hanmin Qin #29842
Fix linear_model.RidgeCV unterstützt nun benutzerdefinierte Multioutput-Scorer, indem der Scorer die Multioutput-Mittelung verwaltet. Zuvor wurden die Vorhersagen und die tatsächlichen Zielwerte beide auf ein 1D-Array reduziert, bevor der Fehler berechnet wurde. Von Guillaume Lemaitre #29884
Fix linear_model.LinearRegression setzt nun den Parameter cond beim Aufruf des scipy.linalg.lstsq-Solvers auf dichten Eingabedaten. Dies gewährleistet numerisch robustere Ergebnisse bei Rang-defizienten Daten. Insbesondere behebt es empirisch die erwartete Äquivalenzeigenschaft zwischen dem Training mit neu gewichteten oder mit wiederholten Datenpunkten. Von Antoine Baker #30040
Fix linear_model.LogisticRegression und andere lineare Modelle, die solver="newton-cholesky" akzeptieren, melden nun die korrekte Anzahl von Iterationen, wenn sie aufgrund einer Rang-defizienten Hesse-Matrix auf den Solver "lbfgs" zurückfallen. Von Olivier Grisel #30100
Fix SGDOneClassSVM erbt nun korrekt von OutlierMixin und die Tags sind korrekt gesetzt. Von Guillaume Lemaitre #30227
API Change Der Parameter copy_X in linear_model.TheilSenRegressor wird als veraltet markiert, da der Parameter keine Auswirkung hat. copy_X wird in Version 1.8 entfernt. Von Adam Li #29105

`sklearn.manifold`#

Efficiency manifold.locally_linear_embedding und manifold.LocallyLinearEmbedding weisen nun effizienter den Speicher von dünnbesetzten Matrizen in den Methoden Hessian, Modified und LTSA zu. Von Giorgio Angelotti #28096

`sklearn.metrics`#

Efficiency sklearn.metrics.classification_report ist nun schneller durch Caching von Klassifizierungsbeschriftungen. Von Adrin Jalali #29738
Enhancement metrics.RocCurveDisplay.from_estimator, metrics.RocCurveDisplay.from_predictions, metrics.PrecisionRecallDisplay.from_estimator und metrics.PrecisionRecallDisplay.from_predictions akzeptieren nun ein neues Schlüsselwort despine, um die oberen und rechten Achsen des Plots zu entfernen und ihn übersichtlicher zu gestalten. Von Yao Xiao #26367
Enhancement sklearn.metrics.check_scoring akzeptiert nun raise_exc, um anzugeben, ob eine Ausnahme ausgelöst werden soll, wenn eine Teilmenge der Scorer bei der multimetrischen Bewertung fehlschlägt, oder ob ein Fehlercode zurückgegeben werden soll. Von Stefanie Senger #28992
Fix metrics.roc_auc_score gibt nun korrekt np.nan zurück und warnt den Benutzer, wenn nur eine Klasse in den Labels vorhanden ist. Von Hleb Levitski und Janez Demšar #27412, #30013
Fix Die Funktionen metrics.mean_squared_log_error und metrics.root_mean_squared_log_error prüfen nun, ob die Eingaben im korrekten Definitionsbereich für die Funktion \(y=\log(1+x)\) liegen, anstatt für \(y=\log(x)\). Die Funktionen metrics.mean_absolute_error, metrics.mean_absolute_percentage_error, metrics.mean_squared_error und metrics.root_mean_squared_error prüfen nun explizit, ob ein Skalar zurückgegeben wird, wenn multioutput=uniform_average ist. Von Virgil Chan #29709
API Change Der Parameter assert_all_finite der Funktionen metrics.pairwise.check_pairwise_arrays und metrics.pairwise_distances wird in ensure_all_finite umbenannt. force_all_finite wird in Version 1.8 entfernt. Von Jérémie du Boisberranger #29404
API Change scoring="neg_max_error" sollte anstelle von scoring="max_error" verwendet werden, was nun veraltet ist. Von Farid “Freddie” Taba #29462
API Change Der Standardwert des Parameters response_method von metrics.make_scorer wird von None auf "predict" geändert und None wird in Version 1.8 entfernt. In der Zwischenzeit ist None äquivalent zu "predict". Von Jérémie du Boisberranger #30001

`sklearn.model_selection`#

Enhancement GroupKFold hat nun die Möglichkeit, Gruppen bei shuffle=True in verschiedene Folds zu mischen. Von Zachary Vealey #28519
Enhancement Es ist nicht mehr notwendig, fit auf einem FixedThresholdClassifier aufzurufen, wenn der zugrundeliegende Schätzer bereits trainiert ist. Von Adrin Jalali #30172
Fix Verbessert die Fehlermeldung, wenn model_selection.RepeatedStratifiedKFold.split ohne ein y-Argument aufgerufen wird. Von Anurag Varma #29402

`sklearn.neighbors`#

Enhancement neighbors.NearestNeighbors, neighbors.KNeighborsClassifier, neighbors.KNeighborsRegressor, neighbors.RadiusNeighborsClassifier, neighbors.RadiusNeighborsRegressor, neighbors.KNeighborsTransformer, neighbors.RadiusNeighborsTransformer und neighbors.LocalOutlierFactor funktionieren nun mit metric="nan_euclidean" und unterstützen nan-Eingaben. Von Carlo Lemos, Guillaume Lemaitre und Adrin Jalali #25330
Enhancement Fügt neighbors.NearestCentroid.decision_function, neighbors.NearestCentroid.predict_proba und neighbors.NearestCentroid.predict_log_proba zum Schätzer neighbors.NearestCentroid hinzu. Unterstützt den Fall, wenn X dünnbesetzt ist und shrinking_threshold nicht None ist in neighbors.NearestCentroid. Von Matthew Ning #26689
Erweiterung predict, predict_proba und score von neighbors.KNeighborsClassifier und neighbors.RadiusNeighborsClassifier akzeptieren nun X=None als Eingabe. In diesem Fall werden Vorhersagen für alle Trainingsdatenpunkte zurückgegeben, und die Punkte werden nicht als ihre eigenen Nachbarn berücksichtigt. Von Dmitry Kobak #30047
Korrektur neighbors.LocalOutlierFactor gibt in der fit Methode eine Warnung aus, wenn doppelte Werte in den Trainingsdaten zu einer ungenauen Erkennung von Ausreißern führen. Von Henrique Caroço #28773

`sklearn.neural_network`#

Korrektur neural_network.MLPRegressor stürzt nicht mehr ab, wenn das Modell divergiert und early_stopping aktiviert ist. Von Marc Bresson #29773

`sklearn.pipeline`#

Hauptmerkmal pipeline.Pipeline kann jetzt Metadaten bis zu dem Schritt transformieren, der die Metadaten benötigt, was mit dem Parameter transform_input eingestellt werden kann. Von Adrin Jalali #28901
Erweiterung pipeline.Pipeline warnt nun, wenn die Pipeline nicht angepasst wurde, bevor Methoden aufgerufen werden, die eine Anpassung erfordern. Diese Warnung wird in Version 1.8 zu einem Fehler. Von Adrin Jalali #29868
Korrektur Ein Problem mit Tags und dem Schätzertyp von Pipeline wurde behoben, wenn die Pipeline leer ist. Dies ermöglicht die korrekte Darstellung der HTML-Repräsentation einer leeren Pipeline. Von Gennaro Daniele Acciaro #30203

`sklearn.preprocessing`#

Erweiterung Die Option warn wurde dem Parameter handle_unknown in preprocessing.OneHotEncoder hinzugefügt. Von Hleb Levitski #28637
Erweiterung Die HTML-Darstellung von preprocessing.FunctionTransformer zeigt nun den Funktionsnamen im Label an. Von Yao Xiao #29158
Korrektur preprocessing.PowerTransformer verwendet nun scipy.special.inv_boxcox, um nan auszugeben, wenn die Eingabe der inversen BoxCox-Transformation ungültig ist. Von Xuefeng Xu #27875

`sklearn.semi_supervised`#

API-Änderung semi_supervised.SelfTrainingClassifier hat den Parameter base_estimator zugunsten von estimator als veraltet markiert. Von Adam Li #28494

`sklearn.tree`#

Merkmal tree.ExtraTreeClassifier und tree.ExtraTreeRegressor unterstützen nun fehlende Werte in der Datenmatrix X. Fehlende Werte werden behandelt, indem alle Stichproben beim Durchlaufen des Baumes zufällig auf die linke oder rechte Kindknoten verschoben werden. Von Adam Li und Loïc Estève #27966, #30318
Korrektur Anführungszeichen für Labels und Feature-Namen beim Exportieren von Bäumen in das Graphviz-Format werden nun escaped. Von Santiago M. Mola. #17575

`sklearn.utils`#

Erweiterung utils.check_array akzeptiert nun ensure_non_negative zur Prüfung auf negative Werte im übergebenen Array, was bisher nur durch den Aufruf von utils.check_non_negative möglich war. Von Tamara Atanasoska #29540
Erweiterung check_estimator und parametrize_with_checks prüfen und schlagen nun fehl, wenn der Klassifikator den Tag tags.classifier_tags.multi_class = False hat, aber bei Multi-Class-Daten nicht fehlschlägt. Von Adrin Jalali #29874
Erweiterung utils.validation.check_is_fitted funktioniert nun auch für zustandslose Schätzer. Ein Schätzer kann angeben, dass er zustandlos ist, indem er den Tag requires_fit setzt. Weitere Informationen finden Sie unter Estimator Tags. Von Adrin Jalali #29880
Erweiterung Änderungen an check_estimator und parametrize_with_checks.
- check_estimator führt neue Argumente ein: on_skip, on_fail und callback zur Steuerung des Verhaltens des Check-Runners. Weitere Details finden Sie in der API-Dokumentation.
- generate_only=True ist in check_estimator veraltet. Verwenden Sie stattdessen estimator_checks_generator.
- Der Tag _xfail_checks für Schätzer wurde entfernt. Um nun anzugeben, welche Tests voraussichtlich fehlschlagen werden, können Sie ein Wörterbuch an check_estimator als Parameter expected_failed_checks übergeben. Ebenso kann der Parameter expected_failed_checks in parametrize_with_checks verwendet werden, was ein aufrufbares Objekt ist, das ein Wörterbuch der Form zurückgibt.
```
{
    "check_name": "reason to mark this check as xfail",
}
```
Von Adrin Jalali #30149
Korrektur utils.estimator_checks.parametrize_with_checks und utils.estimator_checks.check_estimator unterstützen nun Schätzer, bei denen set_output aufgerufen wurde. Von Adrin Jalali #29869
API-Änderung Der Parameter assert_all_finite der Funktionen utils.check_array, utils.check_X_y, utils.as_float_array wurde in ensure_all_finite umbenannt. force_all_finite wird in Version 1.8 entfernt. Von Jérémie du Boisberranger #29404
API-Änderung utils.estimator_checks.check_sample_weights_invariance wurde durch utils.estimator_checks.check_sample_weight_equivalence_on_dense_data ersetzt, das ganzzahlige (einschließlich Null) Gewichte verwendet, und utils.estimator_checks.check_sample_weight_equivalence_on_sparse_data, das dasselbe für spärliche Daten tut. Von Antoine Baker #29818, #30137
API-Änderung Die Verwendung von _estimator_type zur Festlegung des Schätzertyps ist veraltet. Erben Sie stattdessen von ClassifierMixin, RegressorMixin, TransformerMixin oder OutlierMixin. Alternativ können Sie estimator_type in Tags in der Methode __sklearn_tags__ setzen. Von Adrin Jalali #30122

Code- und Dokumentationsbeitragende

Vielen Dank an alle, die seit Version 1.5 zur Wartung und Verbesserung des Projekts beigetragen haben, darunter

Aaron Schumacher, Abdulaziz Aloqeely, abhi-jha, Acciaro Gennaro Daniele, Adam J. Stewart, Adam Li, Adeel Hassan, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Aisha, Akanksha Mhadolkar, Akihiro Kuno, Alberto Torres, alexqiao, Alihan Zihna, Aniruddha Saha, antoinebaker, Antony Lee, Anurag Varma, Arif Qodari, Arthur Courselle, ArthurDbrn, Arturo Amor, Aswathavicky, Audrey Flanders, aurelienmorgan, Austin, awwwyan, AyGeeEm, a.zy.lee, baggiponte, BlazeStorm001, bme-git, Boney Patel, brdav, Brigitta Sipőcz, Cailean Carter, Camille Troillard, Carlo Lemos, Christian Lorentzen, Christian Veenhuis, Christine P. Chai, claudio, Conrad Stevens, datarollhexasphericon, Davide Chicco, David Matthew Cherney, Dea María Léon, Deepak Saldanha, Deepyaman Datta, dependabot[bot], dinga92, Dmitry Kobak, Domenico, Drew Craeton, dymil, Edoardo Abati, EmilyXinyi, Eric Larson, Evelyn, fabianhenning, Farid “Freddie” Taba, Gael Varoquaux, Giorgio Angelotti, Hleb Levitski, Guillaume Lemaitre, Guntitat Sawadwuthikul, Haesun Park, Hanjun Kim, Henrique Caroço, hhchen1105, Hugo Boulenger, Ilya Komarov, Inessa Pawson, Ivan Pan, Ivan Wiryadi, Jaimin Chauhan, Jakob Bull, James Lamb, Janez Demšar, Jérémie du Boisberranger, Jérôme Dockès, Jirair Aroyan, João Morais, Joe Cainey, Joel Nothman, John Enblom, JorgeCardenas, Joseph Barbier, jpienaar-tuks, Julian Chan, K.Bharat Reddy, Kevin Doshi, Lars, Loic Esteve, Lucas Colley, Lucy Liu, lunovian, Marc Bresson, Marco Edward Gorelli, Marco Maggi, Marco Wolsza, Maren Westermann, MarieS-WiMLDS, Martin Helm, Mathew Shen, mathurinm, Matthew Feickert, Maxwell Liu, Meekail Zain, Michael Dawson, Miguel Cárdenas, m-maggi, mrastgoo, Natalia Mokeeva, Nathan Goldbaum, Nathan Orgera, nbrown-ScottLogic, Nikita Chistyakov, Nithish Bolleddula, Noam Keidar, NoPenguinsLand, Norbert Preining, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Piotr, Priyank Shroff, Priyansh Gupta, Quentin Barthélemy, Rachit23110261, Rahil Parikh, raisadz, Rajath, renaissance0ne, Reshama Shaikh, Roberto Rosati, Robert Pollak, rwelsch427, Santiago Castro, Santiago M. Mola, scikit-learn-bot, sean moiselle, SHREEKANT VITTHAL NANDIYAWAR, Shruti Nath, Søren Bredlund Caspersen, Stefanie Senger, Stefano Gaspari, Steffen Schneider, Štěpán Sršeň, Sylvain Combettes, Tamara, Thomas, Thomas Gessey-Jones, Thomas J. Fan, Thomas Li, ThorbenMaa, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, Umberto Fasci, UV, vedpawar2254, Velislav Babatchev, Victoria Shevchenko, viktor765, Vince Carey, Virgil Chan, Wang Jiayi, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Zachary Vealey, Ziad Amerr

Version 1.6#

Version 1.6.1#

Geänderte Modelle#

Änderungen, die viele Module betreffen#

Version 1.6.0#

Änderungen, die viele Module betreffen#

Unterstützung für Array API#

Metadaten-Routing#

Offizielle Unterstützung für PyPy eingestellt#

Unterstützung für die Erstellung mit setuptools eingestellt#

Unterstützung für freigethreadetes CPython 3.13#

Diese Seite