Version 1.5#

Für eine kurze Beschreibung der wichtigsten Neuerungen dieser Version verweisen wir auf die Release Highlights für scikit-learn 1.5.

Legende für Changelogs

Hauptmerkmal etwas Großes, das Sie vorher nicht tun konnten.
Merkmal etwas, das Sie vorher nicht tun konnten.
Effizienz Ein bestehendes Merkmal erfordert nun möglicherweise weniger Rechenleistung oder Speicher.
Verbesserung eine sonstige kleinere Verbesserung.
Korrektur Etwas, das zuvor nicht wie dokumentiert – oder nach vernünftigen Erwartungen – funktionierte, sollte nun funktionieren.
API-Änderung Sie müssen Ihren Code ändern, um in Zukunft die gleiche Wirkung zu erzielen; oder ein Merkmal wird in Zukunft entfernt.

Version 1.5.2#

September 2024

Änderungen, die viele Module betreffen#

Fix Behoben einer Performance-Regression in einigen Cython-Modulen in sklearn._loss, sklearn.manifold, sklearn.metrics und sklearn.utils, die ohne OpenMP-Unterstützung kompiliert wurden. #29694 von Loïc Estèvce.

Änderungsprotokoll#

`sklearn.calibration`#

Fix Fehler auslösen, wenn LeaveOneOut in cv verwendet wird, was dem Verhalten von KFold(n_splits=n_samples) entspricht. #29545 von Lucy Liu

`sklearn.compose`#

Fix Behoben, dass compose.TransformedTargetRegressor keine UserWarning mehr auslöst, wenn die Transformation auf pandas oder polars gesetzt ist, da dies kein Transformer ist. #29401 von Stefanie Senger.

`sklearn.decomposition`#

Fix Erhöhung des Schwellenwerts für Rangdefizite im Whitening-Schritt von decomposition.FastICA mit whiten_solver="eigh" zur Verbesserung der Plattformunabhängigkeit des Schätzers. #29612 von Olivier Grisel.

`sklearn.metrics`#

Fix Behebung einer Regression in metrics.accuracy_score und metrics.zero_one_loss, die zu einem Fehler bei der Array-API-Weiterleitung mit Multilabel-Eingaben führte. #29336 von Edoardo Abati.

`sklearn.svm`#

Fix Behebung einer Regression in svm.SVC und svm.SVR, so dass nun C=float("inf") akzeptiert wird. #29780 von Guillaume Lemaitre.

Version 1.5.1#

Juli 2024

Änderungen, die viele Module betreffen#

Fix Behebung einer Regression bei der Validierung der Eingabedaten aller Schätzer, bei der ein unerwarteter Fehler ausgelöst wurde, wenn ein DataFrame, der auf einem schreibgeschützten Puffer basiert, übergeben wurde. #29018 von Jérémie du Boisberranger.
Fix Behebung einer Regression, die in einigen Konfigurationen zu einem Deadlock beim Import führte. #29235 von Jérémie du Boisberranger.

Änderungsprotokoll#

`sklearn.compose`#

Efficiency Behebung einer Performance-Regression in compose.ColumnTransformer, bei der die vollständigen Eingabedaten für jeden Transformer kopiert wurden, wenn n_jobs > 1 war. #29330 von Jérémie du Boisberranger.

`sklearn.metrics`#

Fix Behebung einer Regression in metrics.r2_score. Die Übergabe von Torch CPU-Tensoren mit deaktivierter Array-API-Weiterleitung führte zu einer Meldung über Nicht-CPU-Geräte, anstatt diese Eingaben implizit als reguläre NumPy-Arrays zu konvertieren. #29119 von @Olivier Grisel.
Fix Behebung einer Regression in metrics.zero_one_loss, die zu einem Fehler bei der Array-API-Weiterleitung mit Multilabel-Eingaben führte. #29269 von Yaroslav Korobko.

`sklearn.model_selection`#

Fix Behebung einer Regression in model_selection.GridSearchCV für Parameter-Grids mit heterogenen Parameterwerten. #29078 von Loïc Estève.
Fix Behebung einer Regression in model_selection.GridSearchCV für Parameter-Grids mit Schätzern als Parameterwerten. #29179 von Marco Gorelli.
Fix Behebung einer Regression in model_selection.GridSearchCV für Parameter-Grids mit Arrays unterschiedlicher Größe als Parameterwerte. #29314 von Marco Gorelli.

`sklearn.tree`#

Fix Behebung eines Problems in tree.export_graphviz und tree.plot_tree, die unter 32-Bit-Betriebssystemen potenziell zu Ausnahmen oder falschen Ergebnissen führen konnte. #29327 von Loïc Estève.

`sklearn.utils`#

API Change utils.validation.check_array verfügt über einen neuen Parameter force_writeable, um die Schreibbarkeit des Ausgabe-Arrays zu steuern. Wenn er auf True gesetzt ist, ist garantiert, dass das Ausgabe-Array schreibbar ist, und es wird eine Kopie erstellt, wenn das Eingabe-Array schreibgeschützt ist. Wenn er auf False gesetzt ist, gibt es keine Garantie für die Schreibbarkeit des Ausgabe-Arrays. #29018 von Jérémie du Boisberranger.

Version 1.5.0#

Mai 2024

Sicherheit#

Fix feature_extraction.text.CountVectorizer und feature_extraction.text.TfidfVectorizer speichern keine verworfenen Token mehr aus dem Trainingsdatensatz in ihrem Attribut stop_words_. Dieses Attribut würde zu häufige (über max_df) aber auch zu seltene Token (unter min_df) enthalten. Dies behebt ein potenzielles Sicherheitsproblem (Datenleck), wenn die verworfenen seltenen Token sensible Informationen aus dem Trainingsdatensatz enthalten, ohne dass der Modellentwickler dies weiß.

Hinweis: Benutzer dieser Klassen werden ermutigt, ihre Pipelines entweder mit der neuen scikit-learn-Version neu zu trainieren oder das Attribut stop_words_ von zuvor trainierten Instanzen dieser Transformer manuell zu löschen. Dieses Attribut ist nur zur Inspektion des Modells gedacht und hat keinen Einfluss auf das Verhalten der Transformer. #28823 von Olivier Grisel.

Geänderte Modelle#

Efficiency Das Subsampling in preprocessing.QuantileTransformer ist nun effizienter für dichte Arrays, aber die angepassten Quantile und die Ergebnisse von transform können sich leicht von zuvor unterscheiden (wobei die gleichen statistischen Eigenschaften erhalten bleiben). #27344 von Xuefeng Xu.
Enhancement decomposition.PCA, decomposition.SparsePCA und decomposition.TruncatedSVD setzen nun das Vorzeichen des Attributs components_ basierend auf den Komponentenwerten, anstatt die transformierten Daten als Referenz zu verwenden. Diese Änderung ist notwendig, um konsistente Vorzeichen der Komponenten über alle PCA-Löser hinweg anbieten zu können, einschließlich der neuen Option svd_solver="covariance_eigh", die in dieser Version eingeführt wurde.

Änderungen, die viele Module betreffen#

Fix Auslösen von ValueError mit einer informativen Fehlermeldung bei Übergabe von 1D-Sparse-Arrays an Methoden, die 2D-Sparse-Eingaben erwarten. #28988 von Olivier Grisel.
API Change Der Name des Eingabeparameters der Methode inverse_transform von Schätzern wurde auf X standardisiert. Infolgedessen ist Xt veraltet und wird in Version 1.7 in den folgenden Schätzern entfernt: cluster.FeatureAgglomeration, decomposition.MiniBatchNMF, decomposition.NMF, model_selection.GridSearchCV, model_selection.RandomizedSearchCV, pipeline.Pipeline und preprocessing.KBinsDiscretizer. #28756 von Will Dean.

Unterstützung für Array API#

Zusätzliche Schätzer und Funktionen wurden aktualisiert, um Unterstützung für alle Array API-konformen Eingaben zu bieten.

Weitere Details finden Sie in Array API-Unterstützung (experimentell).

Funktionen

sklearn.metrics.r2_score unterstützt nun Array-API-konforme Eingaben. #27904 von Eric Lindgren, Franck Charras, Olivier Grisel und Tim Head.

Klassen

linear_model.Ridge unterstützt nun die Array-API für den svd-Löser. Weitere Details finden Sie unter Array API-Unterstützung (experimentell). #27800 von Franck Charras, Olivier Grisel und Tim Head.

Unterstützung für die Erstellung mit Meson#

Ab scikit-learn 1.5 ist Meson die primäre unterstützte Methode zur Erstellung von scikit-learn.

Sofern wir keinen größeren Blocker entdecken, wird die Setuptools-Unterstützung in scikit-learn 1.6 eingestellt. Die Releases 1.5.x unterstützen die Erstellung von scikit-learn mit Setuptools.

Die Meson-Unterstützung für die Erstellung von scikit-learn wurde in #28040 von Loïc Estève hinzugefügt.

Metadaten-Routing#

Die folgenden Modelle unterstützen nun das Metadaten-Routing in einer oder mehreren ihrer Methoden. Weitere Details finden Sie im Metadaten-Routing Benutzerhandbuch.

Feature impute.IterativeImputer unterstützt nun Metadaten-Routing in seiner fit-Methode. #28187 von Stefanie Senger.
Feature ensemble.BaggingClassifier und ensemble.BaggingRegressor unterstützen nun Metadaten-Routing. Die fit-Methoden akzeptieren nun **fit_params, die über ihre fit-Methoden an die zugrundeliegenden Schätzer weitergeleitet werden. #28432 von Adam Li und Benjamin Bossan.
Feature linear_model.RidgeCV und linear_model.RidgeClassifierCV unterstützen nun Metadaten-Routing in ihrer fit-Methode und leiten Metadaten an das zugrundeliegende model_selection.GridSearchCV-Objekt oder den zugrundeliegenden Scorer weiter. #27560 von Omar Salman.
Feature GraphicalLassoCV unterstützt nun Metadaten-Routing in seiner fit-Methode und leitet Metadaten an den CV-Splitter weiter. #27566 von Omar Salman.
Feature linear_model.RANSACRegressor unterstützt nun Metadaten-Routing in seinen Methoden fit, score und predict und leitet Metadaten an die fit, score und predict-Methoden seines zugrundeliegenden Schätzers weiter. #28261 von Stefanie Senger.
Feature ensemble.VotingClassifier und ensemble.VotingRegressor unterstützen nun Metadaten-Routing und leiten **fit_params über ihre fit-Methoden an die zugrundeliegenden Schätzer weiter. #27584 von Stefanie Senger.
Feature pipeline.FeatureUnion unterstützt nun Metadaten-Routing in seinen Methoden fit und fit_transform und leitet Metadaten an die fit und fit_transform-Methoden der zugrundeliegenden Transformer weiter. #28205 von Stefanie Senger.
Fix Behebung eines Problems bei der Auflösung von Standard-Routing-Anfragen, die über Klassenattribute gesetzt wurden. #28435 von Adrin Jalali.
Fix Behebung eines Problems, wenn set_{method}_request-Methoden als ungebundene Methoden verwendet werden, was passieren kann, wenn man versucht, sie zu dekorieren. #28651 von Adrin Jalali.
Fix Verhinderung einer RecursionError, wenn Schätzer mit dem Standard-scoring-Parameter (None) Metadaten weiterleiten. #28712 von Stefanie Senger.

Änderungsprotokoll#

`sklearn.calibration`#

Fix Behebung einer Regression in calibration.CalibratedClassifierCV, bei der fälschlicherweise ein Fehler mit String-Zielen ausgelöst wurde. #28843 von Jérémie du Boisberranger.

`sklearn.cluster`#

Fix Die Klasse cluster.MeanShift konvergiert nun ordnungsgemäß für konstante Daten. #28951 von Akihiro Kuno.
Fix Kopie der vorab berechneten Sparse-Matrix innerhalb der fit-Methode von OPTICS erstellt, um eine In-place-Modifikation der Sparse-Matrix zu vermeiden. #28491 von Thanh Lam Dang.
Fix cluster.HDBSCAN unterstützt nun alle Metriken, die von sklearn.metrics.pairwise_distances unterstützt werden, wenn algorithm="brute" oder "auto" gesetzt ist. #28664 von Manideep Yenugula.

`sklearn.compose`#

Feature Ein angepasster compose.ColumnTransformer implementiert nun __getitem__, das die angepassten Transformer nach Namen zurückgibt. #27990 von Thomas Fan.
Enhancement compose.TransformedTargetRegressor löst nun in fit einen Fehler aus, wenn nur inverse_func bereitgestellt wird, ohne dass func (die standardmäßig die Identität wäre) explizit mit angegeben wurde. #28483 von Stefanie Senger.
Enhancement compose.ColumnTransformer kann nun die "remainder"-Spalten im angepassten Attribut transformers_ als Spaltennamen oder boolesche Masken statt als Spaltenindizes ausgeben. #27657 von Jérôme Dockes.
Fix Behebung eines Fehlers in compose.ColumnTransformer mit n_jobs > 1, bei dem die dazwischen liegenden ausgewählten Spalten als schreibgeschützte Arrays an die Transformer übergeben wurden. #28822 von Jérémie du Boisberranger.

`sklearn.cross_decomposition`#

Fix Das angepasste Attribut coef_ von cross_decomposition.PLSRegression berücksichtigt nun sowohl die Skalierung von X als auch von Y, wenn scale=True ist. Hinweis: Die vorherigen vorhergesagten Werte waren von diesem Fehler nicht betroffen. #28612 von Guillaume Lemaitre.
API-Änderung Verwirft Y zugunsten von y in den Methoden fit, transform und inverse_transform von: cross_decomposition.PLSRegression, cross_decomposition.PLSCanonical und cross_decomposition.CCA, sowie den Methoden fit und transform von: cross_decomposition.PLSSVD. Y wird in Version 1.7 entfernt. #28604 von David Leon.

`sklearn.datasets`#

Verbesserung Fügt optionale Argumente n_retries und delay zu den Funktionen datasets.fetch_20newsgroups, datasets.fetch_20newsgroups_vectorized, datasets.fetch_california_housing, datasets.fetch_covtype, datasets.fetch_kddcup99, datasets.fetch_lfw_pairs, datasets.fetch_lfw_people, datasets.fetch_olivetti_faces, datasets.fetch_rcv1 und datasets.fetch_species_distributions hinzu. Standardmäßig versuchen die Funktionen bei Netzwerkfehlern bis zu 3 Mal. #28160 von Zhehao Liu und Filip Karlo Došilović.

`sklearn.decomposition`#

Effizienz decomposition.PCA mit svd_solver="full" weist jetzt ein zusammenhängendes components_ Attribut zu anstelle eines nicht zusammenhängenden Slices der singulären Vektoren. Wenn n_components << n_features, kann dies etwas Speicher sparen und, was noch wichtiger ist, nachfolgende Aufrufe der transform Methode durch Nutzung der Cache-Lokalität von BLAS GEMM auf zusammenhängenden Arrays um mehr als eine Größenordnung beschleunigen. #27491 von Olivier Grisel.
Verbesserung PCA wählt nun automatisch den ARPACK-Solver für spärliche Eingaben, wenn svd_solver="auto" gesetzt ist, anstatt einen Fehler auszulösen. #28498 von Thanh Lam Dang.
Verbesserung decomposition.PCA unterstützt nun eine neue Solver-Option namens svd_solver="covariance_eigh", die eine um eine Größenordnung schnellere Ausführung und einen reduzierten Speicherverbrauch für Datensätze mit einer großen Anzahl von Datenpunkten und einer kleinen Anzahl von Merkmalen (z. B. n_samples >> 1000 > n_features) bietet. Die Option svd_solver="auto" wurde aktualisiert, um den neuen Solver für solche Datensätze automatisch zu verwenden. Dieser Solver akzeptiert auch spärliche Eingabedaten. #27491 von Olivier Grisel.
Fehlerbehebung decomposition.PCA fit mit svd_solver="arpack", whiten=True und einem Wert für n_components, der größer ist als der Rang der Trainingsmenge, gibt beim Transformieren von Hold-out-Daten keine unendlichen Werte mehr zurück. #27491 von Olivier Grisel.

`sklearn.dummy`#

Verbesserung dummy.DummyClassifier und dummy.DummyRegressor haben nach fit nun die Attribute n_features_in_ und feature_names_in_. #27937 von Marco vd Boom.

`sklearn.ensemble`#

Effizienz Verbessert die Laufzeit von predict von ensemble.HistGradientBoostingClassifier durch Vermeidung von predict_proba Aufrufen. #27844 von Christian Lorentzen.
Effizienz ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor sind nun ein winziges bisschen schneller, indem die Daten vorsortiert werden, bevor die Schwellenwerte für das Binning gefunden werden. #28102 von Christian Lorentzen.
Fehlerbehebung Behebt einen Fehler in ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor, wenn monotonic_cst für nicht-kategoriale Merkmale angegeben wird. #28925 von Xiao Yuan.

`sklearn.feature_extraction`#

Effizienz feature_extraction.text.TfidfTransformer ist nun schneller und speichereffizienter, indem ein NumPy-Vektor anstelle einer spärlichen Matrix zur Speicherung der inversen Dokumenthäufigkeit verwendet wird. #18843 von Paolo Montesel.
Verbesserung feature_extraction.text.TfidfTransformer erhält nun den Datentyp der Eingabematrix, wenn dieser np.float64 oder np.float32 ist. #28136 von Guillaume Lemaitre.

`sklearn.feature_selection`#

Verbesserung feature_selection.mutual_info_regression und feature_selection.mutual_info_classif unterstützen nun den Parameter n_jobs. #28085 von Neto Menoci und Florin Andrei.
Verbesserung Das Attribut cv_results_ von feature_selection.RFECV hat einen neuen Schlüssel, n_features, der ein Array mit der Anzahl der in jedem Schritt ausgewählten Merkmale enthält. #28670 von Miguel Silva.

`sklearn.impute`#

Verbesserung impute.SimpleImputer unterstützt nun benutzerdefinierte Strategien, indem eine Funktion anstelle eines Strategienamens übergeben wird. #28053 von Mark Elliot.

`sklearn.inspection`#

Fehlerbehebung inspection.DecisionBoundaryDisplay.from_estimator gibt keine Warnungen mehr über fehlende Merkmalsnamen aus, wenn ein polars.DataFrame übergeben wird. #28718 von Patrick Wang.

`sklearn.linear_model`#

Verbesserung Der Solver "newton-cg" in linear_model.LogisticRegression und linear_model.LogisticRegressionCV gibt nun Informationen aus, wenn verbose auf positive Werte gesetzt ist. #27526 von Christian Lorentzen.
Fehlerbehebung linear_model.ElasticNet, linear_model.ElasticNetCV, linear_model.Lasso und linear_model.LassoCV akzeptieren nun explizit keine großen spärlichen Datenformate mehr. #27576 von Stefanie Senger.
Fehlerbehebung linear_model.RidgeCV und RidgeClassifierCV übergeben sample_weight korrekt an den zugrunde liegenden Scorer, wenn cv None ist. #27560 von Omar Salman.
Fehlerbehebung Das Attribut n_nonzero_coefs_ in linear_model.OrthogonalMatchingPursuit ist nun immer None, wenn tol gesetzt ist, da n_nonzero_coefs in diesem Fall ignoriert wird. #28557 von Lucy Liu.
API-Änderung linear_model.RidgeCV und linear_model.RidgeClassifierCV erlauben nun alpha=0, wenn cv != None ist, was konsistent mit linear_model.Ridge und linear_model.RidgeClassifier ist. #28425 von Lucy Liu.
API-Änderung Die Übergabe von average=0 zum Deaktivieren der Mittelwertbildung ist in linear_model.PassiveAggressiveClassifier, linear_model.PassiveAggressiveRegressor, linear_model.SGDClassifier, linear_model.SGDRegressor und linear_model.SGDOneClassSVM veraltet. Verwenden Sie stattdessen average=False. #28582 von Jérémie du Boisberranger.
API-Änderung Der Parameter multi_class wurde in linear_model.LogisticRegression und linear_model.LogisticRegressionCV als veraltet markiert. multi_class wird in Version 1.8 entfernt und intern für 3 oder mehr Klassen immer multinomial verwenden. Wenn Sie weiterhin das One-vs-Rest-Schema verwenden möchten, können Sie OneVsRestClassifier(LogisticRegression(..)) verwenden. #28703 von Christian Lorentzen.
API-Änderung Die Parameter store_cv_values und cv_values_ sind zugunsten von store_cv_results und cv_results_ in ~linear_model.RidgeCV und ~linear_model.RidgeClassifierCV veraltet. #28915 von Lucy Liu.

`sklearn.manifold`#

API-Änderung Verwirft n_iter zugunsten von max_iter in manifold.TSNE. n_iter wird in Version 1.7 entfernt. Dies macht manifold.TSNE konsistent mit dem Rest der Estimators. #28471 von Lucy Liu

`sklearn.metrics`#

Funktion metrics.pairwise_distances akzeptiert nun auch die Berechnung von paarweisen Abständen für nicht-numerische Arrays. Dies wird nur durch benutzerdefinierte Metriken unterstützt. #27456 von Venkatachalam N, Kshitij Mathur und Julian Libiseller-Egger.
Funktion sklearn.metrics.check_scoring gibt nun einen Multi-Metric-Scorer zurück, wenn scoring als dict, set, tuple oder list übergeben wird. #28360 von Thomas Fan.
Funktion metrics.d2_log_loss_score wurde hinzugefügt, die den D^2-Score für den Log-Loss berechnet. #28351 von Omar Salman.
Effizienz Verbessert die Effizienz der Funktionen brier_score_loss, calibration_curve, det_curve, precision_recall_curve, roc_curve, wenn das Argument pos_label angegeben ist. Verbessert auch die Effizienz der Methoden from_estimator und from_predictions in RocCurveDisplay, PrecisionRecallDisplay, DetCurveDisplay, CalibrationDisplay. #28051 von Pierre de Fréminville.
Fehlerbehebung metrics.classification_report zeigt nun nur die Genauigkeit und nicht die Mikro-Durchschnittsbildung an, wenn die Eingabe eine Teilmenge von Labels ist. #28399 von Vineet Joshi.
Fehlerbehebung Behebt OpenBLAS 0.3.26 Deadlock unter Windows bei der Berechnung paarweiser Distanzen. Dies betrifft wahrscheinlich nachbarschaftsbasierte Algorithmen. #28692 von Loïc Estève.
API-Änderung metrics.precision_recall_curve hat das Schlüsselwortargument probas_pred zugunsten von y_score als veraltet markiert. probas_pred wird in Version 1.7 entfernt. #28092 von Adam Li.
API-Änderung metrics.brier_score_loss hat das Schlüsselwortargument y_prob zugunsten von y_proba als veraltet markiert. y_prob wird in Version 1.7 entfernt. #28092 von Adam Li.
API-Änderung Bei Klassifikatoren und Klassifikationsmetriken sind als Bytes kodierte Labels veraltet und lösen in v1.7 einen Fehler aus. #18555 von Kaushik Amar Das.

`sklearn.mixture`#

Fehlerbehebung Das Attribut converged_ von mixture.GaussianMixture und mixture.BayesianGaussianMixture spiegelt nun den Konvergenzstatus des besten Fits wider, während es zuvor True war, wenn einer der Fits konvergierte. #26837 von Krsto Proroković.

`sklearn.model_selection`#

Hauptfunktion model_selection.TunedThresholdClassifierCV findet den Entscheidungsschwellenwert eines binären Klassifikators, der eine Klassifikationsmetrik mittels Kreuzvalidierung maximiert. model_selection.FixedThresholdClassifier ist eine Alternative, wenn ein fester Entscheidungsschwellenwert ohne Tuning-Schema verwendet werden soll. #26120 von Guillaume Lemaitre.
Verbesserung CV-Splitter, die den Gruppenparameter ignorieren, geben nun eine Warnung aus, wenn Gruppen in split übergeben werden. #28210 von Thomas Fan.
Verbesserung Die HTML-Diagramm-Repräsentation von GridSearchCV, RandomizedSearchCV, HalvingGridSearchCV und HalvingRandomSearchCV zeigen den besten Estimator an, wenn refit=True gesetzt ist. #28722 von Yao Xiao und Thomas Fan.
Fehlerbehebung das Attribut cv_results_ (von model_selection.GridSearchCV) gibt nun maskierte Arrays des entsprechenden NumPy-Datentyps zurück, anstatt immer den Datentyp object zu verwenden. #28352 von Marco Gorelli.
Fehlerbehebung model_selection.train_test_split funktioniert mit Array-API-Eingaben. Zuvor wurde die Indizierung nicht korrekt behandelt, was bei der Verwendung strenger Implementierungen der Array-API wie CuPY zu Ausnahmen führte. #28407 von Tim Head.

`sklearn.multioutput`#

Erweiterung Parameter chain_method zu multioutput.ClassifierChain hinzugefügt. #27700 von Lucy Liu.

`sklearn.neighbors`#

Korrektur Behebt neighbors.NeighborhoodComponentsAnalysis, sodass get_feature_names_out die korrekte Anzahl von Feature-Namen zurückgibt. #28306 von Brendan Lu.

`sklearn.pipeline`#

Funktion pipeline.FeatureUnion kann nun das Attribut verbose_feature_names_out verwenden. Wenn True, wird get_feature_names_out allen Feature-Namen den Namen des Transformers voranstellen, der dieses Feature generiert hat. Wenn False, wird get_feature_names_out keinen Feature-Namen voranstellen und einen Fehler ausgeben, wenn die Feature-Namen nicht eindeutig sind. #25991 von Jiawei Zhang.

`sklearn.preprocessing`#

Erweiterung preprocessing.QuantileTransformer und preprocessing.quantile_transform unterstützen nun die explizite Deaktivierung des Subsamplings. #27636 von Ralph Urlus.

`sklearn.tree`#

Erweiterung Das Plotten von Bäumen in Matplotlib über tree.plot_tree zeigt nun eine "True/False"-Beschriftung an, um die Richtung der Stichproben basierend auf der Aufteilungsbedingung anzuzeigen. #28552 von Adam Li.

`sklearn.utils`#

Korrektur _safe_indexing funktioniert nun korrekt für polars DataFrames, wenn axis=0 ist, und unterstützt das Indizieren von polars Series. #28521 von Yao Xiao.
API-Änderung utils.IS_PYPY ist veraltet und wird in Version 1.7 entfernt. #28768 von Jérémie du Boisberranger.
API-Änderung utils.tosequence ist veraltet und wird in Version 1.7 entfernt. #28763 von Jérémie du Boisberranger.
API-Änderung utils.parallel_backend und utils.register_parallel_backend sind veraltet und werden in Version 1.7 entfernt. Verwenden Sie stattdessen joblib.parallel_backend und joblib.register_parallel_backend. #28847 von Jérémie du Boisberranger.
API-Änderung Informative Warnmeldung in type_of_target ausgeben, wenn als Bytes repräsentiert. Für Klassifikatoren und Klassifizierungsmetriken ist die Kodierung von Labels als Bytes veraltet und wird in v1.7 einen Fehler auslösen. #18555 von Kaushik Amar Das.
API-Änderung utils.estimator_checks.check_estimator_sparse_data wurde in zwei Funktionen aufgeteilt: utils.estimator_checks.check_estimator_sparse_matrix und utils.estimator_checks.check_estimator_sparse_array. #27576 von Stefanie Senger.

Code- und Dokumentationsbeitragende

Vielen Dank an alle, die seit Version 1.4 zur Wartung und Verbesserung des Projekts beigetragen haben, darunter

101AlexMartin, Abdulaziz Aloqeely, Adam J. Stewart, Adam Li, Adarsh Wase, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Advik Sinha, Aisha, Akash Srivastava, Akihiro Kuno, Alan Guedes, Alberto Torres, Alexis IMBERT, alexqiao, Ana Paula Gomes, Anderson Nelson, Andrei Dzis, Arif Qodari, Arnaud Capitaine, Arturo Amor, Aswathavicky, Audrey Flanders, awwwyan, baggiponte, Bharat Raghunathan, bme-git, brdav, Brendan Lu, Brigitta Sipőcz, Bruno, Cailean Carter, Cemlyn, Christian Lorentzen, Christian Veenhuis, Cindy Liang, Claudio Salvatore Arcidiacono, Connor Boyle, Conrad Stevens, crispinlogan, David Matthew Cherney, Davide Chicco, davidleon123, dependabot[bot], DerWeh, dinga92, Dipan Banik, Drew Craeton, Duarte São José, DUONG, Eddie Bergman, Edoardo Abati, Egehan Gunduz, Emad Izadifar, EmilyXinyi, Erich Schubert, Evelyn, Filip Karlo Došilović, Franck Charras, Gael Varoquaux, Gönül Aycı, Guillaume Lemaitre, Gyeongjae Choi, Harmanan Kohli, Hong Xiang Yue, Ian Faust, Ilya Komarov, itsaphel, Ivan Wiryadi, Jack Bowyer, Javier Marin Tur, Jérémie du Boisberranger, Jérôme Dockès, Jiawei Zhang, João Morais, Joe Cainey, Joel Nothman, Johanna Bayer, John Cant, John Enblom, John Hopfensperger, jpcars, jpienaar-tuks, Julian Chan, Julian Libiseller-Egger, Julien Jerphanion, KanchiMoe, Kaushik Amar Das, keyber, Koustav Ghosh, kraktus, Krsto Proroković, Lars, ldwy4, LeoGrin, lihaitao, Linus Sommer, Loic Esteve, Lucy Liu, Lukas Geiger, m-maggi, manasimj, Manuel Labbé, Manuel Morales, Marco Edward Gorelli, Marco Wolsza, Maren Westermann, Marija Vlajic, Mark Elliot, Martin Helm, Mateusz Sokół, mathurinm, Mavs, Michael Dawson, Michael Higgins, Michael Mayer, miguelcsilva, Miki Watanabe, Mohammed Hamdy, myenugula, Nathan Goldbaum, Naziya Mahimkar, nbrown-ScottLogic, Neto, Nithish Bolleddula, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Patrick Wang, Pierre de Fréminville, Piotr, Priyank Shroff, Priyansh Gupta, Priyash Shah, Puneeth K, Rahil Parikh, raisadz, Raj Pulapakura, Ralf Gommers, Ralph Urlus, Randolf Scholz, renaissance0ne, Reshama Shaikh, Richard Barnes, Robert Pollak, Roberto Rosati, Rodrigo Romero, rwelsch427, Saad Mahmood, Salim Dohri, Sandip Dutta, SarahRemus, scikit-learn-bot, Shaharyar Choudhry, Shubham, sperret6, Stefanie Senger, Steffen Schneider, Suha Siddiqui, Thanh Lam DANG, thebabush, Thomas, Thomas J. Fan, Thomas Lazarus, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, VarunChaduvula, Vineet Joshi, virchan, Waël Boukhobza, Weyb, Will Dean, Xavier Beltran, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Ziad Amerr, Štěpán Sršeň

Version 1.5#

Version 1.5.2#

Änderungen, die viele Module betreffen#

Änderungsprotokoll#

Version 1.5.1#

Änderungen, die viele Module betreffen#

Änderungsprotokoll#

Version 1.5.0#

Sicherheit#

Geänderte Modelle#

Änderungen, die viele Module betreffen#

Unterstützung für Array API#

Unterstützung für die Erstellung mit Meson#

Metadaten-Routing#

Änderungsprotokoll#

Diese Seite