Version 1.5#
Für eine kurze Beschreibung der wichtigsten Neuerungen dieser Version verweisen wir auf die Release Highlights für scikit-learn 1.5.
Legende für Changelogs
Hauptmerkmal etwas Großes, das Sie vorher nicht tun konnten.
Merkmal etwas, das Sie vorher nicht tun konnten.
Effizienz Ein bestehendes Merkmal erfordert nun möglicherweise weniger Rechenleistung oder Speicher.
Verbesserung eine sonstige kleinere Verbesserung.
Korrektur Etwas, das zuvor nicht wie dokumentiert – oder nach vernünftigen Erwartungen – funktionierte, sollte nun funktionieren.
API-Änderung Sie müssen Ihren Code ändern, um in Zukunft die gleiche Wirkung zu erzielen; oder ein Merkmal wird in Zukunft entfernt.
Version 1.5.2#
September 2024
Änderungen, die viele Module betreffen#
Fix Behoben einer Performance-Regression in einigen Cython-Modulen in
sklearn._loss,sklearn.manifold,sklearn.metricsundsklearn.utils, die ohne OpenMP-Unterstützung kompiliert wurden. #29694 von Loïc Estèvce.
Änderungsprotokoll#
sklearn.calibration#
Fix Fehler auslösen, wenn
LeaveOneOutincvverwendet wird, was dem Verhalten vonKFold(n_splits=n_samples)entspricht. #29545 von Lucy Liu
sklearn.compose#
Fix Behoben, dass
compose.TransformedTargetRegressorkeineUserWarningmehr auslöst, wenn die Transformation aufpandasoderpolarsgesetzt ist, da dies kein Transformer ist. #29401 von Stefanie Senger.
sklearn.decomposition#
Fix Erhöhung des Schwellenwerts für Rangdefizite im Whitening-Schritt von
decomposition.FastICAmitwhiten_solver="eigh"zur Verbesserung der Plattformunabhängigkeit des Schätzers. #29612 von Olivier Grisel.
sklearn.metrics#
Fix Behebung einer Regression in
metrics.accuracy_scoreundmetrics.zero_one_loss, die zu einem Fehler bei der Array-API-Weiterleitung mit Multilabel-Eingaben führte. #29336 von Edoardo Abati.
sklearn.svm#
Fix Behebung einer Regression in
svm.SVCundsvm.SVR, so dass nunC=float("inf")akzeptiert wird. #29780 von Guillaume Lemaitre.
Version 1.5.1#
Juli 2024
Änderungen, die viele Module betreffen#
Fix Behebung einer Regression bei der Validierung der Eingabedaten aller Schätzer, bei der ein unerwarteter Fehler ausgelöst wurde, wenn ein DataFrame, der auf einem schreibgeschützten Puffer basiert, übergeben wurde. #29018 von Jérémie du Boisberranger.
Fix Behebung einer Regression, die in einigen Konfigurationen zu einem Deadlock beim Import führte. #29235 von Jérémie du Boisberranger.
Änderungsprotokoll#
sklearn.compose#
Efficiency Behebung einer Performance-Regression in
compose.ColumnTransformer, bei der die vollständigen Eingabedaten für jeden Transformer kopiert wurden, wennn_jobs > 1war. #29330 von Jérémie du Boisberranger.
sklearn.metrics#
Fix Behebung einer Regression in
metrics.r2_score. Die Übergabe von Torch CPU-Tensoren mit deaktivierter Array-API-Weiterleitung führte zu einer Meldung über Nicht-CPU-Geräte, anstatt diese Eingaben implizit als reguläre NumPy-Arrays zu konvertieren. #29119 von @Olivier Grisel.Fix Behebung einer Regression in
metrics.zero_one_loss, die zu einem Fehler bei der Array-API-Weiterleitung mit Multilabel-Eingaben führte. #29269 von Yaroslav Korobko.
sklearn.model_selection#
Fix Behebung einer Regression in
model_selection.GridSearchCVfür Parameter-Grids mit heterogenen Parameterwerten. #29078 von Loïc Estève.Fix Behebung einer Regression in
model_selection.GridSearchCVfür Parameter-Grids mit Schätzern als Parameterwerten. #29179 von Marco Gorelli.Fix Behebung einer Regression in
model_selection.GridSearchCVfür Parameter-Grids mit Arrays unterschiedlicher Größe als Parameterwerte. #29314 von Marco Gorelli.
sklearn.tree#
Fix Behebung eines Problems in
tree.export_graphvizundtree.plot_tree, die unter 32-Bit-Betriebssystemen potenziell zu Ausnahmen oder falschen Ergebnissen führen konnte. #29327 von Loïc Estève.
sklearn.utils#
API Change
utils.validation.check_arrayverfügt über einen neuen Parameterforce_writeable, um die Schreibbarkeit des Ausgabe-Arrays zu steuern. Wenn er aufTruegesetzt ist, ist garantiert, dass das Ausgabe-Array schreibbar ist, und es wird eine Kopie erstellt, wenn das Eingabe-Array schreibgeschützt ist. Wenn er aufFalsegesetzt ist, gibt es keine Garantie für die Schreibbarkeit des Ausgabe-Arrays. #29018 von Jérémie du Boisberranger.
Version 1.5.0#
Mai 2024
Sicherheit#
Fix
feature_extraction.text.CountVectorizerundfeature_extraction.text.TfidfVectorizerspeichern keine verworfenen Token mehr aus dem Trainingsdatensatz in ihrem Attributstop_words_. Dieses Attribut würde zu häufige (übermax_df) aber auch zu seltene Token (untermin_df) enthalten. Dies behebt ein potenzielles Sicherheitsproblem (Datenleck), wenn die verworfenen seltenen Token sensible Informationen aus dem Trainingsdatensatz enthalten, ohne dass der Modellentwickler dies weiß.Hinweis: Benutzer dieser Klassen werden ermutigt, ihre Pipelines entweder mit der neuen scikit-learn-Version neu zu trainieren oder das Attribut
stop_words_von zuvor trainierten Instanzen dieser Transformer manuell zu löschen. Dieses Attribut ist nur zur Inspektion des Modells gedacht und hat keinen Einfluss auf das Verhalten der Transformer. #28823 von Olivier Grisel.
Geänderte Modelle#
Efficiency Das Subsampling in
preprocessing.QuantileTransformerist nun effizienter für dichte Arrays, aber die angepassten Quantile und die Ergebnisse vontransformkönnen sich leicht von zuvor unterscheiden (wobei die gleichen statistischen Eigenschaften erhalten bleiben). #27344 von Xuefeng Xu.Enhancement
decomposition.PCA,decomposition.SparsePCAunddecomposition.TruncatedSVDsetzen nun das Vorzeichen des Attributscomponents_basierend auf den Komponentenwerten, anstatt die transformierten Daten als Referenz zu verwenden. Diese Änderung ist notwendig, um konsistente Vorzeichen der Komponenten über allePCA-Löser hinweg anbieten zu können, einschließlich der neuen Optionsvd_solver="covariance_eigh", die in dieser Version eingeführt wurde.
Änderungen, die viele Module betreffen#
Fix Auslösen von
ValueErrormit einer informativen Fehlermeldung bei Übergabe von 1D-Sparse-Arrays an Methoden, die 2D-Sparse-Eingaben erwarten. #28988 von Olivier Grisel.API Change Der Name des Eingabeparameters der Methode
inverse_transformvon Schätzern wurde aufXstandardisiert. Infolgedessen istXtveraltet und wird in Version 1.7 in den folgenden Schätzern entfernt:cluster.FeatureAgglomeration,decomposition.MiniBatchNMF,decomposition.NMF,model_selection.GridSearchCV,model_selection.RandomizedSearchCV,pipeline.Pipelineundpreprocessing.KBinsDiscretizer. #28756 von Will Dean.
Unterstützung für Array API#
Zusätzliche Schätzer und Funktionen wurden aktualisiert, um Unterstützung für alle Array API-konformen Eingaben zu bieten.
Weitere Details finden Sie in Array API-Unterstützung (experimentell).
Funktionen
sklearn.metrics.r2_scoreunterstützt nun Array-API-konforme Eingaben. #27904 von Eric Lindgren, Franck Charras, Olivier Grisel und Tim Head.
Klassen
linear_model.Ridgeunterstützt nun die Array-API für densvd-Löser. Weitere Details finden Sie unter Array API-Unterstützung (experimentell). #27800 von Franck Charras, Olivier Grisel und Tim Head.
Unterstützung für die Erstellung mit Meson#
Ab scikit-learn 1.5 ist Meson die primäre unterstützte Methode zur Erstellung von scikit-learn.
Sofern wir keinen größeren Blocker entdecken, wird die Setuptools-Unterstützung in scikit-learn 1.6 eingestellt. Die Releases 1.5.x unterstützen die Erstellung von scikit-learn mit Setuptools.
Die Meson-Unterstützung für die Erstellung von scikit-learn wurde in #28040 von Loïc Estève hinzugefügt.
Metadaten-Routing#
Die folgenden Modelle unterstützen nun das Metadaten-Routing in einer oder mehreren ihrer Methoden. Weitere Details finden Sie im Metadaten-Routing Benutzerhandbuch.
Feature
impute.IterativeImputerunterstützt nun Metadaten-Routing in seinerfit-Methode. #28187 von Stefanie Senger.Feature
ensemble.BaggingClassifierundensemble.BaggingRegressorunterstützen nun Metadaten-Routing. Die fit-Methoden akzeptieren nun**fit_params, die über ihrefit-Methoden an die zugrundeliegenden Schätzer weitergeleitet werden. #28432 von Adam Li und Benjamin Bossan.Feature
linear_model.RidgeCVundlinear_model.RidgeClassifierCVunterstützen nun Metadaten-Routing in ihrerfit-Methode und leiten Metadaten an das zugrundeliegendemodel_selection.GridSearchCV-Objekt oder den zugrundeliegenden Scorer weiter. #27560 von Omar Salman.Feature
GraphicalLassoCVunterstützt nun Metadaten-Routing in seinerfit-Methode und leitet Metadaten an den CV-Splitter weiter. #27566 von Omar Salman.Feature
linear_model.RANSACRegressorunterstützt nun Metadaten-Routing in seinen Methodenfit,scoreundpredictund leitet Metadaten an diefit,scoreundpredict-Methoden seines zugrundeliegenden Schätzers weiter. #28261 von Stefanie Senger.Feature
ensemble.VotingClassifierundensemble.VotingRegressorunterstützen nun Metadaten-Routing und leiten**fit_paramsüber ihrefit-Methoden an die zugrundeliegenden Schätzer weiter. #27584 von Stefanie Senger.Feature
pipeline.FeatureUnionunterstützt nun Metadaten-Routing in seinen Methodenfitundfit_transformund leitet Metadaten an diefitundfit_transform-Methoden der zugrundeliegenden Transformer weiter. #28205 von Stefanie Senger.Fix Behebung eines Problems bei der Auflösung von Standard-Routing-Anfragen, die über Klassenattribute gesetzt wurden. #28435 von Adrin Jalali.
Fix Behebung eines Problems, wenn
set_{method}_request-Methoden als ungebundene Methoden verwendet werden, was passieren kann, wenn man versucht, sie zu dekorieren. #28651 von Adrin Jalali.Fix Verhinderung einer
RecursionError, wenn Schätzer mit dem Standard-scoring-Parameter (None) Metadaten weiterleiten. #28712 von Stefanie Senger.
Änderungsprotokoll#
sklearn.calibration#
Fix Behebung einer Regression in
calibration.CalibratedClassifierCV, bei der fälschlicherweise ein Fehler mit String-Zielen ausgelöst wurde. #28843 von Jérémie du Boisberranger.
sklearn.cluster#
Fix Die Klasse
cluster.MeanShiftkonvergiert nun ordnungsgemäß für konstante Daten. #28951 von Akihiro Kuno.Fix Kopie der vorab berechneten Sparse-Matrix innerhalb der
fit-Methode vonOPTICSerstellt, um eine In-place-Modifikation der Sparse-Matrix zu vermeiden. #28491 von Thanh Lam Dang.Fix
cluster.HDBSCANunterstützt nun alle Metriken, die vonsklearn.metrics.pairwise_distancesunterstützt werden, wennalgorithm="brute"oder"auto"gesetzt ist. #28664 von Manideep Yenugula.
sklearn.compose#
Feature Ein angepasster
compose.ColumnTransformerimplementiert nun__getitem__, das die angepassten Transformer nach Namen zurückgibt. #27990 von Thomas Fan.Enhancement
compose.TransformedTargetRegressorlöst nun infiteinen Fehler aus, wenn nurinverse_funcbereitgestellt wird, ohne dassfunc(die standardmäßig die Identität wäre) explizit mit angegeben wurde. #28483 von Stefanie Senger.Enhancement
compose.ColumnTransformerkann nun die "remainder"-Spalten im angepassten Attributtransformers_als Spaltennamen oder boolesche Masken statt als Spaltenindizes ausgeben. #27657 von Jérôme Dockes.Fix Behebung eines Fehlers in
compose.ColumnTransformermitn_jobs > 1, bei dem die dazwischen liegenden ausgewählten Spalten als schreibgeschützte Arrays an die Transformer übergeben wurden. #28822 von Jérémie du Boisberranger.
sklearn.cross_decomposition#
Fix Das angepasste Attribut
coef_voncross_decomposition.PLSRegressionberücksichtigt nun sowohl die Skalierung vonXals auch vonY, wennscale=Trueist. Hinweis: Die vorherigen vorhergesagten Werte waren von diesem Fehler nicht betroffen. #28612 von Guillaume Lemaitre.API-Änderung Verwirft
Yzugunsten vonyin den Methodenfit,transformundinverse_transformvon:cross_decomposition.PLSRegression,cross_decomposition.PLSCanonicalundcross_decomposition.CCA, sowie den Methodenfitundtransformvon:cross_decomposition.PLSSVD.Ywird in Version 1.7 entfernt. #28604 von David Leon.
sklearn.datasets#
Verbesserung Fügt optionale Argumente
n_retriesunddelayzu den Funktionendatasets.fetch_20newsgroups,datasets.fetch_20newsgroups_vectorized,datasets.fetch_california_housing,datasets.fetch_covtype,datasets.fetch_kddcup99,datasets.fetch_lfw_pairs,datasets.fetch_lfw_people,datasets.fetch_olivetti_faces,datasets.fetch_rcv1unddatasets.fetch_species_distributionshinzu. Standardmäßig versuchen die Funktionen bei Netzwerkfehlern bis zu 3 Mal. #28160 von Zhehao Liu und Filip Karlo Došilović.
sklearn.decomposition#
Effizienz
decomposition.PCAmitsvd_solver="full"weist jetzt ein zusammenhängendescomponents_Attribut zu anstelle eines nicht zusammenhängenden Slices der singulären Vektoren. Wennn_components << n_features, kann dies etwas Speicher sparen und, was noch wichtiger ist, nachfolgende Aufrufe dertransformMethode durch Nutzung der Cache-Lokalität von BLAS GEMM auf zusammenhängenden Arrays um mehr als eine Größenordnung beschleunigen. #27491 von Olivier Grisel.Verbesserung
PCAwählt nun automatisch den ARPACK-Solver für spärliche Eingaben, wennsvd_solver="auto"gesetzt ist, anstatt einen Fehler auszulösen. #28498 von Thanh Lam Dang.Verbesserung
decomposition.PCAunterstützt nun eine neue Solver-Option namenssvd_solver="covariance_eigh", die eine um eine Größenordnung schnellere Ausführung und einen reduzierten Speicherverbrauch für Datensätze mit einer großen Anzahl von Datenpunkten und einer kleinen Anzahl von Merkmalen (z. B.n_samples >> 1000 > n_features) bietet. Die Optionsvd_solver="auto"wurde aktualisiert, um den neuen Solver für solche Datensätze automatisch zu verwenden. Dieser Solver akzeptiert auch spärliche Eingabedaten. #27491 von Olivier Grisel.Fehlerbehebung
decomposition.PCAfit mitsvd_solver="arpack",whiten=Trueund einem Wert fürn_components, der größer ist als der Rang der Trainingsmenge, gibt beim Transformieren von Hold-out-Daten keine unendlichen Werte mehr zurück. #27491 von Olivier Grisel.
sklearn.dummy#
Verbesserung
dummy.DummyClassifierunddummy.DummyRegressorhaben nachfitnun die Attributen_features_in_undfeature_names_in_. #27937 von Marco vd Boom.
sklearn.ensemble#
Effizienz Verbessert die Laufzeit von
predictvonensemble.HistGradientBoostingClassifierdurch Vermeidung vonpredict_probaAufrufen. #27844 von Christian Lorentzen.Effizienz
ensemble.HistGradientBoostingClassifierundensemble.HistGradientBoostingRegressorsind nun ein winziges bisschen schneller, indem die Daten vorsortiert werden, bevor die Schwellenwerte für das Binning gefunden werden. #28102 von Christian Lorentzen.Fehlerbehebung Behebt einen Fehler in
ensemble.HistGradientBoostingClassifierundensemble.HistGradientBoostingRegressor, wennmonotonic_cstfür nicht-kategoriale Merkmale angegeben wird. #28925 von Xiao Yuan.
sklearn.feature_extraction#
Effizienz
feature_extraction.text.TfidfTransformerist nun schneller und speichereffizienter, indem ein NumPy-Vektor anstelle einer spärlichen Matrix zur Speicherung der inversen Dokumenthäufigkeit verwendet wird. #18843 von Paolo Montesel.Verbesserung
feature_extraction.text.TfidfTransformererhält nun den Datentyp der Eingabematrix, wenn diesernp.float64odernp.float32ist. #28136 von Guillaume Lemaitre.
sklearn.feature_selection#
Verbesserung
feature_selection.mutual_info_regressionundfeature_selection.mutual_info_classifunterstützen nun den Parametern_jobs. #28085 von Neto Menoci und Florin Andrei.Verbesserung Das Attribut
cv_results_vonfeature_selection.RFECVhat einen neuen Schlüssel,n_features, der ein Array mit der Anzahl der in jedem Schritt ausgewählten Merkmale enthält. #28670 von Miguel Silva.
sklearn.impute#
Verbesserung
impute.SimpleImputerunterstützt nun benutzerdefinierte Strategien, indem eine Funktion anstelle eines Strategienamens übergeben wird. #28053 von Mark Elliot.
sklearn.inspection#
Fehlerbehebung
inspection.DecisionBoundaryDisplay.from_estimatorgibt keine Warnungen mehr über fehlende Merkmalsnamen aus, wenn einpolars.DataFrameübergeben wird. #28718 von Patrick Wang.
sklearn.linear_model#
Verbesserung Der Solver
"newton-cg"inlinear_model.LogisticRegressionundlinear_model.LogisticRegressionCVgibt nun Informationen aus, wennverboseauf positive Werte gesetzt ist. #27526 von Christian Lorentzen.Fehlerbehebung
linear_model.ElasticNet,linear_model.ElasticNetCV,linear_model.Lassoundlinear_model.LassoCVakzeptieren nun explizit keine großen spärlichen Datenformate mehr. #27576 von Stefanie Senger.Fehlerbehebung
linear_model.RidgeCVundRidgeClassifierCVübergebensample_weightkorrekt an den zugrunde liegenden Scorer, wenncvNone ist. #27560 von Omar Salman.Fehlerbehebung Das Attribut
n_nonzero_coefs_inlinear_model.OrthogonalMatchingPursuitist nun immerNone, wenntolgesetzt ist, dan_nonzero_coefsin diesem Fall ignoriert wird. #28557 von Lucy Liu.API-Änderung
linear_model.RidgeCVundlinear_model.RidgeClassifierCVerlauben nunalpha=0, wenncv != Noneist, was konsistent mitlinear_model.Ridgeundlinear_model.RidgeClassifierist. #28425 von Lucy Liu.API-Änderung Die Übergabe von
average=0zum Deaktivieren der Mittelwertbildung ist inlinear_model.PassiveAggressiveClassifier,linear_model.PassiveAggressiveRegressor,linear_model.SGDClassifier,linear_model.SGDRegressorundlinear_model.SGDOneClassSVMveraltet. Verwenden Sie stattdessenaverage=False. #28582 von Jérémie du Boisberranger.API-Änderung Der Parameter
multi_classwurde inlinear_model.LogisticRegressionundlinear_model.LogisticRegressionCVals veraltet markiert.multi_classwird in Version 1.8 entfernt und intern für 3 oder mehr Klassen immer multinomial verwenden. Wenn Sie weiterhin das One-vs-Rest-Schema verwenden möchten, können SieOneVsRestClassifier(LogisticRegression(..))verwenden. #28703 von Christian Lorentzen.API-Änderung Die Parameter
store_cv_valuesundcv_values_sind zugunsten vonstore_cv_resultsundcv_results_in~linear_model.RidgeCVund~linear_model.RidgeClassifierCVveraltet. #28915 von Lucy Liu.
sklearn.manifold#
API-Änderung Verwirft
n_iterzugunsten vonmax_iterinmanifold.TSNE.n_iterwird in Version 1.7 entfernt. Dies machtmanifold.TSNEkonsistent mit dem Rest der Estimators. #28471 von Lucy Liu
sklearn.metrics#
Funktion
metrics.pairwise_distancesakzeptiert nun auch die Berechnung von paarweisen Abständen für nicht-numerische Arrays. Dies wird nur durch benutzerdefinierte Metriken unterstützt. #27456 von Venkatachalam N, Kshitij Mathur und Julian Libiseller-Egger.Funktion
sklearn.metrics.check_scoringgibt nun einen Multi-Metric-Scorer zurück, wennscoringalsdict,set,tupleoderlistübergeben wird. #28360 von Thomas Fan.Funktion
metrics.d2_log_loss_scorewurde hinzugefügt, die den D^2-Score für den Log-Loss berechnet. #28351 von Omar Salman.Effizienz Verbessert die Effizienz der Funktionen
brier_score_loss,calibration_curve,det_curve,precision_recall_curve,roc_curve, wenn das Argumentpos_labelangegeben ist. Verbessert auch die Effizienz der Methodenfrom_estimatorundfrom_predictionsinRocCurveDisplay,PrecisionRecallDisplay,DetCurveDisplay,CalibrationDisplay. #28051 von Pierre de Fréminville.Fehlerbehebung
metrics.classification_reportzeigt nun nur die Genauigkeit und nicht die Mikro-Durchschnittsbildung an, wenn die Eingabe eine Teilmenge von Labels ist. #28399 von Vineet Joshi.Fehlerbehebung Behebt OpenBLAS 0.3.26 Deadlock unter Windows bei der Berechnung paarweiser Distanzen. Dies betrifft wahrscheinlich nachbarschaftsbasierte Algorithmen. #28692 von Loïc Estève.
API-Änderung
metrics.precision_recall_curvehat das Schlüsselwortargumentprobas_predzugunsten vony_scoreals veraltet markiert.probas_predwird in Version 1.7 entfernt. #28092 von Adam Li.API-Änderung
metrics.brier_score_losshat das Schlüsselwortargumenty_probzugunsten vony_probaals veraltet markiert.y_probwird in Version 1.7 entfernt. #28092 von Adam Li.API-Änderung Bei Klassifikatoren und Klassifikationsmetriken sind als Bytes kodierte Labels veraltet und lösen in v1.7 einen Fehler aus. #18555 von Kaushik Amar Das.
sklearn.mixture#
Fehlerbehebung Das Attribut
converged_vonmixture.GaussianMixtureundmixture.BayesianGaussianMixturespiegelt nun den Konvergenzstatus des besten Fits wider, während es zuvorTruewar, wenn einer der Fits konvergierte. #26837 von Krsto Proroković.
sklearn.model_selection#
Hauptfunktion
model_selection.TunedThresholdClassifierCVfindet den Entscheidungsschwellenwert eines binären Klassifikators, der eine Klassifikationsmetrik mittels Kreuzvalidierung maximiert.model_selection.FixedThresholdClassifierist eine Alternative, wenn ein fester Entscheidungsschwellenwert ohne Tuning-Schema verwendet werden soll. #26120 von Guillaume Lemaitre.Verbesserung CV-Splitter, die den Gruppenparameter ignorieren, geben nun eine Warnung aus, wenn Gruppen in split übergeben werden. #28210 von Thomas Fan.
Verbesserung Die HTML-Diagramm-Repräsentation von
GridSearchCV,RandomizedSearchCV,HalvingGridSearchCVundHalvingRandomSearchCVzeigen den besten Estimator an, wennrefit=Truegesetzt ist. #28722 von Yao Xiao und Thomas Fan.Fehlerbehebung das Attribut
cv_results_(vonmodel_selection.GridSearchCV) gibt nun maskierte Arrays des entsprechenden NumPy-Datentyps zurück, anstatt immer den Datentypobjectzu verwenden. #28352 von Marco Gorelli.Fehlerbehebung
model_selection.train_test_splitfunktioniert mit Array-API-Eingaben. Zuvor wurde die Indizierung nicht korrekt behandelt, was bei der Verwendung strenger Implementierungen der Array-API wie CuPY zu Ausnahmen führte. #28407 von Tim Head.
sklearn.multioutput#
Erweiterung Parameter
chain_methodzumultioutput.ClassifierChainhinzugefügt. #27700 von Lucy Liu.
sklearn.neighbors#
Korrektur Behebt
neighbors.NeighborhoodComponentsAnalysis, sodassget_feature_names_outdie korrekte Anzahl von Feature-Namen zurückgibt. #28306 von Brendan Lu.
sklearn.pipeline#
Funktion
pipeline.FeatureUnionkann nun das Attributverbose_feature_names_outverwenden. WennTrue, wirdget_feature_names_outallen Feature-Namen den Namen des Transformers voranstellen, der dieses Feature generiert hat. WennFalse, wirdget_feature_names_outkeinen Feature-Namen voranstellen und einen Fehler ausgeben, wenn die Feature-Namen nicht eindeutig sind. #25991 von Jiawei Zhang.
sklearn.preprocessing#
Erweiterung
preprocessing.QuantileTransformerundpreprocessing.quantile_transformunterstützen nun die explizite Deaktivierung des Subsamplings. #27636 von Ralph Urlus.
sklearn.tree#
Erweiterung Das Plotten von Bäumen in Matplotlib über
tree.plot_treezeigt nun eine "True/False"-Beschriftung an, um die Richtung der Stichproben basierend auf der Aufteilungsbedingung anzuzeigen. #28552 von Adam Li.
sklearn.utils#
Korrektur
_safe_indexingfunktioniert nun korrekt für polars DataFrames, wennaxis=0ist, und unterstützt das Indizieren von polars Series. #28521 von Yao Xiao.API-Änderung
utils.IS_PYPYist veraltet und wird in Version 1.7 entfernt. #28768 von Jérémie du Boisberranger.API-Änderung
utils.tosequenceist veraltet und wird in Version 1.7 entfernt. #28763 von Jérémie du Boisberranger.API-Änderung
utils.parallel_backendundutils.register_parallel_backendsind veraltet und werden in Version 1.7 entfernt. Verwenden Sie stattdessenjoblib.parallel_backendundjoblib.register_parallel_backend. #28847 von Jérémie du Boisberranger.API-Änderung Informative Warnmeldung in
type_of_targetausgeben, wenn als Bytes repräsentiert. Für Klassifikatoren und Klassifizierungsmetriken ist die Kodierung von Labels als Bytes veraltet und wird in v1.7 einen Fehler auslösen. #18555 von Kaushik Amar Das.API-Änderung
utils.estimator_checks.check_estimator_sparse_datawurde in zwei Funktionen aufgeteilt:utils.estimator_checks.check_estimator_sparse_matrixundutils.estimator_checks.check_estimator_sparse_array. #27576 von Stefanie Senger.
Code- und Dokumentationsbeitragende
Vielen Dank an alle, die seit Version 1.4 zur Wartung und Verbesserung des Projekts beigetragen haben, darunter
101AlexMartin, Abdulaziz Aloqeely, Adam J. Stewart, Adam Li, Adarsh Wase, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Advik Sinha, Aisha, Akash Srivastava, Akihiro Kuno, Alan Guedes, Alberto Torres, Alexis IMBERT, alexqiao, Ana Paula Gomes, Anderson Nelson, Andrei Dzis, Arif Qodari, Arnaud Capitaine, Arturo Amor, Aswathavicky, Audrey Flanders, awwwyan, baggiponte, Bharat Raghunathan, bme-git, brdav, Brendan Lu, Brigitta Sipőcz, Bruno, Cailean Carter, Cemlyn, Christian Lorentzen, Christian Veenhuis, Cindy Liang, Claudio Salvatore Arcidiacono, Connor Boyle, Conrad Stevens, crispinlogan, David Matthew Cherney, Davide Chicco, davidleon123, dependabot[bot], DerWeh, dinga92, Dipan Banik, Drew Craeton, Duarte São José, DUONG, Eddie Bergman, Edoardo Abati, Egehan Gunduz, Emad Izadifar, EmilyXinyi, Erich Schubert, Evelyn, Filip Karlo Došilović, Franck Charras, Gael Varoquaux, Gönül Aycı, Guillaume Lemaitre, Gyeongjae Choi, Harmanan Kohli, Hong Xiang Yue, Ian Faust, Ilya Komarov, itsaphel, Ivan Wiryadi, Jack Bowyer, Javier Marin Tur, Jérémie du Boisberranger, Jérôme Dockès, Jiawei Zhang, João Morais, Joe Cainey, Joel Nothman, Johanna Bayer, John Cant, John Enblom, John Hopfensperger, jpcars, jpienaar-tuks, Julian Chan, Julian Libiseller-Egger, Julien Jerphanion, KanchiMoe, Kaushik Amar Das, keyber, Koustav Ghosh, kraktus, Krsto Proroković, Lars, ldwy4, LeoGrin, lihaitao, Linus Sommer, Loic Esteve, Lucy Liu, Lukas Geiger, m-maggi, manasimj, Manuel Labbé, Manuel Morales, Marco Edward Gorelli, Marco Wolsza, Maren Westermann, Marija Vlajic, Mark Elliot, Martin Helm, Mateusz Sokół, mathurinm, Mavs, Michael Dawson, Michael Higgins, Michael Mayer, miguelcsilva, Miki Watanabe, Mohammed Hamdy, myenugula, Nathan Goldbaum, Naziya Mahimkar, nbrown-ScottLogic, Neto, Nithish Bolleddula, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Patrick Wang, Pierre de Fréminville, Piotr, Priyank Shroff, Priyansh Gupta, Priyash Shah, Puneeth K, Rahil Parikh, raisadz, Raj Pulapakura, Ralf Gommers, Ralph Urlus, Randolf Scholz, renaissance0ne, Reshama Shaikh, Richard Barnes, Robert Pollak, Roberto Rosati, Rodrigo Romero, rwelsch427, Saad Mahmood, Salim Dohri, Sandip Dutta, SarahRemus, scikit-learn-bot, Shaharyar Choudhry, Shubham, sperret6, Stefanie Senger, Steffen Schneider, Suha Siddiqui, Thanh Lam DANG, thebabush, Thomas, Thomas J. Fan, Thomas Lazarus, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, VarunChaduvula, Vineet Joshi, virchan, Waël Boukhobza, Weyb, Will Dean, Xavier Beltran, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Ziad Amerr, Štěpán Sršeň