Version 0.21#

Legende für Changelogs

Hauptmerkmal etwas Großes, das Sie vorher nicht tun konnten.
Merkmal etwas, das Sie vorher nicht tun konnten.
Effizienz Ein bestehendes Merkmal erfordert nun möglicherweise weniger Rechenleistung oder Speicher.
Verbesserung eine sonstige kleinere Verbesserung.
Korrektur Etwas, das zuvor nicht wie dokumentiert – oder nach vernünftigen Erwartungen – funktionierte, sollte nun funktionieren.
API-Änderung Sie müssen Ihren Code ändern, um in Zukunft die gleiche Wirkung zu erzielen; oder ein Merkmal wird in Zukunft entfernt.

Version 0.21.3#

30. Juli 2019

Geänderte Modelle#

Die folgenden Schätzer und Funktionen können, wenn sie mit denselben Daten und Parametern angepasst werden, andere Modelle als in der vorherigen Version ergeben. Dies geschieht häufig aufgrund von Änderungen in der Modellierungslogik (Fehlerbehebungen oder Verbesserungen) oder in zufälligen Stichprobenverfahren.

Die Release Notes von v0.20.0 haben versäumt, eine Abwärtsinkompatibilität in metrics.make_scorer zu erwähnen, wenn needs_proba=True und y_true binär ist. Nun soll die Scorer-Funktion ein 1D- y_pred (d. h. Wahrscheinlichkeit der positiven Klasse, Form (n_samples,)) anstelle eines 2D- y_pred (d. h. Form (n_samples, 2)) akzeptieren.

Änderungsprotokoll#

`sklearn.cluster`#

Fix Fehler in cluster.KMeans behoben, bei dem die Berechnung mit init='random' bei n_jobs > 1 oder n_jobs = -1 Single-Threaded war. #12955 von Prabakaran Kumaresshan.
Fix Fehler in cluster.OPTICS behoben, bei dem Benutzer keine Float-Werte für min_samples und min_cluster_size übergeben konnten. #14496 von Fabian Klopfer und Hanmin Qin.
Fix Fehler in cluster.KMeans behoben, bei dem die KMeans++-Initialisierung selten einen IndexError verursachen konnte. #11756 von Joel Nothman.

`sklearn.compose`#

Fix Problem in compose.ColumnTransformer behoben, bei dem die Verwendung von DataFrames mit unterschiedlicher Spaltenreihenfolge zwischen fit und transform dazu führen konnte, dass falsche Spalten stillschweigend an den remainder Transformer übergeben wurden. #14237 von Andreas Schuderer <schuderer>.

`sklearn.datasets`#

Fix datasets.fetch_california_housing, datasets.fetch_covtype, datasets.fetch_kddcup99, datasets.fetch_olivetti_faces, datasets.fetch_rcv1 und datasets.fetch_species_distributions versuchen, den zuvor zwischengespeicherten Zustand mit dem neuen joblib zu persistieren, wenn die zwischengespeicherten Daten mit dem veralteten sklearn.externals.joblib persistiert wurden. Dieses Verhalten wird in v0.23 als veraltet markiert und entfernt. #14197 von Adrin Jalali.

`sklearn.ensemble`#

Fix Fehler bei der Division durch Null in ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor behoben. #14024 von Nicolas Hug <NicolasHug>.

`sklearn.impute`#

Fix Fehler in impute.SimpleImputer und impute.IterativeImputer behoben, sodass keine Fehler mehr ausgelöst werden, wenn fehlende Werte in den Trainingsdaten vorhanden sind. #13974 von Frank Hoang <fhoang7>.

`sklearn.inspection`#

Fix Fehler in inspection.plot_partial_dependence behoben, bei dem der Parameter target bei Multiklassenproblemen nicht berücksichtigt wurde. #14393 von Guillem G. Subies.

`sklearn.linear_model`#

Fix Fehler in linear_model.LogisticRegressionCV behoben, bei dem refit=False je nach Parametern 'multiclass' und 'penalty' fehlschlagen konnte (Regression eingeführt in 0.21). #14087 von Nicolas Hug.
Fix Kompatibilitätsfix für linear_model.ARDRegression und Scipy>=1.3.0. Passt sich an Upstream-Änderungen des Standard-Cutoff-Schwellenwerts für pinvh an, die andernfalls in einigen Fällen zu schlechter Genauigkeit führen. #14067 von Tim Staley.

`sklearn.neighbors`#

Fix Fehler in neighbors.NeighborhoodComponentsAnalysis behoben, bei dem die Validierung der Initialparameter n_components, max_iter und tol zu strenge Datentypen erforderte. #14092 von Jérémie du Boisberranger.

`sklearn.tree`#

Fix Fehler in tree.export_text behoben, wenn der Baum nur ein Merkmal hat und ein einzelner Merkmalsname übergeben wird. #14053 von Thomas Fan.
Fix Problem in tree.plot_tree behoben, bei dem Entropieberechnungen auch für das gini-Kriterium in DecisionTreeClassifiers angezeigt wurden. #13947 von Frank Hoang.

Version 0.21.2#

24. Mai 2019

Änderungsprotokoll#

`sklearn.decomposition`#

Fix Fehler in cross_decomposition.CCA behoben, wodurch die numerische Stabilität verbessert wird, wenn Y nahe Null ist. #13903 von Thomas Fan.

`sklearn.metrics`#

Fix Fehler in metrics.pairwise.euclidean_distances behoben, bei der ein Teil der Distanzmatrix für ausreichend große float32- Datensätze nicht initialisiert wurde (Regression eingeführt in 0.21). #13910 von Jérémie du Boisberranger.

`sklearn.preprocessing`#

Fix Fehler in preprocessing.OneHotEncoder behoben, bei dem der neue Parameter drop nicht in get_feature_names reflektiert wurde. #13894 von James Myatt.

`sklearn.utils.sparsefuncs`#

Fix Fehler behoben, bei dem min_max_axis auf 32-Bit-Systemen für bestimmte große Eingaben fehlschlagen würde. Dies betrifft preprocessing.MaxAbsScaler, preprocessing.normalize und preprocessing.LabelBinarizer. #13741 von Roddy MacSween.

Version 0.21.1#

17. Mai 2019

Dies ist ein Bugfix-Release, um hauptsächlich einige Paketprobleme in Version 0.21.0 zu beheben. Es enthält auch kleinere Dokumentationsverbesserungen und einige Bugfixes.

Änderungsprotokoll#

`sklearn.inspection`#

Fix Fehler in inspection.partial_dependence behoben, um nur den Klassifikator und nicht den Regressor für den Multiklassen-Multi-Output-Fall zu prüfen. #14309 von Guillaume Lemaitre.

`sklearn.metrics`#

Fix Fehler in metrics.pairwise_distances behoben, bei der AttributeError für boolesche Metriken ausgelöst wurde, wenn X einen booleschen Datentyp hatte und Y == None war. #13864 von Paresh Mathur.
Fix Zwei Fehler in metrics.pairwise_distances behoben, wenn n_jobs > 1 war. Erstens gab es eine Distanzmatrix mit demselben Datentyp wie die Eingabe zurück, auch für Ganzzahltypen. Dann war die Diagonale für die Euklidische Metrik nicht Null, wenn Y X war. #13877 von Jérémie du Boisberranger.

`sklearn.neighbors`#

Fix Fehler in neighbors.KernelDensity behoben, der nicht aus einem Pickle wiederhergestellt werden konnte, wenn sample_weight verwendet wurde. #13772 von Aditya Vyas.

Version 0.21.0#

Mai 2019

Geänderte Modelle#

Die folgenden Schätzer und Funktionen können, wenn sie mit denselben Daten und Parametern angepasst werden, andere Modelle als in der vorherigen Version ergeben. Dies geschieht häufig aufgrund von Änderungen in der Modellierungslogik (Fehlerbehebungen oder Verbesserungen) oder in zufälligen Stichprobenverfahren.

discriminant_analysis.LinearDiscriminantAnalysis für Multiklassenklassifizierung. Fix
discriminant_analysis.LinearDiscriminantAnalysis mit 'eigen'-Solver. Fix
linear_model.BayesianRidge Fix
Entscheidungsbäume und abgeleitete Ensembles, wenn sowohl max_depth als auch max_leaf_nodes gesetzt sind. Fix
linear_model.LogisticRegression und linear_model.LogisticRegressionCV mit 'saga'-Solver. Fix
ensemble.GradientBoostingClassifier Fix
sklearn.feature_extraction.text.HashingVectorizer, sklearn.feature_extraction.text.TfidfVectorizer und sklearn.feature_extraction.text.CountVectorizer Fix
neural_network.MLPClassifier Fix
svm.SVC.decision_function und multiclass.OneVsOneClassifier.decision_function. Fix
linear_model.SGDClassifier und alle abgeleiteten Klassifikatoren. Fix
Jedes Modell, das die Funktion linear_model._sag.sag_solver mit dem Seed 0 verwendet, einschließlich linear_model.LogisticRegression, linear_model.LogisticRegressionCV, linear_model.Ridge und linear_model.RidgeCV mit 'sag'-Solver. Fix
linear_model.RidgeCV bei Verwendung von Leave-One-Out-Kreuzvalidierung mit sparsen Eingaben. Fix

Details sind in der folgenden Changelog aufgeführt.

(Obwohl wir uns bemühen, Benutzer durch die Bereitstellung dieser Informationen besser zu informieren, können wir keine Vollständigkeit dieser Liste garantieren.)

Bekannte Hauptfehler#

Der Standardwert von max_iter für linear_model.LogisticRegression ist für viele Solver bei dem Standardwert von tol zu gering. Insbesondere haben wir versehentlich den Standardwert max_iter für den liblinear-Solver von 1000 auf 100 Iterationen in #3591 (in Version 0.16 veröffentlicht) geändert. In einer zukünftigen Version hoffen wir, bessere Standardwerte für max_iter und tol heuristisch in Abhängigkeit vom Solver zu wählen (siehe #13317).

Änderungsprotokoll#

Die Unterstützung für Python 3.4 und darunter wurde offiziell eingestellt.

`sklearn.base`#

API-Änderung Der R2-Score, der beim Aufruf von score auf einem Regressor verwendet wird, verwendet ab Version 0.23 multioutput='uniform_average', um konsistent mit metrics.r2_score zu sein. Dies wird sich auf die score-Methode aller Multi-Output-Regressor auswirken (mit Ausnahme von multioutput.MultiOutputRegressor). #13157 von Hanmin Qin.

`sklearn.calibration`#

Verbesserung Unterstützung hinzugefügt, um die an calibration.calibration_curve übergebenen Daten nach Quantilen anstelle von gleichmäßig zwischen 0 und 1 zu binen. #13086 von Scott Cole.
Verbesserung N-dimensionale Arrays als Eingabe für calibration.CalibratedClassifierCV zulassen. #13485 von William de Vazelhes.

`sklearn.cluster`#

Hauptfunktion Ein neuer Clustering-Algorithmus: cluster.OPTICS: ein Algorithmus, der mit cluster.DBSCAN verwandt ist, einfachere Hyperparameter-Einstellungen hat und besser skaliert, von Shane, Adrin Jalali, Erich Schubert, Hanmin Qin und Assia Benbihi.
Fix Fehler behoben, bei dem cluster.Birch gelegentlich einen AttributeError auslösen konnte. #13651 von Joel Nothman.
Fix Fehler in cluster.KMeans behoben, bei dem leere Cluster bei Verwendung von Stichprobengewichten nicht korrekt verschoben wurden. #13486 von Jérémie du Boisberranger.
API-Änderung Das Attribut n_components_ in cluster.AgglomerativeClustering und cluster.FeatureAgglomeration wurde in n_connected_components_ umbenannt. #13427 von Stephane Couvreur.
Verbesserung cluster.AgglomerativeClustering und cluster.FeatureAgglomeration akzeptieren jetzt einen Parameter distance_threshold, der verwendet werden kann, um die Cluster anstelle von n_clusters zu finden. #9069 von Vathsala Achar und Adrin Jalali.

`sklearn.compose`#

API-Änderung compose.ColumnTransformer ist keine experimentelle Funktion mehr. #13835 von Hanmin Qin.

`sklearn.datasets`#

Korrektur Unterstützung für 64-Bit-Gruppen-IDs und Zeiger in SVMLight-Dateien hinzugefügt. #10727 von Bryan K Woods.
Korrektur datasets.load_sample_images gibt Bilder in deterministischer Reihenfolge zurück. #13250 von Thomas Fan.

`sklearn.decomposition`#

Verbesserung decomposition.KernelPCA hat nun deterministische Ausgaben (Lösung der Vorzeichenambiguität bei der Eigenwertzerlegung der Kernel-Matrix). #13241 von Aurélien Bellet.
Korrektur Ein Fehler in decomposition.KernelPCA wurde behoben, fit().transform() liefert nun das korrekte Ergebnis (dasselbe wie fit_transform()) im Falle von nicht entfernten Null-Eigenwerten (remove_zero_eig=False). fit_inverse_transform wurde ebenfalls beschleunigt, indem derselbe Trick wie bei fit_transform verwendet wurde, um die Transformation von X zu berechnen. #12143 von Sylvain Marié
Korrektur Ein Fehler in decomposition.NMF wurde behoben, bei dem init = 'nndsvd', init = 'nndsvda' und init = 'nndsvdar' erlaubt waren, wenn n_components < n_features statt n_components <= min(n_samples, n_features). #11650 von Hossein Pourbozorg und Zijie (ZJ) Poh.
API-Änderung Der Standardwert des Arguments init in decomposition.non_negative_factorization wird in Version 0.23 von random auf None geändert, um ihn mit decomposition.NMF konsistent zu machen. Eine FutureWarning wird ausgegeben, wenn der Standardwert verwendet wird. #12988 von Zijie (ZJ) Poh.

`sklearn.discriminant_analysis`#

Verbesserung discriminant_analysis.LinearDiscriminantAnalysis behält nun float32 und float64 dtypes bei. #8769 und #11000 von Thibault Sejourne
Korrektur Eine ChangedBehaviourWarning wird nun ausgegeben, wenn discriminant_analysis.LinearDiscriminantAnalysis der Parameter n_components > min(n_features, n_classes - 1) übergeben wird und n_components auf min(n_features, n_classes - 1) geändert wird. Zuvor erfolgte die Änderung, aber lautlos. #11526 von William de Vazelhes.
Korrektur Ein Fehler in discriminant_analysis.LinearDiscriminantAnalysis wurde behoben, bei dem die vorhergesagten Wahrscheinlichkeiten im Multiklassenfall falsch berechnet wurden. #6848, von Agamemnon Krasoulis und Guillaume Lemaitre <glemaitre>.
Korrektur Ein Fehler in discriminant_analysis.LinearDiscriminantAnalysis wurde behoben, bei dem die vorhergesagten Wahrscheinlichkeiten mit dem eigen Solver falsch berechnet wurden. #11727, von Agamemnon Krasoulis.

`sklearn.dummy`#

Korrektur Ein Fehler in dummy.DummyClassifier wurde behoben, bei dem die Methode predict_proba ein int32-Array anstelle eines float64-Arrays für die stratified-Strategie zurückgab. #13266 von Christos Aridas.
Korrektur Ein Fehler in dummy.DummyClassifier wurde behoben, bei dem zur Vorhersagezeit ein Dimensionskonflikt-Fehler auftrat, wenn während fit ein Spaltenvektor y mit shape=(n, 1) übergeben wurde. #13545 von Nick Sorros und Adrin Jalali.

`sklearn.ensemble`#

Hauptfunktion Zwei neue Implementierungen von Gradient Boosting Trees hinzugefügt: ensemble.HistGradientBoostingClassifier und ensemble.HistGradientBoostingRegressor. Die Implementierung dieser Estimators ist inspiriert von LightGBM und kann um Größenordnungen schneller sein als ensemble.GradientBoostingRegressor und ensemble.GradientBoostingClassifier, wenn die Anzahl der Samples größer als zehntausende ist. Die API dieser neuen Estimators ist leicht unterschiedlich und einige Features von ensemble.GradientBoostingClassifier und ensemble.GradientBoostingRegressor werden noch nicht unterstützt.

Diese neuen Estimators sind experimentell, was bedeutet, dass ihre Ergebnisse oder ihre API ohne Deprecationszyklus geändert werden können. Um sie zu verwenden, müssen Sie explizit enable_hist_gradient_boosting importieren.
```
>>> # explicitly require this experimental feature
>>> from sklearn.experimental import enable_hist_gradient_boosting  # noqa
>>> # now you can import normally from sklearn.ensemble
>>> from sklearn.ensemble import HistGradientBoostingClassifier
```
Hinweis

Update: Seit Version 1.0 sind diese Estimators nicht mehr experimentell und Sie müssen nicht mehr from sklearn.experimental import enable_hist_gradient_boosting verwenden.

#12807 von Nicolas Hug.
Funktion ensemble.VotingRegressor hinzugefügt, die ein Äquivalent zu ensemble.VotingClassifier für Regressionsprobleme bietet. #12513 von Ramil Nugmanov und Mohamed Ali Jamaoui.
Effizienz ensemble.IsolationForest bevorzugt nun Threads gegenüber Prozessen, wenn mit n_jobs > 1 gearbeitet wird, da die zugrunde liegenden Decision Tree-Fit-Aufrufe die GIL freigeben. Diese Änderung reduziert den Speicherverbrauch und den Kommunikationsaufwand. #12543 von Isaac Storch und Olivier Grisel.
Effizienz ensemble.IsolationForest ist speichereffizienter, da die Vorhersagen jedes Baumes nicht mehr im Speicher gehalten werden. #13260 von Nicolas Goix.
Effizienz ensemble.IsolationForest verwendet nun Datenblöcke im Vorhersageschritt, wodurch die Speichernutzung begrenzt wird. #13283 von Nicolas Goix.
Effizienz sklearn.ensemble.GradientBoostingClassifier und sklearn.ensemble.GradientBoostingRegressor behalten nun das Eingabe-y als float64, um zu vermeiden, dass es intern von Bäumen kopiert wird. #13524 von Adrin Jalali.
Verbesserung Die Validierung von X in ensemble.AdaBoostClassifier und ensemble.AdaBoostRegressor wurde minimiert. #13174 von Christos Aridas.
Verbesserung ensemble.IsolationForest exponiert nun den Parameter warm_start, was die iterative Hinzufügung von Bäumen zu einem Isolation Forest ermöglicht. #13496 von Peter Marko.
Korrektur Die Werte von feature_importances_ in allen auf Random Forest basierenden Modellen (d.h. ensemble.RandomForestClassifier, ensemble.RandomForestRegressor, ensemble.ExtraTreesClassifier, ensemble.ExtraTreesRegressor, ensemble.RandomTreesEmbedding, ensemble.GradientBoostingClassifier und ensemble.GradientBoostingRegressor) summieren sich nun
- zu 1
- alle einzelnen Knoten in der Berechnung der Merkmalsbedeutsamkeit werden ignoriert
- wenn alle Bäume nur einen einzigen Knoten haben (d.h. einen Wurzelknoten), sind die Merkmalsbedeutsamkeiten ein Array aus Nullen.
#13636 und #13620 von Adrin Jalali.
Korrektur Ein Fehler in ensemble.GradientBoostingClassifier und ensemble.GradientBoostingRegressor wurde behoben, die scikit-learn Estimators als initiale Estimators nicht unterstützten. Zusätzlich wurde die Unterstützung für initiale Estimators hinzugefügt, die keine Stichprobengewichte unterstützen. #12436 von Jérémie du Boisberranger und #12983 von Nicolas Hug.
Korrektur Die Ausgabe der durchschnittlichen Pfadlänge, die in ensemble.IsolationForest berechnet wurde, wurde korrigiert, wenn die Eingabe 0, 1 oder 2 war. #13251 von Albert Thomas und joshuakennethjones.
Korrektur Ein Fehler in ensemble.GradientBoostingClassifier wurde behoben, bei dem die Gradienten bei Multiklassen-Klassifizierungsproblemen falsch berechnet wurden. #12715 von Nicolas Hug.
Korrektur Ein Fehler in ensemble.GradientBoostingClassifier wurde behoben, bei dem Validierungsdatensätze für Early Stopping nicht mit Stratifizierung gestichprobt wurden. #13164 von Nicolas Hug.
Korrektur Ein Fehler in ensemble.GradientBoostingClassifier wurde behoben, bei dem die Standard-Initialvorhersage eines Multiklassen-Klassifikators die Klassenwahrscheinlichkeiten statt des Logarithmus der Wahrscheinlichkeiten vorhersagte. #12983 von Nicolas Hug.
Korrektur Ein Fehler in ensemble.RandomForestClassifier wurde behoben, bei dem die Methode predict für Multiklassen-Multi-Output-Random-Forest-Modelle fehlschlug, wenn Ziele Strings waren. #12834 von Elizabeth Sander.
Korrektur Ein Fehler in ensemble.gradient_boosting.LossFunction und ensemble.gradient_boosting.LeastSquaresError wurde behoben, bei dem der Standardwert von learning_rate in update_terminal_regions nicht mit der Dokumentation und den aufrufenden Funktionen übereinstimmte. Beachten Sie jedoch, dass die direkte Verwendung dieser Verlustfunktionen veraltet ist. #6463 von movelikeriver.
Korrektur ensemble.partial_dependence (und folglich die neue Version sklearn.inspection.partial_dependence) berücksichtigt nun Stichprobengewichte für die Berechnung der partiellen Abhängigkeit, wenn das Gradient Boosting-Modell mit Stichprobengewichten trainiert wurde. #13193 von Samuel O. Ronsin.
API-Änderung ensemble.partial_dependence und ensemble.plot_partial_dependence sind nun zugunsten von inspection.partial_dependence und inspection.plot_partial_dependence<sklearn.inspection.plot_partial_dependence> veraltet. #12599 von Trevor Stephens und Nicolas Hug.
Korrektur ensemble.VotingClassifier und ensemble.VotingRegressor schlug fehl während fit, wenn einer der Estimators auf None gesetzt war und sample_weight nicht None war. #13779 von Guillaume Lemaitre.
API-Änderung ensemble.VotingClassifier und ensemble.VotingRegressor akzeptieren nun 'drop', um einen Estimator zu deaktivieren, zusätzlich zu None, um mit anderen Estimators (d.h. pipeline.FeatureUnion und compose.ColumnTransformer) konsistent zu sein. #13780 von Guillaume Lemaitre.

`sklearn.externals`#

API-Änderung externals.six wurde veraltet, da die Unterstützung für Python 2.7 eingestellt wurde. #12916 von Hanmin Qin.

`sklearn.feature_extraction`#

Korrektur Wenn input='file' oder input='filename' und ein aufrufbares Objekt als analyzer übergeben wird, lesen sklearn.feature_extraction.text.HashingVectorizer, sklearn.feature_extraction.text.TfidfVectorizer und sklearn.feature_extraction.text.CountVectorizer die Daten nun aus der/den Datei(en) und übergeben sie an den gegebenen analyzer, anstatt den/die Dateinamen oder das/die Datei-Objekt(e) an den analyzer zu übergeben. #13641 von Adrin Jalali.

`sklearn.impute`#

Hauptfunktion impute.IterativeImputer hinzugefügt, eine Strategie zur Imputation fehlender Werte, indem jede Merkmal mit fehlenden Werten als Funktion anderer Merkmale in einer Round-Robin-Art modelliert wird. #8478 und #12177 von Sergey Feldman und Ben Lawson.

Die API von IterativeImputer ist experimentell und kann ohne Deprecationszyklus geändert werden. Um sie zu verwenden, müssen Sie explizit enable_iterative_imputer importieren.
```
>>> from sklearn.experimental import enable_iterative_imputer  # noqa
>>> # now you can import normally from sklearn.impute
>>> from sklearn.impute import IterativeImputer
```
Feature Die Klassen impute.SimpleImputer und impute.IterativeImputer haben einen neuen Parameter 'add_indicator', der einfach eine impute.MissingIndicator Transformation an die Ausgabe des Imputers anhängt. Dies ermöglicht einem prädiktiven Schätzer, das Fehlen von Werten zu berücksichtigen. #12583, #13601 von Danylo Baibak.
Fix In impute.MissingIndicator wird die implizite Verdichtung vermieden, indem eine Ausnahme ausgelöst wird, wenn die Eingabe spärlich ist und die Eigenschaft missing_values auf 0 gesetzt ist. #13240 von Bartosz Telenczuk.
Fix Zwei Fehler in impute.MissingIndicator behoben. Erstens wurden bei spärlichem X alle nicht-Null-Werte, die nicht fehlten, in den transformierten Daten explizit zu False. Zweitens wurden bei features='missing-only' alle Merkmale beibehalten, auch wenn gar keine fehlenden Werte vorhanden waren. #13562 von Jérémie du Boisberranger.

`sklearn.inspection`#

(neues Unterpaket)

Feature Partielle Abhängigkeitsplots (inspection.plot_partial_dependence) werden nun für jeden Regressor oder Klassifikator unterstützt (vorausgesetzt, sie haben eine predict_proba Methode). #12599 von Trevor Stephens und Nicolas Hug.

`sklearn.isotonic`#

Feature Zulassen unterschiedlicher Datentypen (wie float32) in isotonic.IsotonicRegression. #8769 von Vlad Niculae

`sklearn.linear_model`#

Enhancement linear_model.Ridge behält nun float32 und float64 Datentypen bei. #8769 und #11000 von Guillaume Lemaitre und Joan Massich
Feature linear_model.LogisticRegression und linear_model.LogisticRegressionCV unterstützen nun die Elastic-Net-Strafe mit dem 'saga'-Solver. #11646 von Nicolas Hug.
Feature linear_model.lars_path_gram hinzugefügt, welches linear_model.lars_path im Modus der hinreichenden Statistiken ist, was Benutzern die Berechnung von linear_model.lars_path ohne Angabe von X und y ermöglicht. #11699 von Kuai Yu.
Efficiency linear_model.make_dataset behält nun float32 und float64 Datentypen bei und reduziert so den Speicherverbrauch bei stochastischen Gradienten-, SAG- und SAGA-Solvern. #8769 und #11000 von Nelle Varoquaux, Arthur Imbert, Guillaume Lemaitre und Joan Massich
Enhancement linear_model.LogisticRegression unterstützt nun ein nicht-regularisiertes Ziel, wenn penalty='none' übergeben wird. Dies ist äquivalent zu C=np.inf mit L2-Regularisierung. Nicht unterstützt vom liblinear-Solver. #12860 von Nicolas Hug.
Enhancement Der sparse_cg Solver in linear_model.Ridge unterstützt nun das Anpassen des Achsenabschnitts (d.h. fit_intercept=True), wenn die Eingaben spärlich sind. #13336 von Bartosz Telenczuk.
Enhancement Der Koordinatenabstieg-Solver, der in Lasso, ElasticNet usw. verwendet wird, gibt nun eine ConvergenceWarning aus, wenn er ohne Erreichen der gewünschten Toleranz abgeschlossen wird. #11754 und #13397 von Brent Fagan und Adrin Jalali.
Fix Fehler in linear_model.LogisticRegression und linear_model.LogisticRegressionCV mit dem 'saga'-Solver behoben, bei dem die Gewichte in einigen Fällen nicht korrekt aktualisiert wurden. #11646 von Tom Dupre la Tour.
Fix Der Posterior-Mittelwert, die Posterior-Kovarianz und die zurückgegebenen Regularisierungsparameter in linear_model.BayesianRidge behoben. Der Posterior-Mittelwert und die Posterior-Kovarianz wurden nicht mit der letzten Aktualisierung der Regularisierungsparameter berechnet, und die zurückgegebenen Regularisierungsparameter waren nicht die endgültigen. Formel für die marginale logarithmische Wahrscheinlichkeit zur Berechnung des Scores bei compute_score=True ebenfalls behoben. #12174 von Albert Thomas.
Fix Fehler in linear_model.LassoLarsIC behoben, bei dem die Benutzereingabe copy_X=False bei der Instanzerstellung durch den Standardparameterwert copy_X=True in fit überschrieben wurde. #12972 von Lucio Fernandez-Arjona
Fix Fehler in linear_model.LinearRegression behoben, der nicht die gleichen Koeffizienten und Achsenabschnitte mit fit_intercept=True im spärlichen und dichten Fall zurückgab. #13279 von Alexandre Gramfort
Fix Fehler in linear_model.HuberRegressor behoben, der bei booleschem dtype von X kaputt war. #13328 von Alexandre Gramfort.
Fix Leistungsproblem der saga und sag Solver behoben, wenn sie in einer joblib.Parallel Einstellung mit n_jobs > 1 und backend="threading" aufgerufen wurden, was dazu führte, dass sie schlechter als im sequenziellen Fall liefen. #13389 von Pierre Glaser.
Fix Fehler in linear_model.stochastic_gradient.BaseSGDClassifier behoben, der im Multiklassen-Setting auf mehreren Threads nicht deterministisch war. #13422 von Clément Doumouro.
Fix Fehler in linear_model.ridge_regression, linear_model.Ridge und linear_model.RidgeClassifier behoben, der eine unbehandelte Ausnahme für die Argumente return_intercept=True und solver=auto (Standard) oder jeden anderen Solver außer sag verursachte. #13363 von Bartosz Telenczuk
Fix linear_model.ridge_regression löst nun eine Ausnahme aus, wenn return_intercept=True ist und der Solver von sag abweicht. Zuvor wurde nur eine Warnung ausgegeben. #13363 von Bartosz Telenczuk
Fix linear_model.ridge_regression wählt nun den sparse_cg Solver für spärliche Eingaben, wenn solver=auto und sample_weight bereitgestellt wird (zuvor wurde der cholesky Solver ausgewählt). #13363 von Bartosz Telenczuk
API Change Die Verwendung von linear_model.lars_path mit X=None bei Übergabe von Gram ist in Version 0.21 veraltet und wird in Version 0.23 entfernt. Verwenden Sie stattdessen linear_model.lars_path_gram. #11699 von Kuai Yu.
API Change linear_model.logistic_regression_path ist in Version 0.21 veraltet und wird in Version 0.23 entfernt. #12821 von Nicolas Hug.
Fix linear_model.RidgeCV mit Leave-One-Out-Kreuzvalidierung passt nun korrekt einen Achsenabschnitt an, wenn fit_intercept=True ist und die Designmatrix spärlich ist. #13350 von Jérôme Dockès

`sklearn.manifold`#

Efficiency manifold.trustworthiness verwendet nun einen invertierten Index anstelle einer np.where-Suche, um den Rang der Nachbarn im Eingaberaum zu finden. Dies verbessert die Effizienz insbesondere bei der Berechnung mit vielen Nachbarn und/oder kleinen Datensätzen. #9907 von William de Vazelhes.

`sklearn.metrics`#

Feature Die Metrik metrics.max_error und ein entsprechender 'max_error'-Scorer für die Regression mit einzelnem Output hinzugefügt. #12232 von Krishna Sangeeth.
Feature metrics.multilabel_confusion_matrix hinzugefügt, die eine Konfusionsmatrix mit Zählungen von True Positive, False Positive, False Negative und True Negative für jede Klasse berechnet. Dies erleichtert die Berechnung von Set-basierten Metriken wie Recall, Spezifität, Fall-Out und Miss-Rate. #11179 von Shangwu Yao und Joel Nothman.
Feature metrics.jaccard_score wurde hinzugefügt, um den Jaccard-Koeffizienten als Bewertungsmetrik für binäre, multilabel und multiklasse Aufgaben zu berechnen, mit einer Schnittstelle analog zu metrics.f1_score. #13151 von Gaurav Dhingra und Joel Nothman.
Feature metrics.pairwise.haversine_distances hinzugefügt, die mit metric='pairwise' über metrics.pairwise_distances und Schätzern zugänglich ist. (Haversine-Distanz war zuvor für die Berechnung von nächsten Nachbarn verfügbar.) #12568 von Wei Xue, Emmanuel Arias und Joel Nothman.
Efficiency Schnellere metrics.pairwise_distances mit n_jobs > 1 durch Verwendung eines Thread-basierten Backends anstelle von Prozess-basierten Backends. #8216 von Pierre Glaser und Romuald Menuet
Efficiency Die paarweisen Manhattan-Distanzen mit spärlicher Eingabe verwenden nun die von SciPy bereitgestellte BLAS anstelle der gebündelten BLAS. #12732 von Jérémie du Boisberranger
Enhancement Verwendung des Labels accuracy anstelle von micro-average in metrics.classification_report, um Verwechslungen zu vermeiden. micro-average wird nur für Multilabel- oder Multiklassen-Aufgaben mit einer Teilmenge von Klassen angezeigt, da es ansonsten identisch mit Genauigkeit ist. #12334 von Emmanuel Arias, Joel Nothman und Andreas Müller
Enhancement beta-Parameter zu metrics.homogeneity_completeness_v_measure und metrics.v_measure_score hinzugefügt, um die Abwägung zwischen Homogenität und Vollständigkeit zu konfigurieren. #13607 von Stephane Couvreur und Ivan Sanchez.
Fix Die Metrik metrics.r2_score ist bei einer einzelnen Stichprobe degeneriert und gibt nun NaN und eine exceptions.UndefinedMetricWarning aus. #12855 von Pawel Sendyk.
Fix Fehler behoben, bei dem metrics.brier_score_loss manchmal ein falsches Ergebnis lieferte, wenn nur eine Klasse in y_true vorhanden war. #13628 von Hanmin Qin.
Fix Fehler in metrics.label_ranking_average_precision_score behoben, bei der sample_weight für Stichproben mit degenerierten Labels nicht berücksichtigt wurde. #13447 von Dan Ellis.
API Change Der Parameter labels in metrics.hamming_loss ist in Version 0.21 veraltet und wird in Version 0.23 entfernt. #10580 von Reshama Shaikh und Sandra Mitrovic.
Fix Die Funktion metrics.pairwise.euclidean_distances und damit mehrere Schätzer mit metric='euclidean' litten unter numerischen Präzisionsproblemen mit float32-Merkmalen. Die Präzision wurde auf Kosten eines geringen Leistungsabfalls erhöht. #13554 von @Celelibi und Jérémie du Boisberranger.
API Change metrics.jaccard_similarity_score ist zugunsten des konsistenteren metrics.jaccard_score veraltet. Das frühere Verhalten für binäre und multiklasse Ziele ist defekt. #13151 von Joel Nothman.

`sklearn.mixture`#

Fix Fehler in mixture.BaseMixture und damit in darauf basierenden Schätzern, d.h. mixture.GaussianMixture und mixture.BayesianGaussianMixture, behoben, bei denen fit_predict und fit.predict nicht äquivalent waren. #13142 von Jérémie du Boisberranger.

`sklearn.model_selection`#

Feature Die Klassen GridSearchCV und RandomizedSearchCV erlauben nun refit=callable, um die Flexibilität bei der Identifizierung des besten Schätzers zu erhöhen. Siehe Modellkomplexität und kreuzvalidierter Score ausbalancieren. #11354 von Wenhao Zhang, Joel Nothman und Adrin Jalali.
Enhancement Die Klassen GridSearchCV, RandomizedSearchCV und die Methoden cross_val_score, cross_val_predict, cross_validate geben nun Trainings-Scores aus, wenn return_train_scores auf True gesetzt ist und verbose > 2 ist. Für learning_curve und validation_curve ist nur letzteres erforderlich. #12613 und #12669 von Marc Torrellas.
Enhancement Einige CV-Splitter-Klassen und model_selection.train_test_split lösen nun ValueError aus, wenn die resultierende Trainingsmenge leer ist. #12861 von Nicolas Hug.
Fix Behobene einen Fehler, bei dem model_selection.StratifiedKFold die Samples jeder Klasse mit demselben random_state mischte, was shuffle=True unwirksam machte. #13124 von Hanmin Qin.
Fix Hinzugefügt Fähigkeit für model_selection.cross_val_predict, Multi-Label-(und Multi-Output-Multiclass)-Ziele mit Methoden vom Typ predict_proba zu verarbeiten. #8773 von Stephen Hoover.
Fix Behobene ein Problem in cross_val_predict, bei dem method="predict_proba" immer 0.0 zurückgab, wenn eine der Klassen in einem Kreuzvalidierungs-Fold ausgeschlossen war. #13366 von Guillaume Fournier

`sklearn.multiclass`#

Fix Behobene ein Problem in multiclass.OneVsOneClassifier.decision_function, bei dem der decision_function-Wert eines gegebenen Samples davon abhing, ob die decision_function allein auf dem Sample oder auf einem Batch, das dieses Sample enthielt, ausgewertet wurde, aufgrund der Skalierung in decision_function. #10440 von Jonathan Ohayon.

`sklearn.multioutput`#

Fix Behobene ein Fehler in multioutput.MultiOutputClassifier, bei dem die Methode predict_proba fälschlicherweise nach dem predict_proba-Attribut im Schätzerobjekt suchte. #12222 von Rebekah Kim

`sklearn.neighbors`#

Major Feature neighbors.NeighborhoodComponentsAnalysis für Metrik-Learning wurde hinzugefügt, die den Neighborhood Components Analysis Algorithmus implementiert. #10058 von William de Vazelhes und John Chiotellis.
API Change Methoden in neighbors.NearestNeighbors: kneighbors, radius_neighbors, kneighbors_graph, radius_neighbors_graph lösen nun NotFittedError aus, anstatt AttributeError, wenn sie vor fit aufgerufen werden. #12279 von Krishna Sangeeth.

`sklearn.neural_network`#

Fix Behobene ein Fehler in neural_network.MLPClassifier und neural_network.MLPRegressor, bei dem die Option shuffle=False ignoriert wurde. #12582 von Sam Waterbury.
Fix Behobene ein Fehler in neural_network.MLPClassifier, bei dem Validierungssets für Early Stopping nicht stratifiziert abgeglichen wurden. Im Multi-Label-Fall werden die Splits jedoch weiterhin nicht stratifiziert. #13164 von Nicolas Hug.

`sklearn.pipeline`#

Feature pipeline.Pipeline kann nun die Indexierungsnotation (z. B. my_pipeline[0:-1]) verwenden, um eine Teilsequenz von Schritten als eine weitere Pipeline-Instanz zu extrahieren. Eine Pipeline kann auch direkt indiziert werden, um einen bestimmten Schritt zu extrahieren (z. B. my_pipeline['svc']), anstatt auf named_steps zuzugreifen. #2568 von Joel Nothman.
Feature Optionaler Parameter verbose wurde in pipeline.Pipeline, compose.ColumnTransformer und pipeline.FeatureUnion sowie entsprechende make_ Helfer hinzugefügt, um den Fortschritt und die Zeitmessung jedes Schritts anzuzeigen. #11364 von Baze Petrushev, Karan Desai, Joel Nothman und Thomas Fan.
Enhancement pipeline.Pipeline unterstützt nun die Verwendung von 'passthrough' als Transformator, mit demselben Effekt wie None. #11144 von Thomas Fan.
Enhancement pipeline.Pipeline implementiert __len__ und daher gibt len(pipeline) die Anzahl der Schritte in der Pipeline zurück. #13439 von Lakshya KD.

`sklearn.preprocessing`#

Feature preprocessing.OneHotEncoder unterstützt nun das Weglassen eines Features pro Kategorie mit einem neuen Parameter drop. #12908 von Drew Johnston.
Efficiency preprocessing.OneHotEncoder und preprocessing.OrdinalEncoder verarbeiten Pandas DataFrames nun effizienter. #13253 von @maikia.
Efficiency Caching von Klassen-Mappings in preprocessing.MultiLabelBinarizer, anstatt sie jedes Mal on-the-fly zu berechnen. #12116 von Ekaterina Krivich und Joel Nothman.
Efficiency preprocessing.PolynomialFeatures unterstützt nun komprimierte Sparse Row (CSR)-Matrizen als Eingabe für die Grade 2 und 3. Dies ist in der Regel wesentlich schneller als der dichte Fall, da es mit der Dichte der Matrix und dem Erweiterungsgrad skaliert (in der Größenordnung von Dichte^Grad) und viel, viel schneller als der komprimierte Sparse Column (CSC)-Fall. #12197 von Andrew Nystrom.
Efficiency Geschwindigkeitsverbesserung in preprocessing.PolynomialFeatures im dichten Fall. Ein neuer Parameter order wurde hinzugefügt, der die Ausgabereihenfolge für weitere Geschwindigkeitsverbesserungen steuert. #12251 von Tom Dupre la Tour.
Fix Behobene ein Überlauf bei der Berechnung, wenn ein Float16-Datentyp mit preprocessing.StandardScaler verwendet wurde. #13007 von Raffaello Baluyot
Fix Behobene ein Fehler in preprocessing.QuantileTransformer und preprocessing.quantile_transform, um n_quantiles auf höchstens n_samples zu erzwingen. Werte von n_quantiles, die größer als n_samples waren, waren entweder nutzlos oder führten zu einer falschen Approximation des Schätzers für die kumulative Verteilungsfunktion. #13333 von Albert Thomas.
API Change Der Standardwert für copy in preprocessing.quantile_transform wird von False auf True in Version 0.23 geändert, um ihn konsistenter mit den Standardwerten von copy in anderen Funktionen von sklearn.preprocessing zu machen und unerwartete Nebeneffekte durch Modifikation von X inplace zu verhindern. #13459 von Hunter McGushion.

`sklearn.svm`#

Fix Behobene ein Problem in svm.SVC.decision_function wenn decision_function_shape='ovr'. Der decision_function-Wert eines gegebenen Samples unterschied sich davon, ob die decision_function allein auf dem Sample oder auf einem Batch mit demselben Sample ausgewertet wurde, aufgrund der in decision_function verwendeten Skalierung. #10440 von Jonathan Ohayon.

`sklearn.tree`#

Feature Entscheidungsbäume können nun mit matplotlib über tree.plot_tree gezeichnet werden, ohne auf die dot-Bibliothek angewiesen zu sein, wodurch eine schwer zu installierende Abhängigkeit entfällt. #8508 von Andreas Müller.
Feature Entscheidungsbäume können nun mit tree.export_text in einem menschenlesbaren Textformat exportiert werden. #6261 von Giuseppe Vettigli <JustGlowing>.
Feature get_n_leaves() und get_depth() wurden zu tree.BaseDecisionTree und damit zu allen darauf basierenden Schätzern hinzugefügt, einschließlich tree.DecisionTreeClassifier, tree.DecisionTreeRegressor, tree.ExtraTreeClassifier und tree.ExtraTreeRegressor. #12300 von Adrin Jalali.
Fix Bäume und Wälder konnten zuvor keine Multi-Output-Klassifizierungsziele mit String-Labels predict, obwohl sie in fit akzeptiert wurden. #11458 von Mitar Milutinovic.
Fix Behobene ein Problem mit tree.BaseDecisionTree und damit allen darauf basierenden Schätzern, einschließlich tree.DecisionTreeClassifier, tree.DecisionTreeRegressor, tree.ExtraTreeClassifier und tree.ExtraTreeRegressor, bei denen sie den angegebenen max_depth um 1 überschritten, während sie den Baum erweiterten, wenn sowohl max_leaf_nodes als auch max_depth vom Benutzer angegeben wurden. Beachten Sie, dass dies auch alle Ensemble-Methoden betrifft, die Entscheidungsbäume verwenden. #12344 von Adrin Jalali.

`sklearn.utils`#

Feature utils.resample akzeptiert nun einen Parameter stratify für das Sampling gemäß Klassenverteilungen. #13549 von Nicolas Hug.
API Change Der Parameter warn_on_dtype von utils.check_array und utils.check_X_y wurde als veraltet markiert. Eine explizite Warnung für die Datentypkonvertierung in check_pairwise_arrays wurde hinzugefügt, wenn die übergebene metric eine paarweise boolesche Metrik ist. #13382 von Prathmesh Savale.

Mehrere Module#

Major Feature Die Methode __repr__() aller Schätzer (verwendet beim Aufrufen von print(estimator)) wurde komplett neu geschrieben und basiert auf der Pretty-Printing-Standardbibliothek von Python. Alle Parameter werden standardmäßig ausgegeben, dies kann jedoch mit der Option print_changed_only in sklearn.set_config geändert werden. #11705 von Nicolas Hug.
Major Feature Hinzugefügt: Estimator-Tags. Dies sind Annotationen von Schätzern, die eine programmatische Inspektion ihrer Fähigkeiten ermöglichen, wie z. B. Unterstützung für Sparse-Matrizen, unterstützte Ausgabetypen und unterstützte Methoden. Estimator-Tags bestimmen auch die Tests, die auf einem Schätzer ausgeführt werden, wenn check_estimator aufgerufen wird. Lesen Sie mehr im Benutzerhandbuch. #8022 von Andreas Müller.
Efficiency Speicherkopien werden bei der Umwandlung von Arrays in einen anderen Datentyp in mehreren Schätzern vermieden. #11973 von Roman Yurchak.
Fix Behobene ein Fehler in der Implementierung der Hilfsfunktion our_rand_r, die plattformübergreifend nicht konsistent funktionierte. #13422 von Madhura Parikh und Clément Doumouro.

Sonstiges#

Enhancement Joblib wird nicht mehr in scikit-learn mitgeliefert und wird zu einer Abhängigkeit. Die minimal unterstützte Version ist joblib 0.11, es wird jedoch dringend empfohlen, eine Version >= 0.13 zu verwenden. #13531 von Roman Yurchak.

Änderungen an Schätzerprüfungen#

Diese Änderungen betreffen hauptsächlich Bibliotheksentwickler.

Fügt check_fit_idempotent zu check_estimator hinzu, die prüft, ob bei doppeltem Aufruf von fit mit denselben Daten die Ausgabe von predict, predict_proba, transform und decision_function unverändert bleibt. #12328 von Nicolas Hug
Viele Prüfungen können nun mit Estimator Tags deaktiviert oder konfiguriert werden. #8022 von Andreas Müller.

Code- und Dokumentationsbeitragende

Vielen Dank an alle, die seit Version 0.20 zur Wartung und Verbesserung des Projekts beigetragen haben, darunter

adanhawth, Aditya Vyas, Adrin Jalali, Agamemnon Krasoulis, Albert Thomas, Alberto Torres, Alexandre Gramfort, amourav, Andrea Navarrete, Andreas Mueller, Andrew Nystrom, assiaben, Aurélien Bellet, Bartosz Michałowski, Bartosz Telenczuk, bauks, BenjaStudio, bertrandhaut, Bharat Raghunathan, brentfagan, Bryan Woods, Cat Chenal, Cheuk Ting Ho, Chris Choe, Christos Aridas, Clément Doumouro, Cole Smith, Connossor, Corey Levinson, Dan Ellis, Dan Stine, Danylo Baibak, daten-kieker, Denis Kataev, Didi Bar-Zev, Dillon Gardner, Dmitry Mottl, Dmitry Vukolov, Dougal J. Sutherland, Dowon, drewmjohnston, Dror Atariah, Edward J Brown, Ekaterina Krivich, Elizabeth Sander, Emmanuel Arias, Eric Chang, Eric Larson, Erich Schubert, esvhd, Falak, Feda Curic, Federico Caselli, Frank Hoang, Fibinse Xavier, Finn O’Shea, Gabriel Marzinotto, Gabriel Vacaliuc, Gabriele Calvo, Gael Varoquaux, GauravAhlawat, Giuseppe Vettigli, Greg Gandenberger, Guillaume Fournier, Guillaume Lemaitre, Gustavo De Mari Pereira, Hanmin Qin, haroldfox, hhu-luqi, Hunter McGushion, Ian Sanders, JackLangerman, Jacopo Notarstefano, jakirkham, James Bourbeau, Jan Koch, Jan S, janvanrijn, Jarrod Millman, jdethurens, jeremiedbb, JF, joaak, Joan Massich, Joel Nothman, Jonathan Ohayon, Joris Van den Bossche, josephsalmon, Jérémie Méhault, Katrin Leinweber, ken, kms15, Koen, Kossori Aruku, Krishna Sangeeth, Kuai Yu, Kulbear, Kushal Chauhan, Kyle Jackson, Lakshya KD, Leandro Hermida, Lee Yi Jie Joel, Lily Xiong, Lisa Sarah Thomas, Loic Esteve, louib, luk-f-a, maikia, mail-liam, Manimaran, Manuel López-Ibáñez, Marc Torrellas, Marco Gaido, Marco Gorelli, MarcoGorelli, marineLM, Mark Hannel, Martin Gubri, Masstran, mathurinm, Matthew Roeschke, Max Copeland, melsyt, mferrari3, Mickaël Schoentgen, Ming Li, Mitar, Mohammad Aftab, Mohammed AbdelAal, Mohammed Ibraheem, Muhammad Hassaan Rafique, mwestt, Naoya Iijima, Nicholas Smith, Nicolas Goix, Nicolas Hug, Nikolay Shebanov, Oleksandr Pavlyk, Oliver Rausch, Olivier Grisel, Orestis, Osman, Owen Flanagan, Paul Paczuski, Pavel Soriano, pavlos kallis, Pawel Sendyk, peay, Peter, Peter Cock, Peter Hausamann, Peter Marko, Pierre Glaser, pierretallotte, Pim de Haan, Piotr Szymański, Prabakaran Kumaresshan, Pradeep Reddy Raamana, Prathmesh Savale, Pulkit Maloo, Quentin Batista, Radostin Stoyanov, Raf Baluyot, Rajdeep Dua, Ramil Nugmanov, Raúl García Calvo, Rebekah Kim, Reshama Shaikh, Rohan Lekhwani, Rohan Singh, Rohan Varma, Rohit Kapoor, Roman Feldbauer, Roman Yurchak, Romuald M, Roopam Sharma, Ryan, Rüdiger Busche, Sam Waterbury, Samuel O. Ronsin, SandroCasagrande, Scott Cole, Scott Lowe, Sebastian Raschka, Shangwu Yao, Shivam Kotwalia, Shiyu Duan, smarie, Sriharsha Hatwar, Stephen Hoover, Stephen Tierney, Stéphane Couvreur, surgan12, SylvainLan, TakingItCasual, Tashay Green, thibsej, Thomas Fan, Thomas J Fan, Thomas Moreau, Tom Dupré la Tour, Tommy, Tulio Casagrande, Umar Farouk Umar, Utkarsh Upadhyay, Vinayak Mehta, Vishaal Kapoor, Vivek Kumar, Vlad Niculae, vqean3, Wenhao Zhang, William de Vazelhes, xhan, Xing Han Lu, xinyuliu12, Yaroslav Halchenko, Zach Griffith, Zach Miller, Zayd Hammoudeh, Zhuyi Xue, Zijie (ZJ) Poh, ^__^

Version 0.21#

Version 0.21.3#

Geänderte Modelle#

Änderungsprotokoll#

Version 0.21.2#

Änderungsprotokoll#

sklearn.utils.sparsefuncs#

Version 0.21.1#

Änderungsprotokoll#

Version 0.21.0#

Geänderte Modelle#

Bekannte Hauptfehler#

Änderungsprotokoll#

sklearn.externals#

Mehrere Module#

Sonstiges#

Änderungen an Schätzerprüfungen#

Diese Seite

`sklearn.utils.sparsefuncs`#

`sklearn.externals`#