Version 0.17#

Version 0.17.1#

18. Februar 2016

Änderungsprotokoll#

Fehlerbehebungen#

  • Verwendetes joblib auf Version 0.9.4 aktualisiert, was einen wichtigen Fehler in joblib.Parallel behebt, der bei der Arbeit mit Datensätzen größer als 1 MB stillschweigend zu falschen Ergebnissen führen konnte: joblib/joblib

  • Behob das Lesen von Bunch-Pickles, die mit scikit-learn Version <= 0.16 generiert wurden. Dies kann Benutzer betreffen, die bereits einen Datensatz mit scikit-learn 0.16 heruntergeladen und ihn mit scikit-learn 0.17 laden. Siehe #6196, wie sich dies auf datasets.fetch_20newsgroups ausgewirkt hat. Von Loic Esteve.

  • Einen Fehler behoben, der die Verwendung des ROC AUC-Scores für die Gitter-Suche auf mehreren CPUs/Kernen bei großen Arrays verhinderte. Siehe #6147 Von Olivier Grisel.

  • Einen Fehler behoben, der die korrekte Einstellung des Parameters presort in ensemble.GradientBoostingRegressor verhinderte. Siehe #5857 Von Andrew McCulloh.

  • Einen joblib-Fehler behoben, der bei der Auswertung der Perplexität eines decomposition.LatentDirichletAllocation-Modells auftrat. Siehe #6258 Von Chyi-Kwei Yau.

Version 0.17#

5. November 2015

Änderungsprotokoll#

Neue Funktionen#

Verbesserungen#

Fehlerbehebungen#

Zusammenfassung der API-Änderungen#

  • Die Attribute data_min, data_max und data_range in preprocessing.MinMaxScaler sind veraltet und ab Version 0.19 nicht mehr verfügbar. Stattdessen stellt die Klasse nun data_min_, data_max_ und data_range_ zur Verfügung. Von Giorgio Patrini.

  • Alle Scaler-Klassen haben nun ein Attribut scale_, die feature-bezogene Skalierung, die von ihren transform-Methoden angewendet wird. Das alte Attribut std_ in preprocessing.StandardScaler ist veraltet und wird durch scale_ ersetzt; es wird ab Version 0.19 nicht mehr verfügbar sein. Von Giorgio Patrini.

  • svm.SVC und svm.NuSVC haben nun einen Parameter decision_function_shape, um ihre Entscheidungfunktion mit der Form (n_samples, n_classes) durch Setzen von decision_function_shape='ovr' zu erzeugen. Dies wird das Standardverhalten ab Version 0.19 sein. Von Andreas Müller.

  • Die Übergabe von 1D-Datenarrays als Eingabe an Schätzer ist nun veraltet, da dies zu Verwirrung darüber führte, wie die Array-Elemente als Merkmale oder Stichproben interpretiert werden sollten. Alle Datenarrays werden nun explizit mit der Form (n_samples, n_features) erwartet. Von Vighnesh Birodkar.

  • lda.LDA und qda.QDA wurden nach discriminant_analysis.LinearDiscriminantAnalysis und discriminant_analysis.QuadraticDiscriminantAnalysis verschoben worden.

  • Die Parameter store_covariance und tol wurden in der fit-Methode in den Konstruktor verschoben bei discriminant_analysis.LinearDiscriminantAnalysis und die Parameter store_covariances und tol wurden in der fit-Methode in den Konstruktor verschoben bei discriminant_analysis.QuadraticDiscriminantAnalysis.

  • Modelle, die von _LearntSelectorMixin erben, unterstützen die transform-Methoden nicht mehr. (d.h. RandomForests, GradientBoosting, LogisticRegression, DecisionTrees, SVMs und SGD-bezogene Modelle). Wickeln Sie diese Modelle um den Meta-Transformer feature_selection.SelectFromModel, um Merkmale (gemäß coefs_ oder feature_importances_) zu entfernen, die unter einem bestimmten Schwellenwert liegen.

  • cluster.KMeans führt Cluster-Zuweisungen bei Nichtkonvergenz erneut aus, um die Konsistenz von predict(X) und labels_ zu gewährleisten. Von Vighnesh Birodkar.

  • Klassifizierer- und Regressor-Modelle werden nun mit dem Attribut _estimator_type entsprechend markiert.

  • Cross-Validation-Iteratoren liefern immer Indizes für Trainings- und Testsets, keine Booleschen Masken.

  • Die Methode decision_function für alle Regressoren ist veraltet und wird in Version 0.19 entfernt. Verwenden Sie stattdessen predict.

  • datasets.load_lfw_pairs ist veraltet und wird in Version 0.19 entfernt. Verwenden Sie stattdessen datasets.fetch_lfw_pairs.

  • Das veraltete Modul hmm wurde entfernt.

  • Der veraltete Cross-Validation-Iterator Bootstrap wurde entfernt.

  • Die veralteten Klassen Ward und WardAgglomerative wurden entfernt. Verwenden Sie stattdessen cluster.AgglomerativeClustering.

  • cross_validation.check_cv ist nun eine öffentliche Funktion.

  • Die Eigenschaft residues_ von linear_model.LinearRegression ist veraltet und wird in Version 0.19 entfernt.

  • Der veraltete Parameter n_jobs von linear_model.LinearRegression wurde in den Konstruktor verschoben.

  • Der veraltete Parameter class_weight der fit-Methode von linear_model.SGDClassifier wurde entfernt. Verwenden Sie stattdessen den Konstruktor-Parameter.

  • Die veraltete Unterstützung für das multilabel-Format Sequenz von Sequenzen (oder Liste von Listen) wurde entfernt. Um zum unterstützten binären Indikatormatrixformat zu konvertieren und daraus, verwenden Sie MultiLabelBinarizer.

  • Das Verhalten beim Aufruf der Methode inverse_transform von Pipeline.pipeline wird sich in Version 0.19 ändern. Sie wird keine eindimensionale Eingabe mehr in eine zweidimensionale Eingabe umformen.

  • Die veralteten Attribute indicator_matrix_, multilabel_ und classes_ von preprocessing.LabelBinarizer wurden entfernt.

  • Die Verwendung von gamma=0 in svm.SVC und svm.SVR, um gamma automatisch auf 1. / n_features zu setzen, ist veraltet und wird in Version 0.19 entfernt. Verwenden Sie stattdessen gamma="auto".

Code-Mitarbeiter#

Aaron Schumacher, Adithya Ganesh, akitty, Alexandre Gramfort, Alexey Grigorev, Ali Baharev, Allen Riddell, Ando Saabas, Andreas Mueller, Andrew Lamb, Anish Shah, Ankur Ankan, Anthony Erlinger, Ari Rouvinen, Arnaud Joly, Arnaud Rachez, Arthur Mensch, banilo, Barmaley.exe, benjaminirving, Boyuan Deng, Brett Naul, Brian McFee, Buddha Prakash, Chi Zhang, Chih-Wei Chang, Christof Angermueller, Christoph Gohlke, Christophe Bourguignat, Christopher Erick Moody, Chyi-Kwei Yau, Cindy Sridharan, CJ Carey, Clyde-fare, Cory Lorenz, Dan Blanchard, Daniel Galvez, Daniel Kronovet, Danny Sullivan, Data1010, David, David D Lowe, David Dotson, djipey, Dmitry Spikhalskiy, Donne Martin, Dougal J. Sutherland, Dougal Sutherland, edson duarte, Eduardo Caro, Eric Larson, Eric Martin, Erich Schubert, Fernando Carrillo, Frank C. Eckert, Frank Zalkow, Gael Varoquaux, Ganiev Ibraim, Gilles Louppe, Giorgio Patrini, giorgiop, Graham Clenaghan, Gryllos Prokopis, gwulfs, Henry Lin, Hsuan-Tien Lin, Immanuel Bayer, Ishank Gulati, Jack Martin, Jacob Schreiber, Jaidev Deshpande, Jake Vanderplas, Jan Hendrik Metzen, Jean Kossaifi, Jeffrey04, Jeremy, jfraj, Jiali Mei, Joe Jevnik, Joel Nothman, John Kirkham, John Wittenauer, Joseph, Joshua Loyal, Jungkook Park, KamalakerDadi, Kashif Rasul, Keith Goodman, Kian Ho, Konstantin Shmelkov, Kyler Brown, Lars Buitinck, Lilian Besson, Loic Esteve, Louis Tiao, maheshakya, Maheshakya Wijewardena, Manoj Kumar, MarkTab marktab.net, Martin Ku, Martin Spacek, MartinBpr, martinosorb, MaryanMorel, Masafumi Oyamada, Mathieu Blondel, Matt Krump, Matti Lyra, Maxim Kolganov, mbillinger, mhg, Michael Heilman, Michael Patterson, Miroslav Batchkarov, Nelle Varoquaux, Nicolas, Nikolay Mayorov, Olivier Grisel, Omer Katz, Óscar Nájera, Pauli Virtanen, Peter Fischer, Peter Prettenhofer, Phil Roth, pianomania, Preston Parry, Raghav RV, Rob Zinkov, Robert Layton, Rohan Ramanath, Saket Choudhary, Sam Zhang, santi, saurabh.bansod, scls19fr, Sebastian Raschka, Sebastian Saeger, Shivan Sornarajah, SimonPL, sinhrks, Skipper Seabold, Sonny Hu, sseg, Stephen Hoover, Steven De Gryze, Steven Seguin, Theodore Vasiloudis, Thomas Unterthiner, Tiago Freitas Pereira, Tian Wang, Tim Head, Timothy Hopper, tokoroten, Tom Dupré la Tour, Trevor Stephens, Valentin Stolbunov, Vighnesh Birodkar, Vinayak Mehta, Vincent, Vincent Michel, vstolbunov, wangz10, Wei Xue, Yucheng Low, Yury Zhauniarovich, Zac Stewart, zhai_pro, Zichen Wang