13. Auswahl des richtigen Schätzers#

Oft ist der schwierigste Teil bei der Lösung eines Machine-Learning-Problems die Wahl des richtigen Schätzers für die Aufgabe. Unterschiedliche Schätzer eignen sich besser für unterschiedliche Datentypen und Probleme.

Das folgende Flussdiagramm soll Benutzern eine grobe Orientierung geben, wie sie Probleme angehen können, in Bezug darauf, welche Schätzer für ihre Daten auszuprobieren sind. Klicken Sie auf einen beliebigen Schätzer in der folgenden Tabelle, um dessen Dokumentation anzuzeigen. Die orangefarbenen Pfeile für **Nächsten Versuch** sind als „wenn dieser Schätzer nicht das gewünschte Ergebnis erzielt, folgen Sie dem Pfeil und versuchen Sie den nächsten“ zu lesen. Verwenden Sie das Mausrad zum Zoomen und Ziehen und Klicken und ziehen Sie, um zu schwenken. Sie können die Tabelle auch herunterladen: ml_map.svg.

START
START
>50
samples
>50...
get
more
data
get...
NO
NO
predicting a
category
predicting...
YES
YES
do you have
labeled
data
do you hav...
YES
YES
predicting a
quantity
predicting...
NO
NO
just
looking
just...
NO
NO
predicting
structure
predicting...
NO
NO
tough
luck
tough...
<100K
samples
<100K...
YES
YES
SGD
Classifier
SGD...
NO
NO
Linear
SVC
Linear...
YES
YES
text
data
text...
Kernel
Approximation
Kernel...
KNeighbors
Classifier
KNeighbors...
NO
NO
SVC
SVC
Ensemble
Classifiers
Ensemble...
Naive
Bayes
Naive...
YES
YES
classification
classification
number of
categories
known
number of...
NO
NO
<10K
samples
<10K...
<10K
samples
<10K...
NO
NO
NO
NO
YES
YES
MeanShift
MeanShift
VBGMM
VBGMM
YES
YES
MiniBatch
KMeans
MiniBatch...
NO
NO
clustering
clustering
KMeans
KMeans
YES
YES
Spectral
Clustering
Spectral...
GMM
GMM
<100K
samples
<100K...
YES
YES
few features
should be
important
few features...
YES
YES
SGD
Regressor
SGD...
NO
NO
Lasso
Lasso
ElasticNet
ElasticNet
YES
YES
RidgeRegression
RidgeRegression
SVR(kernel="linear")
SVR(kernel="linea...
NO
NO
SVR(kernel="rbf")
SVR(kernel="rbf...
Ensemble
Regressors
Ensemble...
regression
regression
Randomized
PCA
Randomized...
YES
YES
<10K
samples
<10K...
Kernel
Approximation
Kernel...
NO
NO
IsoMap
IsoMap
Spectral
Embedding
Spectral...
YES
YES
LLE
LLE
dimensionality
reduction
dimensionality...
scikit-learn
algorithm cheat sheet
scikit-learn...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
TRY
NEXT
TRY...
Text is not SVG - cannot display