ElasticNetCV#

class sklearn.linear_model.ElasticNetCV(*, l1_ratio=0.5, eps=0.001, n_alphas='deprecated', alphas='warn', fit_intercept=True, precompute='auto', max_iter=1000, tol=0.0001, cv=None, copy_X=True, verbose=0, n_jobs=None, positive=False, random_state=None, selection='cyclic')[Quelle]#

Elastic Net Modell mit iterativem Anpassen entlang eines Regularisierungspfades.

Siehe Glossareintrag für Cross-validation-Schätzer.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

l1_ratiofloat oder Liste von float, default=0.5

Float zwischen 0 und 1, der an ElasticNet übergeben wird (Skalierung zwischen l1- und l2-Strafen). Für l1_ratio = 0 ist die Strafe eine L2-Strafe. Für l1_ratio = 1 ist es eine L1-Strafe. Für 0 < l1_ratio < 1 ist die Strafe eine Kombination aus L1 und L2. Dieser Parameter kann eine Liste sein, in diesem Fall werden die verschiedenen Werte mittels Kreuzvalidierung getestet und derjenige, der den besten Vorhersage-Score liefert, wird verwendet. Beachten Sie, dass eine gute Wahl für eine Liste von Werten für l1_ratio oft darin besteht, mehr Werte nahe 1 (d.h. Lasso) und weniger nahe 0 (d.h. Ridge) zu setzen, wie z.B. [.1, .5, .7, .9, .95, .99, 1].

epsfloat, Standardwert=1e-3

Länge des Pfades. eps=1e-3 bedeutet, dass alpha_min / alpha_max = 1e-3.

n_alphasint, Standardwert=100

Anzahl der Alphas entlang des Regularisierungspfades, die für jedes l1_ratio verwendet werden.

Veraltet seit Version 1.7: n_alphas wurde in Version 1.7 als veraltet markiert und wird in Version 1.9 entfernt. Verwenden Sie stattdessen alphas.

alphasarray-ähnlich oder int, Standardwert=None

Werte von Alphas zum Testen entlang des Regularisierungspfades, die für jedes l1_ratio verwendet werden. Wenn int, werden alphas Werte automatisch generiert. Wenn Array-ähnlich, Liste von Alpha-Werten, die verwendet werden sollen.

Geändert in Version 1.7: alphas akzeptiert einen ganzzahligen Wert, was die Notwendigkeit entfällt, n_alphas zu übergeben.

Veraltet seit Version 1.7: alphas=None wurde in Version 1.7 als veraltet markiert und wird in Version 1.9 entfernt. Zu diesem Zeitpunkt wird der Standardwert auf 100 gesetzt.

fit_interceptbool, Standardwert=True

Ob für dieses Modell ein Achsenabschnitt berechnet werden soll. Wenn auf False gesetzt, wird kein Achsenabschnitt in Berechnungen verwendet (d.h. die Daten werden als zentriert erwartet).

precompute‘auto‘, bool oder array-ähnlich der Form (n_features, n_features), Standardwert=’auto’

Ob eine vorberechnete Gram-Matrix verwendet werden soll, um Berechnungen zu beschleunigen. Wenn auf 'auto' gesetzt, entscheiden wir. Die Gram-Matrix kann auch als Argument übergeben werden.

max_iterint, default=1000

Die maximale Anzahl von Iterationen.

tolfloat, Standard=1e-4

Die Toleranz für die Optimierung: Wenn die Aktualisierungen kleiner oder gleich tol sind, prüft der Optimierungscode den dualen Abstand auf Optimalität und fährt fort, bis er kleiner oder gleich tol ist.

cvint, Kreuzvalidierungsgenerator oder Iterable, Standardwert=None

Bestimmt die Strategie der Kreuzvalidierungsaufteilung. Mögliche Eingaben für cv sind

None, um die standardmäßige 5-fache Kreuzvalidierung zu verwenden,
int, um die Anzahl der Folds anzugeben.
CV-Splitter,
Eine iterierbare Liste, die (Trainings-, Test-) Splits als Indizes-Arrays liefert.

Für int/None-Eingaben wird KFold verwendet.

Siehe Benutzerhandbuch für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können.

Geändert in Version 0.22: Der Standardwert von cv, wenn None, hat sich von 3-Fold auf 5-Fold geändert.

copy_Xbool, Standardwert=True

Wenn True, wird X kopiert; andernfalls kann es überschrieben werden.

verbosebool oder int, default=0

Ausmaß der Ausführlichkeit.

n_jobsint, default=None

Anzahl der CPUs, die während der Kreuzvalidierung verwendet werden sollen. None bedeutet 1, außer in einem joblib.parallel_backend-Kontext. -1 bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.

positivebool, Standardwert=False

Wenn auf True gesetzt, werden die Koeffizienten erzwungen, positiv zu sein.

random_stateint, RandomState instance, default=None

Der Seed des Pseudo-Zufallszahlengenerators, der ein zufälliges Merkmal zur Aktualisierung auswählt. Wird verwendet, wenn selection == ‘random‘ ist. Übergeben Sie eine Ganzzahl für reproduzierbare Ausgaben über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

selection{‘cyclic’, ‘random’}, Standardwert=’cyclic’

Wenn auf ‘random‘ gesetzt, wird ein zufälliger Koeffizient in jeder Iteration aktualisiert, anstatt standardmäßig sequenziell durch die Merkmale zu iterieren. Dies (Setzen auf ‘random‘) führt oft zu einer signifikant schnelleren Konvergenz, insbesondere wenn tol höher als 1e-4 ist.

Attribute:

alpha_float: Die durch Kreuzvalidierung gewählte Strafe.
l1_ratio_float: Der Kompromiss zwischen l1- und l2-Penalisierung, der durch Kreuzvalidierung gewählt wurde.
coef_ndarray der Form (n_features,) oder (n_targets, n_features): Parametervektor (w in der Kostenfunktionsformel).
intercept_float oder ndarray der Form (n_targets, n_features): Unabhängiger Term in der Entscheidungsfunktion.
mse_path_ndarray der Form (n_l1_ratio, n_alpha, n_folds): Mittlerer quadratischer Fehler für die Testmenge auf jeder Faltung, variierend l1_ratio und alpha.
alphas_ndarray der Form (n_alphas,) oder (n_l1_ratio, n_alphas): Das Gitter von Alphas, das für das Anpassen für jedes l1_ratio verwendet wird.
dual_gap_float: Die dualen Lücken am Ende der Optimierung für das optimale Alpha.
n_iter_int: Anzahl der Iterationen, die vom Koordinatenabstiegslöser durchgeführt wurden, um die angegebene Toleranz für das optimale Alpha zu erreichen.
n_features_in_int: Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.
feature_names_in_ndarray mit Form (n_features_in_,): Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

enet_path: Berechnet den Elastic Net-Pfad mit Koordinatenabstieg.
ElasticNet: Lineares Modell mit kombinierter L1- und L2-Prior als Regularisator.

Anmerkungen

In fit, sobald die besten Parameter l1_ratio und alpha durch Kreuzvalidierung gefunden wurden, wird das Modell erneut mit dem gesamten Trainingsdatensatz angepasst.

Um unnötige Speicherduplizierung zu vermeiden, sollte das X Argument der fit Methode direkt als Fortran-kontinuierlicher Numpy-Array übergeben werden.

Der Parameter l1_ratio entspricht alpha im glmnet R-Paket, während alpha dem Lambda-Parameter in glmnet entspricht. Genauer gesagt ist die Optimierungszielsetzung:

1 / (2 * n_samples) * ||y - Xw||^2_2
+ alpha * l1_ratio * ||w||_1
+ 0.5 * alpha * (1 - l1_ratio) * ||w||^2_2

Wenn Sie daran interessiert sind, die L1- und L2-Strafe separat zu kontrollieren, beachten Sie, dass dies äquivalent ist zu:

a * L1 + b * L2

für

alpha = a + b and l1_ratio = a / (a + b).

Ein Beispiel finden Sie unter Beispiele/linear_model/plot_lasso_model_selection.py.

Der zugrunde liegende Koordinatenabstiegslöser verwendet "gap-safe screening rules", um die Anpassungszeit zu beschleunigen, siehe Benutzerhandbuch zum Koordinatenabstieg.

Beispiele

>>> from sklearn.linear_model import ElasticNetCV
>>> from sklearn.datasets import make_regression

>>> X, y = make_regression(n_features=2, random_state=0)
>>> regr = ElasticNetCV(cv=5, random_state=0)
>>> regr.fit(X, y)
ElasticNetCV(cv=5, random_state=0)
>>> print(regr.alpha_)
0.199
>>> print(regr.intercept_)
0.398
>>> print(regr.predict([[0, 0]]))
[0.398]

fit(X, y, sample_weight=None, **params)[Quelle]#

ElasticNet-Modell mit Koordinatendessent anpassen.

Die Anpassung erfolgt auf einem Gitter von Alphas und dem besten durch Kreuzvalidierung geschätzten Alpha.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Trainingsdaten. Direkt als Fortran-kontinuierliche Daten übergeben, um unnötige Speicherduplizierung zu vermeiden. Wenn y mono-output ist, kann X dünn sein. Beachten Sie, dass große dünne Matrizen und Arrays, die int64 Indizes benötigen, nicht akzeptiert werden.
yarray-like von Form (n_samples,): Zielwerte.
sample_weightfloat oder array-ähnlich der Form (n_samples,), Standard=None: Stichprobengewichte, die für das Anpassen und die Auswertung des gewichteten mittleren quadratischen Fehlers jeder CV-Faltung verwendet werden. Beachten Sie, dass der kreuzvalidierte MSE, der letztendlich zur Ermittlung des besten Modells verwendet wird, der ungewichtete Mittelwert der (gewichteten) MSEs jeder Testfaltung ist.
**paramsdict, default=None: Parameter, die an den CV-Splitter übergeben werden sollen.

Hinzugefügt in Version 1.4: Nur verfügbar, wenn enable_metadata_routing=True, was durch Verwendung von sklearn.set_config(enable_metadata_routing=True) eingestellt werden kann. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Gibt zurück:

selfobject: Gibt eine Instanz des trainierten Modells zurück.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Hinzugefügt in Version 1.4.

Gibt zurück:

routingMetadataRouter: Ein MetadataRouter, der die Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:

deepbool, default=True: Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:

paramsdict: Parameternamen, zugeordnet ihren Werten.

static path(X, y, *, l1_ratio=0.5, eps=0.001, n_alphas=100, alphas=None, precompute='auto', Xy=None, copy_X=True, coef_init=None, verbose=False, return_n_iter=False, positive=False, check_input=True, **params)[Quelle]#

Berechnet den Elastic Net-Pfad mit Koordinatenabstieg.

Die Elastic-Net-Optimierungsfunktion variiert für Mono- und Multi-Ausgaben.

Für Mono-Ausgaben-Aufgaben ist es

1 / (2 * n_samples) * ||y - Xw||^2_2
+ alpha * l1_ratio * ||w||_1
+ 0.5 * alpha * (1 - l1_ratio) * ||w||^2_2

Für Multi-Ausgaben-Aufgaben ist es

(1 / (2 * n_samples)) * ||Y - XW||_Fro^2
+ alpha * l1_ratio * ||W||_21
+ 0.5 * alpha * (1 - l1_ratio) * ||W||_Fro^2

Wo

||W||_21 = \sum_i \sqrt{\sum_j w_{ij}^2}

d.h. die Summe der Norm jeder Zeile.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:

X{array-like, sparse matrix} der Form (n_samples, n_features): Trainingsdaten. Direkt als Fortran-kontinuierliche Daten übergeben, um unnötige Speicherduplizierung zu vermeiden. Wenn y eine Mono-Ausgabe ist, kann X spärlich sein.
y{array-ähnlich, spärsitätsmatrix} der Form (n_samples,) oder (n_samples, n_targets): Zielwerte.
l1_ratiofloat, Standardwert=0.5: Zahl zwischen 0 und 1, die an Elastic Net übergeben wird (Skalierung zwischen l1- und l2-Strafen). l1_ratio=1 entspricht dem Lasso.
epsfloat, Standardwert=1e-3: Länge des Pfades. eps=1e-3 bedeutet, dass alpha_min / alpha_max = 1e-3.
n_alphasint, Standardwert=100: Anzahl der Alphas entlang des Regularisierungspfades.
alphasarray-ähnlich, Standardwert=None: Liste von Alphas, für die die Modelle berechnet werden. Wenn None, werden Alphas automatisch gesetzt.
precompute‘auto‘, bool oder array-ähnlich der Form (n_features, n_features), Standardwert=’auto’: Ob eine vorberechnete Gram-Matrix verwendet werden soll, um Berechnungen zu beschleunigen. Wenn auf 'auto' gesetzt, entscheiden wir. Die Gram-Matrix kann auch als Argument übergeben werden.
Xyarray-ähnlich der Form (n_features,) oder (n_features, n_targets), Standardwert=None: Xy = np.dot(X.T, y), was vorab berechnet werden kann. Dies ist nur nützlich, wenn die Gram-Matrix vorab berechnet wurde.
copy_Xbool, Standardwert=True: Wenn True, wird X kopiert; andernfalls kann es überschrieben werden.
coef_initarray-ähnlich der Form (n_features,), Standardwert=None: Die Anfangswerte der Koeffizienten.
verbosebool oder int, default=False: Ausmaß der Ausführlichkeit.
return_n_iterbool, Standard=False: Ob die Anzahl der Iterationen zurückgegeben werden soll oder nicht.
positivebool, Standardwert=False: Wenn True gesetzt, werden die Koeffizienten auf positiv erzwungen. (Nur erlaubt, wenn y.ndim == 1).
check_inputbool, Standardwert=True: Wenn False gesetzt, werden die Eingabevalidierungsprüfungen übersprungen (einschließlich der Gram-Matrix, wenn sie bereitgestellt wird). Es wird davon ausgegangen, dass diese vom Aufrufer behandelt werden.
**paramskwargs: Schlüsselwortargumente, die an den Koordinatenabstiegslöser übergeben werden.

Gibt zurück:

alphasndarray der Form (n_alphas,): Die Alphas entlang des Pfades, auf dem Modelle berechnet werden.
coefsndarray der Form (n_features, n_alphas) oder (n_targets, n_features, n_alphas): Koeffizienten entlang des Pfades.
dual_gapsndarray der Form (n_alphas,): Die dualen Abstände am Ende der Optimierung für jedes Alpha.
n_iterslist von int: Die Anzahl der Iterationen, die der Koordinatenabstieg-Optimierer benötigt, um die angegebene Toleranz für jedes Alpha zu erreichen. (Wird zurückgegeben, wenn return_n_iter auf True gesetzt ist).

Siehe auch

MultiTaskElasticNet: Multi-Task ElasticNet Modell, trainiert mit L1/L2 Mixed-Norm als Regularisator.
MultiTaskElasticNetCV: Multi-Task L1/L2 ElasticNet mit integrierter Kreuzvalidierung.
ElasticNet: Lineares Modell mit kombinierter L1- und L2-Prior als Regularisator.
ElasticNetCV: Elastic Net Modell mit iterativem Anpassen entlang eines Regularisierungspfades.

Anmerkungen

Ein Beispiel finden Sie unter Beispiele/linear_model/plot_lasso_lasso_lars_elasticnet_path.py.

Der zugrunde liegende Koordinatenabstiegslöser verwendet "gap-safe screening rules", um die Anpassungszeit zu beschleunigen, siehe Benutzerhandbuch zum Koordinatenabstieg.

Beispiele

>>> from sklearn.linear_model import enet_path
>>> from sklearn.datasets import make_regression
>>> X, y, true_coef = make_regression(
...    n_samples=100, n_features=5, n_informative=2, coef=True, random_state=0
... )
>>> true_coef
array([ 0.        ,  0.        ,  0.        , 97.9, 45.7])
>>> alphas, estimated_coef, _ = enet_path(X, y, n_alphas=3)
>>> alphas.shape
(3,)
>>> estimated_coef
 array([[ 0.,  0.787,  0.568],
        [ 0.,  1.120,  0.620],
        [-0., -2.129, -1.128],
        [ 0., 23.046, 88.939],
        [ 0., 10.637, 41.566]])

predict(X)[Quelle]#

Vorhersage mit dem linearen Modell.

Parameter:

Xarray-like oder sparse matrix, Form (n_samples, n_features): Stichproben.

Gibt zurück:

Carray, Form (n_samples,): Gibt vorhergesagte Werte zurück.

score(X, y, sample_weight=None)[Quelle]#

Gibt den Bestimmtheitskoeffizienten auf Testdaten zurück.

Der Bestimmungskoeffizient, $R^2$, ist definiert als $(1 - \frac{u}{v})$, wobei $u$ die Summe der quadrierten Residuen ((y_true - y_pred)** 2).sum() und $v$ die Summe der quadrierten Abweichungen vom Mittelwert ((y_true - y_true.mean()) ** 2).sum() ist. Der bestmögliche Score ist 1.0 und kann negativ sein (da das Modell beliebig schlechter sein kann). Ein konstantes Modell, das immer den Erwartungswert von y vorhersagt, unabhängig von den Eingabemerkmalen, würde einen $R^2$-Score von 0.0 erzielen.

Parameter:

Xarray-like der Form (n_samples, n_features): Teststichproben. Für einige Schätzer kann dies eine vorab berechnete Kernelmatrix oder eine Liste von generischen Objekten sein, stattdessen mit der Form (n_samples, n_samples_fitted), wobei n_samples_fitted die Anzahl der für die Anpassung des Schätzers verwendeten Stichproben ist.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs): Wahre Werte für X.
sample_weightarray-like der Form (n_samples,), Standardwert=None: Stichprobengewichte.

Gibt zurück:

scorefloat: $R^2$ von self.predict(X) bezogen auf y.

Anmerkungen

Der $R^2$-Score, der beim Aufruf von score für einen Regressor verwendet wird, verwendet ab Version 0.23 multioutput='uniform_average', um konsistent mit dem Standardwert von r2_score zu sein. Dies beeinflusst die score-Methode aller Multioutput-Regressoren (außer bei MultiOutputRegressor).

set_fit_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → ElasticNetCV[Quelle]#

Konfiguriert, ob Metadaten für die fit-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

True: Metadaten werden angefordert und, falls vorhanden, an fit übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.
False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an fit.
None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.
str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:

sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED: Metadaten-Routing für den Parameter sample_weight in fit.

Gibt zurück:

selfobject: Das aktualisierte Objekt.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:

**paramsdict: Schätzer-Parameter.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → ElasticNetCV[Quelle]#

Konfiguriert, ob Metadaten für die score-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

True: Metadaten werden angefordert und, falls vorhanden, an score übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.
False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an score.
None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.
str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:

sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED: Metadaten-Routing für den Parameter sample_weight in score.

Gibt zurück:

selfobject: Das aktualisierte Objekt.

Galeriebeispiele#

L1-basierte Modelle für sparse Signale

Release Highlights für scikit-learn 1.8

ElasticNetCV#

Galeriebeispiele#

Diese Seite