Hinweis

Gehen Sie zum Ende, um den vollständigen Beispielcode herunterzuladen oder dieses Beispiel über JupyterLite oder Binder in Ihrem Browser auszuführen.

Elastic Net Anpassung mit vorkomputierter Gram-Matrix und gewichteten Samples#

Das folgende Beispiel zeigt, wie die Gram-Matrix mit gewichteten Samples mit einem ElasticNet vorkomputiert werden kann.

Wenn gewichtete Samples verwendet werden, muss die Designmatrix zentriert und dann durch die Quadratwurzel des Gewichtungsvektors skaliert werden, bevor die Gram-Matrix berechnet wird.

Hinweis

Der Vektor sample_weight wird ebenfalls skaliert, um die Summe n_samples zu ergeben. Siehe die: Dokumentation für den Parameter sample_weight für fit.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Beginnen wir mit dem Laden des Datensatzes und dem Erstellen einiger Beispielgewichte.

import numpy as np

from sklearn.datasets import make_regression

rng = np.random.RandomState(0)

n_samples = int(1e5)
X, y = make_regression(n_samples=n_samples, noise=0.5, random_state=rng)

sample_weight = rng.lognormal(size=n_samples)
# normalize the sample weights
normalized_weights = sample_weight * (n_samples / (sample_weight.sum()))

Um das Elastic Net mit der Option precompute zusammen mit den Sample-Gewichten anzupassen, müssen wir zuerst die Designmatrix zentrieren und sie vor der Berechnung der Gram-Matrix mit den normalisierten Gewichten skalieren.

X_offset = np.average(X, axis=0, weights=normalized_weights)
X_centered = X - np.average(X, axis=0, weights=normalized_weights)
X_scaled = X_centered * np.sqrt(normalized_weights)[:, np.newaxis]
gram = np.dot(X_scaled.T, X_scaled)

Wir können nun mit der Anpassung fortfahren. Wir müssen die zentrierte Designmatrix an fit übergeben, da der Elastic Net-Schätzer sonst erkennt, dass sie unzentriert ist, und die von uns übergebene Gram-Matrix verwirft. Wenn wir jedoch die skalierte Designmatrix übergeben, wird der Vorverarbeitungscode sie fälschlicherweise ein zweites Mal skalieren.

from sklearn.linear_model import ElasticNet

lm = ElasticNet(alpha=0.01, precompute=gram)
lm.fit(X_centered, y, sample_weight=normalized_weights)

ElasticNet(alpha=0.01,
           precompute=array([[ 9.98809919e+04, -4.48938813e+02, -1.03237920e+03, ...,
        -2.25349312e+02, -3.53959628e+02, -1.67451144e+02],
       [-4.48938813e+02,  1.00768662e+05,  1.19112072e+02, ...,
        -1.07963978e+03,  7.47987268e+01, -5.76195467e+02],
       [-1.03237920e+03,  1.19112072e+02,  1.00393284e+05, ...,
        -3.07582983e+02,  6.66670169e+02,  2.65799352e+02],
       ...,
       [-2.25349312e+02, -1.07963978e+03, -3.07582983e+02, ...,
         9.99891212e+04, -4.58195950e+02, -1.58667835e+02],
       [-3.53959628e+02,  7.47987268e+01,  6.66670169e+02, ...,
        -4.58195950e+02,  9.98350372e+04,  5.60836363e+02],
       [-1.67451144e+02, -5.76195467e+02,  2.65799352e+02, ...,
        -1.58667835e+02,  5.60836363e+02,  1.00911944e+05]],
      shape=(100, 100)))

In einer Jupyter-Umgebung führen Sie diese Zelle bitte erneut aus, um die HTML-Darstellung anzuzeigen, oder vertrauen Sie dem Notebook.
Auf GitHub kann die HTML-Darstellung nicht gerendert werden. Versuchen Sie bitte, diese Seite mit nbviewer.org zu laden.

Gesamtlaufzeit des Skripts: (0 Minuten 2,551 Sekunden)

Verwandte Beispiele

SVM: Gewichtete Stichproben

SGD: Gewichtete Stichproben

Metadaten-Routing

Nearest Neighbors Regression

Galerie generiert von Sphinx-Gallery

	alpha alpha: float, default=1.0 Konstante, die die Strafterme multipliziert. Standardmäßig 1.0. Siehe die Hinweise für die genaue mathematische Bedeutung dieses Parameters. ``alpha = 0`` entspricht einer gewöhnlichen kleinsten Quadratmethode, gelöst durch das :class:`LinearRegression` Objekt. Aus numerischen Gründen wird die Verwendung von ``alpha = 0`` mit dem ``Lasso`` Objekt nicht empfohlen. Daher sollten Sie das :class:`LinearRegression` Objekt verwenden.	0.01
	l1_ratio l1_ratio: float, default=0.5 Der ElasticNet-Mischungsparameter, mit ``0 <= l1_ratio <= 1``. Für ``l1_ratio = 0`` ist die Strafe eine L2-Strafe. ``Für l1_ratio = 1`` ist es eine L1-Strafe. Für ``0 < l1_ratio < 1`` ist die Strafe eine Kombination aus L1 und L2.	0.5
	fit_intercept fit_intercept: bool, default=True Ob der Achsenabschnitt geschätzt werden soll oder nicht. Wenn ``False``, wird angenommen, dass die Daten bereits zentriert sind.	True
	precompute precompute: bool or array-like of shape (n_features, n_features), default=False Ob eine vorkomputierte Gram-Matrix zur Beschleunigung der Berechnungen verwendet werden soll. Die Gram-Matrix kann auch als Argument übergeben werden. Für sparse Eingaben ist diese Option immer ``False``, um die Sparsity zu erhalten. Siehe :ref:`ein Beispiel zur Verwendung einer vorkomputierten Gram-Matrix in ElasticNet ` für Details.	array([[ 9.98...pe=(100, 100))
	max_iter max_iter: int, default=1000 Die maximale Anzahl von Iterationen.	1000
	copy_X copy_X: bool, default=True Wenn ``True``, wird X kopiert; andernfalls kann es überschrieben werden.	True
	tol tol: float, default=1e-4 Die Toleranz für die Optimierung: Wenn die Updates kleiner oder gleich ``tol`` sind, prüft der Optimierungscode die duale Lücke auf Optimalität und fährt fort bis sie kleiner oder gleich ``tol`` ist. Siehe Hinweise unten.	0.0001
	warm_start warm_start: bool, default=False Wenn auf ``True`` gesetzt, wird die Lösung des vorherigen Aufrufs von fit als Initialisierung wiederverwendet, andernfalls wird die vorherige Lösung einfach gelöscht. Siehe :term:`das Glossar `.	False
	positive positive: bool, default=False Wenn auf ``True`` gesetzt, werden die Koeffizienten gezwungen, positiv zu sein.	False
	random_state random_state: int, RandomState instance, default=None Der Seed des Pseudo-Zufallszahlengenerators, der ein zufälliges Merkmal zur Aktualisierung auswählt. Wird verwendet, wenn ``selection`` == 'random'. Geben Sie eine Ganzzahl für reproduzierbare Ausgaben über mehrere Funktionsaufrufe an. Siehe :term:`Glossar `.	None
	selection selection: {'cyclic', 'random'}, default='cyclic' Wenn auf 'random' gesetzt, wird bei jeder Iteration ein zufälliger Koeffizient aktualisiert, anstatt standardmäßig sequenziell durch die Merkmale zu iterieren. Dies (das Setzen auf 'random') führt oft zu einer signifikant schnelleren Konvergenz, insbesondere wenn tol höher als 1e-4 ist.	'cyclic'

Elastic Net Anpassung mit vorkomputierter Gram-Matrix und gewichteten Samples#

Diese Seite