OrthogonalMatchingPursuitCV#

class sklearn.linear_model.OrthogonalMatchingPursuitCV(*, copy=True, fit_intercept=True, max_iter=None, cv=None, n_jobs=None, verbose=False)[Quelle]#

Kreuzvalidiertes Orthogonal Matching Pursuit Modell (OMP).

Siehe Glossareintrag für Cross-validation-Schätzer.

Mehr dazu im Benutzerhandbuch.

Parameter:
copybool, Standard=True

Ob die Design-Matrix X vom Algorithmus kopiert werden muss. Ein falscher Wert ist nur hilfreich, wenn X bereits Fortran-geordnet ist, andernfalls wird sowieso eine Kopie erstellt.

fit_interceptbool, Standardwert=True

Ob für dieses Modell ein Achsenabschnitt berechnet werden soll. Wenn auf False gesetzt, wird kein Achsenabschnitt in Berechnungen verwendet (d.h. die Daten werden als zentriert erwartet).

max_iterint, Standard=None

Maximale Anzahl von Iterationen, die durchgeführt werden sollen, also maximale Anzahl von einzuschließenden Merkmalen. 10 % von n_features, aber mindestens 5, falls verfügbar.

cvint, Kreuzvalidierungsgenerator oder Iterable, Standardwert=None

Bestimmt die Strategie der Kreuzvalidierungsaufteilung. Mögliche Eingaben für cv sind

  • None, um die standardmäßige 5-fache Kreuzvalidierung zu verwenden,

  • Ganzzahl, um die Anzahl der Folds anzugeben.

  • CV-Splitter,

  • Eine iterierbare Liste, die (Trainings-, Test-) Splits als Indizes-Arrays liefert.

Für ganzzahlige/None-Eingaben wird KFold verwendet.

Siehe Benutzerhandbuch für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können.

Geändert in Version 0.22: Der Standardwert von cv, wenn None, hat sich von 3-Fold auf 5-Fold geändert.

n_jobsint, default=None

Anzahl der CPUs, die während der Kreuzvalidierung verwendet werden sollen. None bedeutet 1, außer in einem joblib.parallel_backend-Kontext. -1 bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.

verbosebool oder int, default=False

Legt den Ausführlichkeitsgrad fest.

Attribute:
intercept_float oder ndarray der Form (n_targets,)

Unabhängiger Term in der Entscheidungsfunktion.

coef_ndarray der Form (n_features,) oder (n_targets, n_features)

Parametervektor (w in der Problemformulierung).

n_nonzero_coefs_int

Geschätzte Anzahl von Nicht-Null-Koeffizienten, die den besten mittleren quadratischen Fehler über die Kreuzvalidierungs-Falten ergeben.

n_iter_int or array-like

Anzahl der aktiven Merkmale für jedes Ziel, für das das Modell mit den besten Hyperparametern neu angepasst wird, die durch Kreuzvalidierung über alle Faltungen ermittelt wurden.

n_features_in_int

Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.

feature_names_in_ndarray mit Form (n_features_in_,)

Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

orthogonal_mp

Löst n_targets Orthogonal Matching Pursuit-Probleme.

orthogonal_mp_gram

Löst n_targets Orthogonal Matching Pursuit-Probleme unter ausschließlicher Verwendung der Gram-Matrix X.T * X und des Produkts X.T * y.

lars_path

Berechnet den Least Angle Regression- oder Lasso-Pfad unter Verwendung des LARS-Algorithmus.

Lars

Least Angle Regression Modell, auch bekannt als LAR.

LassoLars

Lasso-Modell, angepasst mit Least Angle Regression, auch bekannt als Lars.

OrthogonalMatchingPursuit

Orthogonal Matching Pursuit Modell (OMP).

LarsCV

Kreuzvalidiertes Least Angle Regression Modell.

LassoLarsCV

Kreuzvalidiertes Lasso-Modell, angepasst mit Least Angle Regression.

sklearn.decomposition.sparse_encode

Generische Sparse-Codierung. Jede Spalte des Ergebnisses ist die Lösung eines Lasso-Problems.

Anmerkungen

In fit wird das Modell, nachdem die optimale Anzahl von Nicht-Null-Koeffizienten durch Kreuzvalidierung ermittelt wurde, erneut mit dem gesamten Trainingsdatensatz angepasst.

Beispiele

>>> from sklearn.linear_model import OrthogonalMatchingPursuitCV
>>> from sklearn.datasets import make_regression
>>> X, y = make_regression(n_features=100, n_informative=10,
...                        noise=4, random_state=0)
>>> reg = OrthogonalMatchingPursuitCV(cv=5).fit(X, y)
>>> reg.score(X, y)
0.9991
>>> reg.n_nonzero_coefs_
np.int64(10)
>>> reg.predict(X[:1,])
array([-78.3854])
fit(X, y, **fit_params)[Quelle]#

Trainiert das Modell mit X, y als Trainingsdaten.

Parameter:
Xarray-like der Form (n_samples, n_features)

Trainingsdaten.

yarray-like von Form (n_samples,)

Zielwerte. Wird bei Bedarf in den Datentyp von X umgewandelt.

**fit_paramsdict

Parameter, die an den zugrundeliegenden Splitter übergeben werden.

Hinzugefügt in Version 1.4: Nur verfügbar, wenn enable_metadata_routing=True, was durch Verwendung von sklearn.set_config(enable_metadata_routing=True) eingestellt werden kann. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Gibt zurück:
selfobject

Gibt eine Instanz von self zurück.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Hinzugefügt in Version 1.4.

Gibt zurück:
routingMetadataRouter

Ein MetadataRouter, der die Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:
deepbool, default=True

Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:
paramsdict

Parameternamen, zugeordnet ihren Werten.

predict(X)[Quelle]#

Vorhersage mit dem linearen Modell.

Parameter:
Xarray-like oder sparse matrix, Form (n_samples, n_features)

Stichproben.

Gibt zurück:
Carray, Form (n_samples,)

Gibt vorhergesagte Werte zurück.

score(X, y, sample_weight=None)[Quelle]#

Gibt den Bestimmtheitskoeffizienten auf Testdaten zurück.

Der Bestimmtheitskoeffizient, \(R^2\), ist definiert als \((1 - \frac{u}{v})\), wobei \(u\) die Summe der quadrierten Residuen ((y_true - y_pred)** 2).sum() und \(v\) die totale Summe der Quadrate ((y_true - y_true.mean()) ** 2).sum() ist. Der beste mögliche Wert ist 1,0 und er kann negativ sein (da das Modell beliebig schlechter sein kann). Ein konstantes Modell, das immer den Erwartungswert von y vorhersagt, unabhängig von den Eingabemerkmalen, würde einen \(R^2\)-Wert von 0,0 erzielen.

Parameter:
Xarray-like der Form (n_samples, n_features)

Teststichproben. Für einige Schätzer kann dies eine vorab berechnete Kernelmatrix oder eine Liste von generischen Objekten sein, stattdessen mit der Form (n_samples, n_samples_fitted), wobei n_samples_fitted die Anzahl der für die Anpassung des Schätzers verwendeten Stichproben ist.

yarray-like der Form (n_samples,) oder (n_samples, n_outputs)

Wahre Werte für X.

sample_weightarray-like der Form (n_samples,), Standardwert=None

Stichprobengewichte.

Gibt zurück:
scorefloat

\(R^2\) von self.predict(X) bezogen auf y.

Anmerkungen

Der \(R^2\)-Wert, der beim Aufruf von score auf einem Regressor verwendet wird, nutzt multioutput='uniform_average' ab Version 0.23, um mit dem Standardwert von r2_score konsistent zu sein. Dies beeinflusst die score-Methode aller Multioutput-Regressoren (außer MultiOutputRegressor).

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:
**paramsdict

Schätzer-Parameter.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') OrthogonalMatchingPursuitCV[Quelle]#

Konfiguriert, ob Metadaten für die score-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

  • True: Metadaten werden angefordert und, falls vorhanden, an score übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.

  • False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an score.

  • None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.

  • str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:
sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED

Metadaten-Routing für den Parameter sample_weight in score.

Gibt zurück:
selfobject

Das aktualisierte Objekt.