OrthogonalMatchingPursuitCV#

class sklearn.linear_model.OrthogonalMatchingPursuitCV(*, copy=True, fit_intercept=True, max_iter=None, cv=None, n_jobs=None, verbose=False)[Quelle]#

Kreuzvalidiertes Orthogonal Matching Pursuit Modell (OMP).

Siehe Glossareintrag für Cross-validation-Schätzer.

Mehr dazu im Benutzerhandbuch.

Parameter:

copybool, Standard=True

Ob die Design-Matrix X vom Algorithmus kopiert werden muss. Ein falscher Wert ist nur hilfreich, wenn X bereits Fortran-geordnet ist, andernfalls wird sowieso eine Kopie erstellt.

fit_interceptbool, Standardwert=True

Ob für dieses Modell ein Achsenabschnitt berechnet werden soll. Wenn auf False gesetzt, wird kein Achsenabschnitt in Berechnungen verwendet (d.h. die Daten werden als zentriert erwartet).

max_iterint, Standard=None

Maximale Anzahl von Iterationen, die durchgeführt werden sollen, also maximale Anzahl von einzuschließenden Merkmalen. 10 % von n_features, aber mindestens 5, falls verfügbar.

cvint, Kreuzvalidierungsgenerator oder Iterable, Standardwert=None

Bestimmt die Strategie der Kreuzvalidierungsaufteilung. Mögliche Eingaben für cv sind

None, um die standardmäßige 5-fache Kreuzvalidierung zu verwenden,
Ganzzahl, um die Anzahl der Folds anzugeben.
CV-Splitter,
Eine iterierbare Liste, die (Trainings-, Test-) Splits als Indizes-Arrays liefert.

Für ganzzahlige/None-Eingaben wird KFold verwendet.

Siehe Benutzerhandbuch für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können.

Geändert in Version 0.22: Der Standardwert von cv, wenn None, hat sich von 3-Fold auf 5-Fold geändert.

n_jobsint, default=None

Anzahl der CPUs, die während der Kreuzvalidierung verwendet werden sollen. None bedeutet 1, außer in einem joblib.parallel_backend-Kontext. -1 bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.

verbosebool oder int, default=False

Legt den Ausführlichkeitsgrad fest.

Attribute:

intercept_float oder ndarray der Form (n_targets,): Unabhängiger Term in der Entscheidungsfunktion.
coef_ndarray der Form (n_features,) oder (n_targets, n_features): Parametervektor (w in der Problemformulierung).
n_nonzero_coefs_int: Geschätzte Anzahl von Nicht-Null-Koeffizienten, die den besten mittleren quadratischen Fehler über die Kreuzvalidierungs-Falten ergeben.
n_iter_int or array-like: Anzahl der aktiven Merkmale für jedes Ziel, für das das Modell mit den besten Hyperparametern neu angepasst wird, die durch Kreuzvalidierung über alle Faltungen ermittelt wurden.
n_features_in_int: Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.
feature_names_in_ndarray mit Form (n_features_in_,): Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

orthogonal_mp: Löst n_targets Orthogonal Matching Pursuit-Probleme.
orthogonal_mp_gram: Löst n_targets Orthogonal Matching Pursuit-Probleme unter ausschließlicher Verwendung der Gram-Matrix X.T * X und des Produkts X.T * y.
lars_path: Berechnet den Least Angle Regression- oder Lasso-Pfad unter Verwendung des LARS-Algorithmus.
Lars: Least Angle Regression Modell, auch bekannt als LAR.
LassoLars: Lasso-Modell, angepasst mit Least Angle Regression, auch bekannt als Lars.
OrthogonalMatchingPursuit: Orthogonal Matching Pursuit Modell (OMP).
LarsCV: Kreuzvalidiertes Least Angle Regression Modell.
LassoLarsCV: Kreuzvalidiertes Lasso-Modell, angepasst mit Least Angle Regression.
sklearn.decomposition.sparse_encode: Generische Sparse-Codierung. Jede Spalte des Ergebnisses ist die Lösung eines Lasso-Problems.

Anmerkungen

In fit wird das Modell, nachdem die optimale Anzahl von Nicht-Null-Koeffizienten durch Kreuzvalidierung ermittelt wurde, erneut mit dem gesamten Trainingsdatensatz angepasst.

Beispiele

>>> from sklearn.linear_model import OrthogonalMatchingPursuitCV
>>> from sklearn.datasets import make_regression
>>> X, y = make_regression(n_features=100, n_informative=10,
...                        noise=4, random_state=0)
>>> reg = OrthogonalMatchingPursuitCV(cv=5).fit(X, y)
>>> reg.score(X, y)
0.9991
>>> reg.n_nonzero_coefs_
np.int64(10)
>>> reg.predict(X[:1,])
array([-78.3854])

fit(X, y, **fit_params)[Quelle]#

Trainiert das Modell mit X, y als Trainingsdaten.

Parameter:

Xarray-like der Form (n_samples, n_features): Trainingsdaten.
yarray-like von Form (n_samples,): Zielwerte. Wird bei Bedarf in den Datentyp von X umgewandelt.
**fit_paramsdict: Parameter, die an den zugrundeliegenden Splitter übergeben werden.

Hinzugefügt in Version 1.4: Nur verfügbar, wenn enable_metadata_routing=True, was durch Verwendung von sklearn.set_config(enable_metadata_routing=True) eingestellt werden kann. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.

Gibt zurück:

selfobject: Gibt eine Instanz von self zurück.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Hinzugefügt in Version 1.4.

Gibt zurück:

routingMetadataRouter: Ein MetadataRouter, der die Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:

deepbool, default=True: Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:

paramsdict: Parameternamen, zugeordnet ihren Werten.

predict(X)[Quelle]#

Vorhersage mit dem linearen Modell.

Parameter:

Xarray-like oder sparse matrix, Form (n_samples, n_features): Stichproben.

Gibt zurück:

Carray, Form (n_samples,): Gibt vorhergesagte Werte zurück.

score(X, y, sample_weight=None)[Quelle]#

Gibt den Bestimmtheitskoeffizienten auf Testdaten zurück.

Der Bestimmtheitskoeffizient, $R^2$, ist definiert als $(1 - \frac{u}{v})$, wobei $u$ die Summe der quadrierten Residuen ((y_true - y_pred)** 2).sum() und $v$ die totale Summe der Quadrate ((y_true - y_true.mean()) ** 2).sum() ist. Der beste mögliche Wert ist 1,0 und er kann negativ sein (da das Modell beliebig schlechter sein kann). Ein konstantes Modell, das immer den Erwartungswert von y vorhersagt, unabhängig von den Eingabemerkmalen, würde einen $R^2$-Wert von 0,0 erzielen.

Parameter:

Xarray-like der Form (n_samples, n_features): Teststichproben. Für einige Schätzer kann dies eine vorab berechnete Kernelmatrix oder eine Liste von generischen Objekten sein, stattdessen mit der Form (n_samples, n_samples_fitted), wobei n_samples_fitted die Anzahl der für die Anpassung des Schätzers verwendeten Stichproben ist.
yarray-like der Form (n_samples,) oder (n_samples, n_outputs): Wahre Werte für X.
sample_weightarray-like der Form (n_samples,), Standardwert=None: Stichprobengewichte.

Gibt zurück:

scorefloat: $R^2$ von self.predict(X) bezogen auf y.

Anmerkungen

Der $R^2$-Wert, der beim Aufruf von score auf einem Regressor verwendet wird, nutzt multioutput='uniform_average' ab Version 0.23, um mit dem Standardwert von r2_score konsistent zu sein. Dies beeinflusst die score-Methode aller Multioutput-Regressoren (außer MultiOutputRegressor).

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:

**paramsdict: Schätzer-Parameter.

Gibt zurück:

selfestimator instance: Schätzer-Instanz.

set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') → OrthogonalMatchingPursuitCV[Quelle]#

Konfiguriert, ob Metadaten für die score-Methode angefordert werden sollen.

Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit enable_metadata_routing=True aktiviert ist (siehe sklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.

Die Optionen für jeden Parameter sind

True: Metadaten werden angefordert und, falls vorhanden, an score übergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.
False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht an score.
None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.
str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.

Der Standardwert (sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.

Hinzugefügt in Version 1.3.

Parameter:

sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED: Metadaten-Routing für den Parameter sample_weight in score.

Gibt zurück:

selfobject: Das aktualisierte Objekt.

Galeriebeispiele#

Orthogonal Matching Pursuit

OrthogonalMatchingPursuitCV#

Galeriebeispiele#

Diese Seite