OrthogonalMatchingPursuitCV#
- class sklearn.linear_model.OrthogonalMatchingPursuitCV(*, copy=True, fit_intercept=True, max_iter=None, cv=None, n_jobs=None, verbose=False)[Quelle]#
Kreuzvalidiertes Orthogonal Matching Pursuit Modell (OMP).
Siehe Glossareintrag für Cross-validation-Schätzer.
Mehr dazu im Benutzerhandbuch.
- Parameter:
- copybool, Standard=True
Ob die Design-Matrix X vom Algorithmus kopiert werden muss. Ein falscher Wert ist nur hilfreich, wenn X bereits Fortran-geordnet ist, andernfalls wird sowieso eine Kopie erstellt.
- fit_interceptbool, Standardwert=True
Ob für dieses Modell ein Achsenabschnitt berechnet werden soll. Wenn auf False gesetzt, wird kein Achsenabschnitt in Berechnungen verwendet (d.h. die Daten werden als zentriert erwartet).
- max_iterint, Standard=None
Maximale Anzahl von Iterationen, die durchgeführt werden sollen, also maximale Anzahl von einzuschließenden Merkmalen. 10 % von
n_features, aber mindestens 5, falls verfügbar.- cvint, Kreuzvalidierungsgenerator oder Iterable, Standardwert=None
Bestimmt die Strategie der Kreuzvalidierungsaufteilung. Mögliche Eingaben für cv sind
None, um die standardmäßige 5-fache Kreuzvalidierung zu verwenden,
Ganzzahl, um die Anzahl der Folds anzugeben.
Eine iterierbare Liste, die (Trainings-, Test-) Splits als Indizes-Arrays liefert.
Für ganzzahlige/None-Eingaben wird
KFoldverwendet.Siehe Benutzerhandbuch für die verschiedenen Kreuzvalidierungsstrategien, die hier verwendet werden können.
Geändert in Version 0.22: Der Standardwert von
cv, wenn None, hat sich von 3-Fold auf 5-Fold geändert.- n_jobsint, default=None
Anzahl der CPUs, die während der Kreuzvalidierung verwendet werden sollen.
Nonebedeutet 1, außer in einemjoblib.parallel_backend-Kontext.-1bedeutet die Verwendung aller Prozessoren. Siehe Glossar für weitere Details.- verbosebool oder int, default=False
Legt den Ausführlichkeitsgrad fest.
- Attribute:
- intercept_float oder ndarray der Form (n_targets,)
Unabhängiger Term in der Entscheidungsfunktion.
- coef_ndarray der Form (n_features,) oder (n_targets, n_features)
Parametervektor (w in der Problemformulierung).
- n_nonzero_coefs_int
Geschätzte Anzahl von Nicht-Null-Koeffizienten, die den besten mittleren quadratischen Fehler über die Kreuzvalidierungs-Falten ergeben.
- n_iter_int or array-like
Anzahl der aktiven Merkmale für jedes Ziel, für das das Modell mit den besten Hyperparametern neu angepasst wird, die durch Kreuzvalidierung über alle Faltungen ermittelt wurden.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
Siehe auch
orthogonal_mpLöst n_targets Orthogonal Matching Pursuit-Probleme.
orthogonal_mp_gramLöst n_targets Orthogonal Matching Pursuit-Probleme unter ausschließlicher Verwendung der Gram-Matrix X.T * X und des Produkts X.T * y.
lars_pathBerechnet den Least Angle Regression- oder Lasso-Pfad unter Verwendung des LARS-Algorithmus.
LarsLeast Angle Regression Modell, auch bekannt als LAR.
LassoLarsLasso-Modell, angepasst mit Least Angle Regression, auch bekannt als Lars.
OrthogonalMatchingPursuitOrthogonal Matching Pursuit Modell (OMP).
LarsCVKreuzvalidiertes Least Angle Regression Modell.
LassoLarsCVKreuzvalidiertes Lasso-Modell, angepasst mit Least Angle Regression.
sklearn.decomposition.sparse_encodeGenerische Sparse-Codierung. Jede Spalte des Ergebnisses ist die Lösung eines Lasso-Problems.
Anmerkungen
In
fitwird das Modell, nachdem die optimale Anzahl von Nicht-Null-Koeffizienten durch Kreuzvalidierung ermittelt wurde, erneut mit dem gesamten Trainingsdatensatz angepasst.Beispiele
>>> from sklearn.linear_model import OrthogonalMatchingPursuitCV >>> from sklearn.datasets import make_regression >>> X, y = make_regression(n_features=100, n_informative=10, ... noise=4, random_state=0) >>> reg = OrthogonalMatchingPursuitCV(cv=5).fit(X, y) >>> reg.score(X, y) 0.9991 >>> reg.n_nonzero_coefs_ np.int64(10) >>> reg.predict(X[:1,]) array([-78.3854])
- fit(X, y, **fit_params)[Quelle]#
Trainiert das Modell mit X, y als Trainingsdaten.
- Parameter:
- Xarray-like der Form (n_samples, n_features)
Trainingsdaten.
- yarray-like von Form (n_samples,)
Zielwerte. Wird bei Bedarf in den Datentyp von X umgewandelt.
- **fit_paramsdict
Parameter, die an den zugrundeliegenden Splitter übergeben werden.
Hinzugefügt in Version 1.4: Nur verfügbar, wenn
enable_metadata_routing=True, was durch Verwendung vonsklearn.set_config(enable_metadata_routing=True)eingestellt werden kann. Weitere Details finden Sie im Benutzerhandbuch für Metadaten-Routing.
- Gibt zurück:
- selfobject
Gibt eine Instanz von self zurück.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
Hinzugefügt in Version 1.4.
- Gibt zurück:
- routingMetadataRouter
Ein
MetadataRouter, der die Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- predict(X)[Quelle]#
Vorhersage mit dem linearen Modell.
- Parameter:
- Xarray-like oder sparse matrix, Form (n_samples, n_features)
Stichproben.
- Gibt zurück:
- Carray, Form (n_samples,)
Gibt vorhergesagte Werte zurück.
- score(X, y, sample_weight=None)[Quelle]#
Gibt den Bestimmtheitskoeffizienten auf Testdaten zurück.
Der Bestimmtheitskoeffizient, \(R^2\), ist definiert als \((1 - \frac{u}{v})\), wobei \(u\) die Summe der quadrierten Residuen
((y_true - y_pred)** 2).sum()und \(v\) die totale Summe der Quadrate((y_true - y_true.mean()) ** 2).sum()ist. Der beste mögliche Wert ist 1,0 und er kann negativ sein (da das Modell beliebig schlechter sein kann). Ein konstantes Modell, das immer den Erwartungswert vonyvorhersagt, unabhängig von den Eingabemerkmalen, würde einen \(R^2\)-Wert von 0,0 erzielen.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Teststichproben. Für einige Schätzer kann dies eine vorab berechnete Kernelmatrix oder eine Liste von generischen Objekten sein, stattdessen mit der Form
(n_samples, n_samples_fitted), wobein_samples_fitteddie Anzahl der für die Anpassung des Schätzers verwendeten Stichproben ist.- yarray-like der Form (n_samples,) oder (n_samples, n_outputs)
Wahre Werte für
X.- sample_weightarray-like der Form (n_samples,), Standardwert=None
Stichprobengewichte.
- Gibt zurück:
- scorefloat
\(R^2\) von
self.predict(X)bezogen aufy.
Anmerkungen
Der \(R^2\)-Wert, der beim Aufruf von
scoreauf einem Regressor verwendet wird, nutztmultioutput='uniform_average'ab Version 0.23, um mit dem Standardwert vonr2_scorekonsistent zu sein. Dies beeinflusst diescore-Methode aller Multioutput-Regressoren (außerMultiOutputRegressor).
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_score_request(*, sample_weight: bool | None | str = '$UNCHANGED$') OrthogonalMatchingPursuitCV[Quelle]#
Konfiguriert, ob Metadaten für die
score-Methode angefordert werden sollen.Beachten Sie, dass diese Methode nur relevant ist, wenn dieser Schätzer als Unter-Schätzer innerhalb eines Meta-Schätzers verwendet wird und Metadaten-Routing mit
enable_metadata_routing=Trueaktiviert ist (siehesklearn.set_config). Bitte lesen Sie das Benutzerhandbuch, um zu erfahren, wie der Routing-Mechanismus funktioniert.Die Optionen für jeden Parameter sind
True: Metadaten werden angefordert und, falls vorhanden, anscoreübergeben. Die Anforderung wird ignoriert, wenn keine Metadaten vorhanden sind.False: Metadaten werden nicht angefordert und der Meta-Schätzer übergibt sie nicht anscore.None: Metadaten werden nicht angefordert und der Meta-Schätzer löst einen Fehler aus, wenn der Benutzer sie bereitstellt.str: Metadaten sollten mit diesem Alias an den Meta-Schätzer übergeben werden und nicht mit dem ursprünglichen Namen.
Der Standardwert (
sklearn.utils.metadata_routing.UNCHANGED) behält die bestehende Anforderung bei. Dies ermöglicht es Ihnen, die Anforderung für einige Parameter zu ändern und für andere nicht.Hinzugefügt in Version 1.3.
- Parameter:
- sample_weightstr, True, False, oder None, Standardwert=sklearn.utils.metadata_routing.UNCHANGED
Metadaten-Routing für den Parameter
sample_weightinscore.
- Gibt zurück:
- selfobject
Das aktualisierte Objekt.