GaussianRandomProjection#
- class sklearn.random_projection.GaussianRandomProjection(n_components='auto', *, eps=0.1, compute_inverse_components=False, random_state=None)[Quelle]#
Reduziert die Dimensionalität durch gaußsche Zufallsprojektion.
Die Komponenten der Zufallsmatrix werden aus N(0, 1 / n_components) gezogen.
Lesen Sie mehr im Benutzerhandbuch.
Hinzugefügt in Version 0.13.
- Parameter:
- n_componentsint oder ‘auto’, Standard=’auto’
Dimensionalität des Zielprojektionsraums.
n_components kann automatisch an die Anzahl der Stichproben im Datensatz und die durch das Johnson-Lindenstrauss-Lemma gegebene Schranke angepasst werden. In diesem Fall wird die Qualität der Einbettung durch den
epsParameter gesteuert.Es ist zu beachten, dass das Johnson-Lindenstrauss-Lemma sehr konservative Schätzungen der erforderlichen Anzahl von Komponenten liefern kann, da es keine Annahmen über die Struktur des Datensatzes macht.
- epsfloat, Standard=0.1
Parameter zur Steuerung der Qualität der Einbettung gemäß dem Johnson-Lindenstrauss-Lemma, wenn
n_componentsauf ‘auto’ gesetzt ist. Der Wert muss positiv sein.Kleinere Werte führen zu einer besseren Einbettung und einer höheren Anzahl von Dimensionen (n_components) im Zielprojektionsraum.
- compute_inverse_componentsbool, Standard=False
Lernen Sie die inverse Transformation, indem Sie während des Fits die Pseudoinverse der Komponenten berechnen. Beachten Sie, dass die Berechnung der Pseudoinverse bei großen Matrizen nicht gut skaliert.
- random_stateint, RandomState-Instanz oder None, default=None
Steuert den pseudo-zufälligen Zahlen-Generator, der zur Erzeugung der Projektionsmatrix zur Fit-Zeit verwendet wird. Übergeben Sie eine Ganzzahl für reproduzierbare Ausgaben über mehrere Funktionsaufrufe hinweg. Siehe Glossar.
- Attribute:
- n_components_int
Konkrete Anzahl der Komponenten, die berechnet werden, wenn n_components="auto" ist.
- components_ndarray der Form (n_components, n_features)
Zufallsmatrix, die für die Projektion verwendet wird.
- inverse_components_ndarray der Form (n_features, n_components)
Pseudoinverse der Komponenten, nur berechnet, wenn
compute_inverse_componentsTrue ist.Hinzugefügt in Version 1.1.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
Siehe auch
SparseRandomProjectionReduziert die Dimensionalität durch spärliche Zufallsprojektion.
Beispiele
>>> import numpy as np >>> from sklearn.random_projection import GaussianRandomProjection >>> rng = np.random.RandomState(42) >>> X = rng.rand(25, 3000) >>> transformer = GaussianRandomProjection(random_state=rng) >>> X_new = transformer.fit_transform(X) >>> X_new.shape (25, 2759)
- fit(X, y=None)[Quelle]#
Generiert eine dünne Zufallsprojektionsmatrix.
- Parameter:
- X{ndarray, sparse matrix} der Form (n_samples, n_features)
Trainingsdatensatz: Nur die Form wird verwendet, um optimale Dimensionen der Zufallsmatrix basierend auf der Theorie zu finden, die in den oben genannten Veröffentlichungen referenziert wird.
- yIgnoriert
Nicht verwendet, hier zur API-Konsistenz durch Konvention vorhanden.
- Gibt zurück:
- selfobject
Instanz der Klasse BaseRandomProjection.
- fit_transform(X, y=None, **fit_params)[Quelle]#
An Daten anpassen, dann transformieren.
Passt den Transformer an
Xundymit optionalen Parameternfit_paramsan und gibt eine transformierte Version vonXzurück.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Eingabestichproben.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- **fit_paramsdict
Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner
fit-Methode akzeptiert.
- Gibt zurück:
- X_newndarray array der Form (n_samples, n_features_new)
Transformiertes Array.
- get_feature_names_out(input_features=None)[Quelle]#
Holt die Ausgabemerkmale für die Transformation.
Die Feature-Namen werden mit dem kleingeschriebenen Klassennamen präfixiert. Wenn der Transformer z.B. 3 Features ausgibt, dann sind die Feature-Namen:
["klassenname0", "klassenname1", "klassenname2"].- Parameter:
- input_featuresarray-like von str oder None, default=None
Wird nur verwendet, um die Feature-Namen mit den in
fitgesehenen Namen zu validieren.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Transformierte Merkmalnamen.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- inverse_transform(X)[Quelle]#
Projiziert Daten zurück in ihren ursprünglichen Raum.
Gibt ein Array X_original zurück, dessen Transformation X wäre. Beachten Sie, dass X_original dicht ist, auch wenn X dünn ist: Dies kann viel RAM beanspruchen.
Wenn
compute_inverse_componentsFalse ist, wird die Inverse der Komponenten bei jedem Aufruf voninverse_transformberechnet, was kostspielig sein kann.- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_components)
Zurück zu transformierende Daten.
- Gibt zurück:
- X_originalndarray von der Form (n_samples, n_features)
Rekonstruierte Daten.
- set_output(*, transform=None)[Quelle]#
Ausgabecontainer festlegen.
Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.
- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
Hinzugefügt in Version 1.4: Die Option
"polars"wurde hinzugefügt.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- transform(X)[Quelle]#
Projiziert die Daten durch Matrixmultiplikation mit der Zufallsmatrix.
- Parameter:
- X{ndarray, sparse matrix} der Form (n_samples, n_features)
Die Eingabedaten, die in einen kleineren dimensionalen Raum projiziert werden sollen.
- Gibt zurück:
- X_newndarray der Form (n_samples, n_components)
Projiziertes Array.