GaussianRandomProjection#

class sklearn.random_projection.GaussianRandomProjection(n_components='auto', *, eps=0.1, compute_inverse_components=False, random_state=None)[Quelle]#

Reduziert die Dimensionalität durch gaußsche Zufallsprojektion.

Die Komponenten der Zufallsmatrix werden aus N(0, 1 / n_components) gezogen.

Lesen Sie mehr im Benutzerhandbuch.

Hinzugefügt in Version 0.13.

Parameter:
n_componentsint oder ‘auto’, Standard=’auto’

Dimensionalität des Zielprojektionsraums.

n_components kann automatisch an die Anzahl der Stichproben im Datensatz und die durch das Johnson-Lindenstrauss-Lemma gegebene Schranke angepasst werden. In diesem Fall wird die Qualität der Einbettung durch den eps Parameter gesteuert.

Es ist zu beachten, dass das Johnson-Lindenstrauss-Lemma sehr konservative Schätzungen der erforderlichen Anzahl von Komponenten liefern kann, da es keine Annahmen über die Struktur des Datensatzes macht.

epsfloat, Standard=0.1

Parameter zur Steuerung der Qualität der Einbettung gemäß dem Johnson-Lindenstrauss-Lemma, wenn n_components auf ‘auto’ gesetzt ist. Der Wert muss positiv sein.

Kleinere Werte führen zu einer besseren Einbettung und einer höheren Anzahl von Dimensionen (n_components) im Zielprojektionsraum.

compute_inverse_componentsbool, Standard=False

Lernen Sie die inverse Transformation, indem Sie während des Fits die Pseudoinverse der Komponenten berechnen. Beachten Sie, dass die Berechnung der Pseudoinverse bei großen Matrizen nicht gut skaliert.

random_stateint, RandomState-Instanz oder None, default=None

Steuert den pseudo-zufälligen Zahlen-Generator, der zur Erzeugung der Projektionsmatrix zur Fit-Zeit verwendet wird. Übergeben Sie eine Ganzzahl für reproduzierbare Ausgaben über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Attribute:
n_components_int

Konkrete Anzahl der Komponenten, die berechnet werden, wenn n_components="auto" ist.

components_ndarray der Form (n_components, n_features)

Zufallsmatrix, die für die Projektion verwendet wird.

inverse_components_ndarray der Form (n_features, n_components)

Pseudoinverse der Komponenten, nur berechnet, wenn compute_inverse_components True ist.

Hinzugefügt in Version 1.1.

n_features_in_int

Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.

feature_names_in_ndarray mit Form (n_features_in_,)

Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

SparseRandomProjection

Reduziert die Dimensionalität durch spärliche Zufallsprojektion.

Beispiele

>>> import numpy as np
>>> from sklearn.random_projection import GaussianRandomProjection
>>> rng = np.random.RandomState(42)
>>> X = rng.rand(25, 3000)
>>> transformer = GaussianRandomProjection(random_state=rng)
>>> X_new = transformer.fit_transform(X)
>>> X_new.shape
(25, 2759)
fit(X, y=None)[Quelle]#

Generiert eine dünne Zufallsprojektionsmatrix.

Parameter:
X{ndarray, sparse matrix} der Form (n_samples, n_features)

Trainingsdatensatz: Nur die Form wird verwendet, um optimale Dimensionen der Zufallsmatrix basierend auf der Theorie zu finden, die in den oben genannten Veröffentlichungen referenziert wird.

yIgnoriert

Nicht verwendet, hier zur API-Konsistenz durch Konvention vorhanden.

Gibt zurück:
selfobject

Instanz der Klasse BaseRandomProjection.

fit_transform(X, y=None, **fit_params)[Quelle]#

An Daten anpassen, dann transformieren.

Passt den Transformer an X und y mit optionalen Parametern fit_params an und gibt eine transformierte Version von X zurück.

Parameter:
Xarray-like der Form (n_samples, n_features)

Eingabestichproben.

yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None

Zielwerte (None für unüberwachte Transformationen).

**fit_paramsdict

Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner fit-Methode akzeptiert.

Gibt zurück:
X_newndarray array der Form (n_samples, n_features_new)

Transformiertes Array.

get_feature_names_out(input_features=None)[Quelle]#

Holt die Ausgabemerkmale für die Transformation.

Die Feature-Namen werden mit dem kleingeschriebenen Klassennamen präfixiert. Wenn der Transformer z.B. 3 Features ausgibt, dann sind die Feature-Namen: ["klassenname0", "klassenname1", "klassenname2"].

Parameter:
input_featuresarray-like von str oder None, default=None

Wird nur verwendet, um die Feature-Namen mit den in fit gesehenen Namen zu validieren.

Gibt zurück:
feature_names_outndarray von str-Objekten

Transformierte Merkmalnamen.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:
routingMetadataRequest

Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:
deepbool, default=True

Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:
paramsdict

Parameternamen, zugeordnet ihren Werten.

inverse_transform(X)[Quelle]#

Projiziert Daten zurück in ihren ursprünglichen Raum.

Gibt ein Array X_original zurück, dessen Transformation X wäre. Beachten Sie, dass X_original dicht ist, auch wenn X dünn ist: Dies kann viel RAM beanspruchen.

Wenn compute_inverse_components False ist, wird die Inverse der Komponenten bei jedem Aufruf von inverse_transform berechnet, was kostspielig sein kann.

Parameter:
X{array-like, sparse matrix} der Form (n_samples, n_components)

Zurück zu transformierende Daten.

Gibt zurück:
X_originalndarray von der Form (n_samples, n_features)

Rekonstruierte Daten.

set_output(*, transform=None)[Quelle]#

Ausgabecontainer festlegen.

Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.

Parameter:
transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

  • "default": Standardausgabeformat eines Transformers

  • "pandas": DataFrame-Ausgabe

  • "polars": Polars-Ausgabe

  • None: Die Transformationskonfiguration bleibt unverändert

Hinzugefügt in Version 1.4: Die Option "polars" wurde hinzugefügt.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:
**paramsdict

Schätzer-Parameter.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

transform(X)[Quelle]#

Projiziert die Daten durch Matrixmultiplikation mit der Zufallsmatrix.

Parameter:
X{ndarray, sparse matrix} der Form (n_samples, n_features)

Die Eingabedaten, die in einen kleineren dimensionalen Raum projiziert werden sollen.

Gibt zurück:
X_newndarray der Form (n_samples, n_components)

Projiziertes Array.