SkewedChi2Sampler#

class sklearn.kernel_approximation.SkewedChi2Sampler(*, skewedness=1.0, n_components=100, random_state=None)[Quelle]#

Approximiert eine Merkmalsabbildung für den "skewed chi-squared"-Kernel.

Lesen Sie mehr im Benutzerhandbuch.

Parameter:
skewednessfloat, Standardwert=1.0

„skewedness“-Parameter des Kernels. Muss kreuzvalidiert werden.

n_componentsint, Standardwert=100

Anzahl der Monte-Carlo-Stichproben pro ursprünglichem Merkmal. Entspricht der Dimensionalität des berechneten Merkmalsraums.

random_stateint, RandomState-Instanz oder None, default=None

Pseudozufallszahlengenerator zur Steuerung der Erzeugung der zufälligen Gewichte und des zufälligen Offsets beim Anpassen der Trainingsdaten. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.

Attribute:
random_weights_ndarray der Form (n_features, n_components)

Gewichtsarray, das aus einer Sekans-Hyperbolicus-Verteilung gezogen wird und zur linearen Transformation des Logarithmus der Daten verwendet wird.

random_offset_ndarray der Form (n_features, n_components)

Bias-Term, der zu den Daten addiert wird. Er ist gleichmäßig verteilt zwischen 0 und 2*pi.

n_features_in_int

Anzahl der während des fits gesehenen Merkmale.

Hinzugefügt in Version 0.24.

feature_names_in_ndarray mit Form (n_features_in_,)

Namen der während fit gesehenen Merkmale. Nur definiert, wenn X Merkmalnamen hat, die alle Zeichenketten sind.

Hinzugefügt in Version 1.0.

Siehe auch

AdditiveChi2Sampler

Approximiert eine Merkmalsabbildung für den additiven Chi2-Kernel.

Nystroem

Approximiert eine Kernel-Abbildung mittels einer Teilmenge der Trainingsdaten.

RBFSampler

Approximiert eine RBF-Kernel-Merkmalsabbildung mittels zufälliger Fourier-Merkmale.

SkewedChi2Sampler

Approximiert eine Merkmalsabbildung für den "skewed chi-squared"-Kernel.

sklearn.metrics.pairwise.chi2_kernel

Der exakte Chi-Quadrat-Kernel.

sklearn.metrics.pairwise.kernel_metrics

Liste der integrierten Kernel.

Referenzen

Siehe „Random Fourier Approximations for Skewed Multiplicative Histogram Kernels“ von Fuxin Li, Catalin Ionescu und Cristian Sminchisescu.

Beispiele

>>> from sklearn.kernel_approximation import SkewedChi2Sampler
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> chi2_feature = SkewedChi2Sampler(skewedness=.01,
...                                  n_components=10,
...                                  random_state=0)
>>> X_features = chi2_feature.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0
fit(X, y=None)[Quelle]#

Passt das Modell an X an.

Zufällige Projektion entsprechend n_features stichprobenartig ziehen.

Parameter:
Xarray-ähnlich, Form (n_samples, n_features)

Trainingsdaten, wobei n_samples die Anzahl der Stichproben und n_features die Anzahl der Merkmale ist.

yarray-ähnlich, Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None

Zielwerte (None für unüberwachte Transformationen).

Gibt zurück:
selfobject

Gibt die Instanz selbst zurück.

fit_transform(X, y=None, **fit_params)[Quelle]#

An Daten anpassen, dann transformieren.

Passt den Transformer an X und y mit optionalen Parametern fit_params an und gibt eine transformierte Version von X zurück.

Parameter:
Xarray-like der Form (n_samples, n_features)

Eingabestichproben.

yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None

Zielwerte (None für unüberwachte Transformationen).

**fit_paramsdict

Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner fit-Methode akzeptiert.

Gibt zurück:
X_newndarray array der Form (n_samples, n_features_new)

Transformiertes Array.

get_feature_names_out(input_features=None)[Quelle]#

Holt die Ausgabemerkmale für die Transformation.

Die Feature-Namen werden mit dem kleingeschriebenen Klassennamen präfixiert. Wenn der Transformer z.B. 3 Features ausgibt, dann sind die Feature-Namen: ["klassenname0", "klassenname1", "klassenname2"].

Parameter:
input_featuresarray-like von str oder None, default=None

Wird nur verwendet, um die Feature-Namen mit den in fit gesehenen Namen zu validieren.

Gibt zurück:
feature_names_outndarray von str-Objekten

Transformierte Merkmalnamen.

get_metadata_routing()[Quelle]#

Holt das Metadaten-Routing dieses Objekts.

Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.

Gibt zurück:
routingMetadataRequest

Ein MetadataRequest, der Routing-Informationen kapselt.

get_params(deep=True)[Quelle]#

Holt Parameter für diesen Schätzer.

Parameter:
deepbool, default=True

Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.

Gibt zurück:
paramsdict

Parameternamen, zugeordnet ihren Werten.

set_output(*, transform=None)[Quelle]#

Ausgabecontainer festlegen.

Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.

Parameter:
transform{“default”, “pandas”, “polars”}, default=None

Konfiguriert die Ausgabe von transform und fit_transform.

  • "default": Standardausgabeformat eines Transformers

  • "pandas": DataFrame-Ausgabe

  • "polars": Polars-Ausgabe

  • None: Die Transformationskonfiguration bleibt unverändert

Hinzugefügt in Version 1.4: Die Option "polars" wurde hinzugefügt.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

set_params(**params)[Quelle]#

Setzt die Parameter dieses Schätzers.

Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie Pipeline). Letztere haben Parameter der Form <component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.

Parameter:
**paramsdict

Schätzer-Parameter.

Gibt zurück:
selfestimator instance

Schätzer-Instanz.

transform(X)[Quelle]#

Wendet die ungefähre Feature-Map auf X an.

Parameter:
Xarray-ähnlich, Form (n_samples, n_features)

Neue Daten, wobei n_samples die Anzahl der Samples und n_features die Anzahl der Merkmale ist. Alle Werte von X müssen strikt größer als „-skewedness“ sein.

Gibt zurück:
X_newarray-ähnlich, Form (n_samples, n_components)

Gibt die Instanz selbst zurück.