PolynomialCountSketch#
- class sklearn.kernel_approximation.PolynomialCountSketch(*, gamma=1.0, degree=2, coef0=0, n_components=100, random_state=None)[Quelle]#
Polynomialer Kernel-Approximation mittels Tensor Sketch.
Implementiert Tensor Sketch, das die Feature-Abbildung des Polynomkerns annähert
K(X, Y) = (gamma * <X, Y> + coef0)^degree
durch effiziente Berechnung eines Count Sketch des äußeren Produkts eines Vektors mit sich selbst mittels Fast Fourier Transforms (FFT). Mehr dazu im Benutzerhandbuch.
Hinzugefügt in Version 0.24.
- Parameter:
- gammafloat, default=1.0
Parameter des Polynomkerns, dessen Feature-Abbildung approximiert werden soll.
- degreeint, Standard=2
Grad des Polynomkerns, dessen Feature-Abbildung approximiert werden soll.
- coef0int, Standard=0
Konstanter Term des Polynomkerns, dessen Feature-Abbildung approximiert werden soll.
- n_componentsint, Standardwert=100
Dimensionalität des Ausgabefeaturesraums. Normalerweise sollte
n_componentsgrößer sein als die Anzahl der Features in den Eingabestichproben, um eine gute Leistung zu erzielen. Das optimale Gleichgewicht zwischen Score und Laufzeit wird typischerweise bei etwan_components= 10 *n_featureserreicht, dies hängt jedoch vom spezifischen verwendeten Datensatz ab.- random_stateint, RandomState instance, default=None
Bestimmt die Zufallszahlengenerierung für die Initialisierung von indexHash und bitHash. Übergeben Sie eine Ganzzahl für reproduzierbare Ergebnisse über mehrere Funktionsaufrufe hinweg. Siehe Glossar.
- Attribute:
- indexHash_ndarray der Form (degree, n_features), dtype=int64
Array von Indizes im Bereich [0, n_components), das zur Darstellung der 2-fach unabhängigen Hash-Funktionen für die Count Sketch-Berechnung verwendet wird.
- bitHash_ndarray der Form (degree, n_features), dtype=float32
Array mit zufälligen Einträgen in {+1, -1}, das zur Darstellung der 2-fach unabhängigen Hash-Funktionen für die Count Sketch-Berechnung verwendet wird.
- n_features_in_int
Anzahl der während des fits gesehenen Merkmale.
Hinzugefügt in Version 0.24.
- feature_names_in_ndarray mit Form (
n_features_in_,) Namen der während fit gesehenen Merkmale. Nur definiert, wenn
XMerkmalnamen hat, die alle Zeichenketten sind.Hinzugefügt in Version 1.0.
Siehe auch
AdditiveChi2SamplerApproximiert eine Merkmalsabbildung für den additiven Chi2-Kernel.
NystroemApproximiert eine Kernel-Abbildung mittels einer Teilmenge der Trainingsdaten.
RBFSamplerApproximiert eine RBF-Kernel-Merkmalsabbildung mittels zufälliger Fourier-Merkmale.
SkewedChi2SamplerApproximiert eine Merkmalsabbildung für den "skewed chi-squared"-Kernel.
sklearn.metrics.pairwise.kernel_metricsListe der integrierten Kernel.
Beispiele
>>> from sklearn.kernel_approximation import PolynomialCountSketch >>> from sklearn.linear_model import SGDClassifier >>> X = [[0, 0], [1, 1], [1, 0], [0, 1]] >>> y = [0, 0, 1, 1] >>> ps = PolynomialCountSketch(degree=3, random_state=1) >>> X_features = ps.fit_transform(X) >>> clf = SGDClassifier(max_iter=10, tol=1e-3) >>> clf.fit(X_features, y) SGDClassifier(max_iter=10) >>> clf.score(X_features, y) 1.0
Ein detaillierteres Anwendungsbeispiel finden Sie unter Skalierbares Lernen mit Polynomkern-Approximation
- fit(X, y=None)[Quelle]#
Passt das Modell an X an.
Initialisiert die internen Variablen. Die Methode benötigt keine Informationen über die Verteilung der Daten, daher interessiert uns nur n_features in X.
- Parameter:
- X{array-like, sparse matrix} der Form (n_samples, n_features)
Trainingsdaten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- Gibt zurück:
- selfobject
Gibt die Instanz selbst zurück.
- fit_transform(X, y=None, **fit_params)[Quelle]#
An Daten anpassen, dann transformieren.
Passt den Transformer an
Xundymit optionalen Parameternfit_paramsan und gibt eine transformierte Version vonXzurück.- Parameter:
- Xarray-like der Form (n_samples, n_features)
Eingabestichproben.
- yarray-like der Form (n_samples,) oder (n_samples, n_outputs), Standardwert=None
Zielwerte (None für unüberwachte Transformationen).
- **fit_paramsdict
Zusätzliche Fit-Parameter. Nur übergeben, wenn der Estimator zusätzliche Parameter in seiner
fit-Methode akzeptiert.
- Gibt zurück:
- X_newndarray array der Form (n_samples, n_features_new)
Transformiertes Array.
- get_feature_names_out(input_features=None)[Quelle]#
Holt die Ausgabemerkmale für die Transformation.
Die Feature-Namen werden mit dem kleingeschriebenen Klassennamen präfixiert. Wenn der Transformer z.B. 3 Features ausgibt, dann sind die Feature-Namen:
["klassenname0", "klassenname1", "klassenname2"].- Parameter:
- input_featuresarray-like von str oder None, default=None
Wird nur verwendet, um die Feature-Namen mit den in
fitgesehenen Namen zu validieren.
- Gibt zurück:
- feature_names_outndarray von str-Objekten
Transformierte Merkmalnamen.
- get_metadata_routing()[Quelle]#
Holt das Metadaten-Routing dieses Objekts.
Bitte prüfen Sie im Benutzerhandbuch, wie der Routing-Mechanismus funktioniert.
- Gibt zurück:
- routingMetadataRequest
Ein
MetadataRequest, der Routing-Informationen kapselt.
- get_params(deep=True)[Quelle]#
Holt Parameter für diesen Schätzer.
- Parameter:
- deepbool, default=True
Wenn True, werden die Parameter für diesen Schätzer und die enthaltenen Unterobjekte, die Schätzer sind, zurückgegeben.
- Gibt zurück:
- paramsdict
Parameternamen, zugeordnet ihren Werten.
- set_output(*, transform=None)[Quelle]#
Ausgabecontainer festlegen.
Siehe Einführung in die set_output API für ein Beispiel zur Verwendung der API.
- Parameter:
- transform{“default”, “pandas”, “polars”}, default=None
Konfiguriert die Ausgabe von
transformundfit_transform."default": Standardausgabeformat eines Transformers"pandas": DataFrame-Ausgabe"polars": Polars-AusgabeNone: Die Transformationskonfiguration bleibt unverändert
Hinzugefügt in Version 1.4: Die Option
"polars"wurde hinzugefügt.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- set_params(**params)[Quelle]#
Setzt die Parameter dieses Schätzers.
Die Methode funktioniert sowohl bei einfachen Schätzern als auch bei verschachtelten Objekten (wie
Pipeline). Letztere haben Parameter der Form<component>__<parameter>, so dass es möglich ist, jede Komponente eines verschachtelten Objekts zu aktualisieren.- Parameter:
- **paramsdict
Schätzer-Parameter.
- Gibt zurück:
- selfestimator instance
Schätzer-Instanz.
- transform(X)[Quelle]#
Generiert die Feature-Abbildungsapproximation für X.
- Parameter:
- X{array-like}, Form (n_samples, n_features)
Neue Daten, wobei
n_samplesdie Anzahl der Stichproben undn_featuresdie Anzahl der Merkmale ist.
- Gibt zurück:
- X_newarray-ähnlich, Form (n_samples, n_components)
Gibt die Instanz selbst zurück.
Galeriebeispiele#
Skalierbares Lernen mit Polynom-Kernel-Approximation