Zeigen Sie die Entscheidungsfläche von auf dem Iris-Datensatz trainierten Entscheidungsbäumen#

Zeigen Sie die Entscheidungsfläche eines Entscheidungsbaums, der auf Paaren von Merkmalen des Iris-Datensatzes trainiert wurde.

Weitere Informationen zum Schätzer finden Sie unter Entscheidungsbaum.

Für jedes Paar von Iris-Merkmalen lernt der Entscheidungsbaum Entscheidungsgrenzen, die aus Kombinationen von einfachen Schwellenwertregeln gebildet werden, die aus den Trainingsstichproben abgeleitet wurden.

Wir zeigen auch die Baumstruktur eines Modells, das auf allen Merkmalen aufgebaut ist.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Laden Sie zunächst die Kopie des Iris-Datensatzes, die mit scikit-learn ausgeliefert wird

from sklearn.datasets import load_iris

iris = load_iris()

Zeigen Sie die Entscheidungsfunktionen von Bäumen an, die auf allen Merkmalspaaren trainiert wurden.

import matplotlib.pyplot as plt
import numpy as np

from sklearn.datasets import load_iris
from sklearn.inspection import DecisionBoundaryDisplay
from sklearn.tree import DecisionTreeClassifier

# Parameters
n_classes = 3
plot_colors = "ryb"
plot_step = 0.02


for pairidx, pair in enumerate([[0, 1], [0, 2], [0, 3], [1, 2], [1, 3], [2, 3]]):
    # We only take the two corresponding features
    X = iris.data[:, pair]
    y = iris.target

    # Train
    clf = DecisionTreeClassifier().fit(X, y)

    # Plot the decision boundary
    ax = plt.subplot(2, 3, pairidx + 1)
    plt.tight_layout(h_pad=0.5, w_pad=0.5, pad=2.5)
    DecisionBoundaryDisplay.from_estimator(
        clf,
        X,
        cmap=plt.cm.RdYlBu,
        response_method="predict",
        ax=ax,
        xlabel=iris.feature_names[pair[0]],
        ylabel=iris.feature_names[pair[1]],
    )

    # Plot the training points
    for i, color in zip(range(n_classes), plot_colors):
        idx = np.asarray(y == i).nonzero()
        plt.scatter(
            X[idx, 0],
            X[idx, 1],
            c=color,
            label=iris.target_names[i],
            edgecolor="black",
            s=15,
        )

plt.suptitle("Decision surface of decision trees trained on pairs of features")
plt.legend(loc="lower right", borderpad=0, handletextpad=0)
_ = plt.axis("tight")
Decision surface of decision trees trained on pairs of features

Zeigen Sie die Struktur eines einzelnen Entscheidungsbaums an, der auf allen Merkmalen zusammen trainiert wurde.

from sklearn.tree import plot_tree

plt.figure()
clf = DecisionTreeClassifier().fit(iris.data, iris.target)
plot_tree(clf, filled=True)
plt.title("Decision tree trained on all the iris features")
plt.show()
Decision tree trained on all the iris features

Gesamtlaufzeit des Skripts: (0 Minuten 0,734 Sekunden)

Verwandte Beispiele

Principal Component Analysis (PCA) auf dem Iris-Datensatz

Principal Component Analysis (PCA) auf dem Iris-Datensatz

Multi-Klassen SGD auf dem Iris-Datensatz plotten

Multi-Klassen SGD auf dem Iris-Datensatz plotten

Entscheidungsflächen von Ensembles von Bäumen auf dem Iris-Datensatz plotten

Entscheidungsflächen von Ensembles von Bäumen auf dem Iris-Datensatz plotten

Inkrementelles PCA

Inkrementelles PCA

Galerie generiert von Sphinx-Gallery