Наличие одного и того же цвета для графика силуэта и для графика PCA

Моя цель - построить график силуэта рядом с графиком сокращения PCA. Моя идея заключалась в том, что для понимания я хотел бы иметь одинаковые цвета на обоих графиках. На данный момент я получаю это:

введите здесь описание изображения

проблема, с которой я столкнулся, заключается в том, что на первом графике я рисую каждый силуэт за другим, и у меня есть своего рода список цветов, тогда как на втором графике все отображается одновременно.

Так что я понятия не имею, как я могу переключиться с одного режима на другой.

Вот код, он должен быть рабочим примером.

def silhouette_PCA(data, model, n):
    reduced_data = sklearn.decomposition.PCA(n_components=2).fit_transform(data)
    model.fit(reduced_data)

    fig, (ax1, ax2) = plt.subplots(1, 2)
    fig.set_size_inches(18, 7)

    sample_silhouette_values = sklearn.metrics.silhouette_samples(reduced_data, model.fit_predict(reduced_data)  )

    y_lower = 10
    for i in range(n):
        ith_cluster_silhouette_values = sample_silhouette_values[ model.fit_predict(reduced_data) == i]
        ith_cluster_silhouette_values.sort()
        size_cluster_i = ith_cluster_silhouette_values.shape[0]
        y_upper = y_lower + size_cluster_i
        ############################### first color
        color = plt.cm.nipy_spectral(float(i) / n)
        ax1.fill_betweenx(np.arange(y_lower, y_upper),
                          0, ith_cluster_silhouette_values,
                          facecolor=color, edgecolor=color, alpha=0.7)

        y_lower = y_upper + 10 

#########################################################################################
    h = .02

    x_min, x_max = reduced_data[:, 0].min() - 1, reduced_data[:, 0].max() + 1
    y_min, y_max = reduced_data[:, 1].min() - 1, reduced_data[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])

    Z = Z.reshape(xx.shape)
    ax2.imshow(Z, interpolation='nearest',
              extent=(xx.min(), xx.max(), yy.min(), yy.max()),
               ############################# here the 2nd Color
              cmap=plt.cm.Paired,
              aspect='auto', origin='lower')
    ax2.plot(reduced_data[:, 0], reduced_data[:, 1], 'k.', markersize=2)


    plt.show()


model = sklearn.cluster.KMeans(n_clusters = 3)
data = feat_matrix
silhouette_PCA(data,model,3)

благодарю вас.


person Please don't hit me    schedule 23.12.2019    source источник


Ответы (1)


Я сделал это, и он отлично работает:

def silhouette_PCA(data, model, n):
    reduced_data = sklearn.decomposition.PCA(n_components=2).fit_transform(data)
    model.fit(reduced_data)

    fig, (ax1, ax2) = plt.subplots(1, 2)
    fig.set_size_inches(18, 7)

    sample_silhouette_values = sklearn.metrics.silhouette_samples(reduced_data, model.fit_predict(reduced_data)  )

    y_lower = 10
    for i in range(n):
        ith_cluster_silhouette_values = sample_silhouette_values[ model.fit_predict(reduced_data) == i]
        ith_cluster_silhouette_values.sort()
        size_cluster_i = ith_cluster_silhouette_values.shape[0]
        y_upper = y_lower + size_cluster_i
        ############################### first color
        color = plt.cm.nipy_spectral(float(i) / n)
        ax1.fill_betweenx(np.arange(y_lower, y_upper),
                          0, ith_cluster_silhouette_values,
                          facecolor=color, edgecolor=color, alpha=0.7)

        y_lower = y_upper + 10 

    list = []
    for i in range(n):
      list = np.append(list , plt.cm.nipy_spectral(float(i) / n)    )
    list = np.reshape(list,  (n,4) )
    cmap = mpl.colors.ListedColormap(list)
    bounds= range(n)
    norm = mpl.colors.BoundaryNorm(bounds, cmap.N)
#########################################################################################
    h = .02

    x_min, x_max = reduced_data[:, 0].min() - 1, reduced_data[:, 0].max() + 1
    y_min, y_max = reduced_data[:, 1].min() - 1, reduced_data[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    ax2.imshow(Z, interpolation='nearest',
              extent=(xx.min(), xx.max(), yy.min(), yy.max()),
               ############################# here the 2nd Color
              cmap= cmap, #plt.cm.Paired,
              aspect='auto', origin='lower')
    ax2.plot(reduced_data[:, 0], reduced_data[:, 1], 'k.', markersize=2)


    plt.show()


model = sklearn.cluster.KMeans(n_clusters = 7)
data = feat_matrix
silhouette_PCA(data,model,7)

введите здесь описание изображения

введите здесь описание изображения

person Marine Galantin    schedule 23.12.2019