У меня есть такой csv:
name,version,color
AA,"version 1",yellow
BB,"version 2",black
CC,"version 3",yellow
DD,"version 1",black
AA,"version 1",green
BB,"version 2",green
FF,"version 3",green
GG,"version 3",red
BB,"version 3",yellow
BB,"version 2",red
BB,"version 1",black
Я хотел бы нарисовать гистограмму, которая показывает версии по оси x и количество (количество) разных цветов по оси y.
Итак, я хочу сгруппировать DataFrame
по версии, проверить, какие цвета относятся к конкретной версии, подсчитать цветов и отображать результаты на гистограмме pygal.
Это должно выглядеть примерно так:
Что я пробовал до сих пор:
df = pd.read_csv(results)
new_df = df.groupby('version')['color'].value_counts()
bar_chart = pygal.Bar(width=1000, height=600,
legend_at_bottom=True, human_readable=True,
title='versions vs colors',
x_title='Version',
y_title='Number')
versions = []
for index, row in new_df.iteritems():
versions.append(index[0])
bar_chart.add(index[1], row)
bar_chart.x_labels = map(str, versions)
bar_chart.render_to_file('bar-chart.svg')
К сожалению, он не работает и не может сопоставить группу цветов с правильной версией.
Я также пытался использовать matplotlib.pyplot
, и это работает как шарм:
pd.crosstab(df['version'],df['color']).plot.bar(ax=ax)
plt.draw()
Это также работает:
df.groupby(['version','color']).size().unstack(fill_value=0).plot.bar()
Но сгенерированная диаграмма недостаточно точна для меня. Я хотел бы иметь диаграмму pygal.
Я также проверил:
Как отображать значения группы pandas в график?
Как построить кадр данных pandas?