Интересно, может ли кто-нибудь дать несколько советов о том, как поступить со следующим. Будучи новичком в Pandas, я чувствую, что на данный момент мои общие знания и уровень навыков недостаточны для обработки запроса, который я излагаю ниже.
У меня есть кадр данных pandas, в котором есть список из более чем 2000 номеров деталей. Для каждой детали указаны годы продажи деталей, номер месяца, проданное количество и стоимость продажи. В каждом году, вероятно, будут случайные пропущенные месяцы. В приведенном ниже примере данных за 2007 год месяц 11 отсутствует, так как в этом месяце не было продаж. Точно так же в 2008 году отсутствуют месяцы 11 и 12. Что я хотел бы сделать, так это вставить отсутствующие месяцы для каждого года и вставить строку, содержащую соответствующий год, месяц и нулевое значение для количества и продаж в каждой группе part_id.
В целом данные прибл. 60200, ряды с прибл. Идентификатор детали 2000. Я не против потратить время на разработку решения, но мог бы дать несколько советов, которые помогут моему образованию.
index Part_ID Year Month Qty Sales
60182 ZZSSL 2007 5 11.0 724.85
60183 ZZSSL 2007 6 7.0 537.94
60184 ZZSSL 2007 7 17.0 1165.02
60185 ZZSSL 2007 8 3.0 159.56
60186 ZZSSL 2007 9 67.0 4331.28
60187 ZZSSL 2007 10 72.0 4582.98
60188 ZZSSL 2007 12 42.0 2651.42
60189 ZZSSL 2008 1 22.0 1422.32
60190 ZZSSL 2008 2 16.0 1178.98
60191 ZZSSL 2008 3 20.0 1276.60
60192 ZZSSL 2008 4 28.0 2120.84
60193 ZZSSL 2008 5 2.0 83.03
60194 ZZSSL 2008 6 16.0 1250.24
60195 ZZSSL 2008 9 17.0 1323.34
60196 ZZSSL 2008 10 2.0 197.98
60197 ZZSSL 2009 1 21.0 1719.30
60198 ZZSSL 2009 2 1.0 78.15
60199 ZZSSL 2009 3 3.0 281.34
60200 ZZSSL 2009 4 25.0 2214.25
60201 ZZSSL 2009 5 10.0 833.60
60202 ZZSSL 2009 6 1.0 83.36
60203 ZZSSL 2009 7 1.0 83.36