У меня есть набор данных, который состоит из ежедневных метеорологических данных с координатной сеткой x, y за несколько лет. Меня интересует вычисление среднегодовых значений только зимних данных, т.е. не считая и летних данных.
Я думаю, что мне нужно использовать команду resample
, например, частота AS-OCT
для пересчета временных рядов на годовую частоту с началом зимы в октябре каждого года (это северные широты).
Я не могу понять, как указать, что я хочу использовать данные только с октября по апрель / май, игнорируя июнь, июль и август.
Поскольку функция resample работает с ndarray
объектами, я придумал довольно непереносимый способ сделать это за определенную сумму:
def winter(x,axis):
# Only use data from 1 October to end of April (day 211)
return np.sum(x[0:211,:,:],axis=0)
win_sum = all_data.resample('AS-OCT',how=winter,dim='TIME')
но мне кажется, что должно быть более элегантное решение. Любые идеи?
.where
), а затем передискретизировать? Я думаю, вам будет намного проще, чем пытаться объединить маскировку в ресэмпл. Если у вас есть полностью воспроизводимый пример, я могу ответить примером - person Maximilian   schedule 15.09.2016