Моя модель обучения включает в себя кодирование нескольких вариантов одного и того же изображения, а затем суммирование полученного представления по всем вариантам изображения.
Загрузчик данных создает тензорные пакеты формы: [batch_size,num_variants,1,height,width]
. 1
соответствует цветовым каналам изображения.
Как я могу тренировать мою модель с помощью мини-батчей в pytorch? Я ищу правильный способ пересылки всех изображений batch_size × num_variant через сеть и суммирования результатов по всем группам вариантов.
Мое текущее решение включает сглаживание первых двух измерений и выполнение цикла for для суммирования представлений, но я чувствую, что должен быть лучший способ, и я не уверен, что градиенты все запомнят.
depth
в 3D свертке. Вход вnn.Conv3d
имеет формуbatch_size*channels*depth*height*width
. - person planet_pluto   schedule 11.11.2020