Какая связь между размером партии и эпохами в Керасе?

Я тренирую модель с 8000 выборками

classifier = KerasClassifier(build_fn=build_classifier, batch_size=10, nb_epoch=100)

где размер партии равен 10 (тогда каждая партия будет содержать 800 образцов). Итак, в каждую эпоху для подбора модели будет использоваться один из этих 800 образцов. Я так понял, поправьте меня, если я не прав.

Выход

Эпоха 1/10

10/7200 [..............................] - ETA: 2:57 - loss: 0.6932 - acc: 0.1000
440/7200 [>.............................] - ETA: 4s - loss: 0.6866 - acc: 0.7932  
1100/7200 [===>..........................] - ETA: 2s - loss: 0.6744 - acc: 0.7900
1660/7200 [=====>........................] - ETA: 1s - loss: 0.6555 - acc: 0.7910
2220/7200 [========>.....................] - ETA: 1s - loss: 0.6329 - acc: 0.7869
2930/7200 [===========>..................] - ETA: 0s - loss: 0.5990 - acc: 0.7887
3520/7200 [=============>................] - ETA: 0s - loss: 0.5744 - acc: 0.7906
4230/7200 [================>.............] - ETA: 0s - loss: 0.5564 - acc: 0.7872
4880/7200 [===================>..........] - ETA: 0s - loss: 0.5432 - acc: 0.7881
5650/7200 [======================>.......] - ETA: 0s - loss: 0.5278 - acc: 0.7913
6280/7200 [=========================>....] - ETA: 0s - loss: 0.5165 - acc: 0.7933
6910/7200 [===========================>..] - ETA: 0s - loss: 0.5059 - acc: 0.7951
7200/7200 [==============================] - 1s 123us/step - loss: 0.5051 - acc: 0.7939

Почему в 1-й эпохе 13 подразделений? В каждую эпоху должен быть выполнен только один пакет, верно?


person Shashi Tunga    schedule 11.11.2017    source источник
comment
batch size if 10 ,each batch will contain 800 samples нет, это 800 партий по 10 образцов в каждой.   -  person Thomas Jungblut    schedule 11.11.2017
comment
@Thomson Jungblut, я понял о размере партии. Можете ли вы объяснить результат, который я получил в результате стохастического градиентного спуска (т.е. я использую оптимизатор Адама). И как будет выглядеть результат, если это будет просто градиентный спуск?   -  person Shashi Tunga    schedule 11.11.2017


Ответы (1)


Размер партии – это количество образцов в каждой партии. Каждый пакетный процесс называется 1 шагом.

Одна эпоха завершается, когда все данные в обучающем наборе используются для обучения.

Следовательно, для данного примера каждая эпоха будет иметь 800 шагов, а каждая партия будет иметь 10 выборок.

person Anand C U    schedule 11.11.2017