Я изо всех сил пытаюсь восстановить модель в течение одного дня без каких-либо успехов. Мой код состоит из class TF_MLPRegressor()
, где я определяю сетевую архитектуру в конструкторе. Затем я вызываю функцию fit()
для обучения. Вот как я сохраняю простую модель персептрона с 1 скрытым слоем в функции fit()
:
starting_epoch = 0
# Launch the graph
tf.set_random_seed(self.random_state) # fix the random seed before creating the Session in order to take effect!
if hasattr(self, 'sess'):
self.sess.close()
del self.sess # delete Session to release memory
gc.collect()
self.sess = tf.Session(config=self.config) # save the session to predict from new data
# Create a saver object which will save all the variables
saver = tf.train.Saver(max_to_keep=2) # max_to_keep=2 means to not keep more than 2 checkpoint files
self.sess.run(tf.global_variables_initializer())
# ... (each 100 epochs)
saver.save(self.sess, self.checkpoint_dir+"/resume", global_step=epoch)
Затем я создаю новый экземпляр TF_MLPRegressor()
с точно такими же значениями входных параметров и вызываю функцию fit()
для восстановления модели следующим образом:
self.sess = tf.Session(config=self.config) # create a new session to load saved variables
ckpt = tf.train.latest_checkpoint(self.checkpoint_dir)
starting_epoch = int(ckpt.split('-')[-1])
metagraph = ".".join([ckpt, 'meta'])
saver = tf.train.import_meta_graph(metagraph)
self.sess.run(tf.global_variables_initializer()) # Initialize variables
lhl = tf.trainable_variables()[2]
lhlA = lhl.eval(session=self.sess)
saver.restore(sess=self.sess, save_path=ckpt) # Restore model weights from previously saved model
lhlB = lhl.eval(session=self.sess)
print lhlA == lhlB
lhlA
и lhlB
- это последние скрытые веса слоя до и после восстановления и по моему коду они совпадают полностью, а именно сохраненная модель не загружается в сессию. Что я делаю не так?