Я пытаюсь выполнить максимальное объединение строк и столбцов на уровне внимания, как описано в приведенной ниже ссылке: http://www.dfki.de/~neumann/ML4QAseminar2016/presentations/Attentive-Pooling-Network.pdf (слайд-15)
Я использую набор текстовых данных, в котором предложение передается в CNN. Каждое слово предложения было вставлено. Код для него следующий:
model.add(Embedding(MAX_NB_WORDS, emb_dim, weights=[embedding_matrix],input_length=MAX_SEQUENCE_LENGTH, trainable=False))
model.add(Conv1D(k, FILTER_LENGTH, border_mode = "valid", activation = "relu"))
Выходные данные CNN имеют форму (Нет, 256). Это действует как вход для слоя внимания. Может ли кто-нибудь предложить, как реализовать максимальное объединение строк или столбцов в keras с тензорным потоком в качестве бэкэнда?