Возникает дилемма — хранить ли весь вопрос, включая уравнения и переменные, или только текст.

Решите неравенство |x − 2| ≥ |x + 5|
или
Решите неравенство

Теперь, глядя на то, что я пытаюсь построить — очевидным ответом будет сохранение текста только потому, что классификатор будет лучше понимать, что он читает. Но если подумать об этом логически и с человеческой точки зрения — я могу легко классифицировать вопрос, просто взглянув на уравнения — текст существует только для того, чтобы я знал, что я должен с этим делать. Но верно и обратное, и уравнения просто усложнят обучение нейронной сети.

Нейронная сеть может видеть эти символы и числа, написанные таким специфическим образом, как способ классификации глав, что в конечном итоге может оказаться полезным. И большинство моих обучающих данных могут содержать такие вопросы:

Решите: | х - 2 | ≥ |х + 5|

Теперь решение не сразу классифицирует имя какой-либо главы, но уравнение делает это. И по этой причине я рассмотрю возможность использования всего текста + уравнений для построения набора обучающих данных.

Первоначально опубликовано на http://manishgotame.wordpress.com 30 июля 2020 г.