Алгоритм ранжирования сводного текста

Каковы преимущества использования алгоритма ранжирования текста для суммирования по сравнению с суммированием BERT? Несмотря на то, что оба они могут использоваться в качестве метода извлечения реферата, есть ли какие-либо особые преимущества для ранжирования текста?


person Asha    schedule 04.07.2020    source источник


Ответы (1)


Реализации TextRank, как правило, легковесны и могут работать быстро даже при ограниченных ресурсах памяти, в то время как модели преобразования, такие как BERT имеют тенденцию быть довольно большими и требуют много памяти. Хотя сообщество TinyML проделало выдающуюся работу по методам запуска моделей глубокого обучения в условиях ограниченных ресурсов, ресурсное преимущество для некоторых вариантов использования.

Некоторыми реализациями TextRank можно управлять, добавляя семантические отношения, которые можно рассматривать как априорную структуру для обогащения используемого графа, или, в некоторых случаях, посредством включения подходов человек в цикле . Они могут обеспечить преимущества по сравнению с моделями обучения с учителем, которые были обучены исключительно на данных. Тем не менее, есть аналогичные усилия для DL в целом (например, вариации на тему переносного обучения), от которых могут извлечь выгоду трансформеры.

Еще одним потенциальным преимуществом является то, что подходы TextRank, как правило, более прозрачны, в то время как модели преобразования могут быть сложными с точки зрения объяснимости. Существуют инструменты, которые очень помогают, но эта проблема становится важной в контексте предвзятости модели и справедливости, этики данных, соблюдения нормативных требований и т. д. на.

Основываясь на личном опыте, я являюсь ведущим коммитером одной из популярных реализаций TextRank с с открытым исходным кодом. Я использую его функции извлекающего суммирования только в тех случаях, когда требуется дешевое и быстрое решение. В противном случае я бы рекомендовал рассмотреть более сложные подходы к обобщению. Например, я рекомендую следить за текущими исследованиями автора TextRank Рады Михалчи и ее аспирантов. в штате Мичиган.

С точки зрения сравнения Какие методы реферирования текста работают лучше? Я бы указал на работу над абстрактным реферированием, особенно недавнюю работу Джон Боханнон и др., в Primer< /а>. Отличные примеры можно найти в ежедневных брифингах исследований CV19, которые их команда создает с использованием понимания естественного языка, графа знаний, абстрактных обобщение и т. д. Эми Хайнейке обсуждает свой подход в Машины для разблокировки потока документов, статей и разговоров о COVID-19.

person Paco    schedule 05.07.2020