Публикации по теме 'text-analytics'


Что такое тегирование? | Текстовая аналитика
Мы можем найти неструктурированные данные практически в любом тексте в цифровом мире, таком как электронные письма, разговоры в социальных сетях, чаты и т. д. Тегирование, также называемое аннотацией, — это быстро развивающаяся технология, которая классифицирует и группирует данные для анализа. Неструктурированные данные — это информация, которая не была структурирована заранее определенным образом. Короче говоря, каждая отрасль требует анализа таких данных, где бы они ни..

Обобщение извлечения без учителя: сравнительное исследование
Лоран Эль Гауи и Таня Рооста, sumup.ai . Этот пост посвящен экстрактивному резюмированию, цель которого состоит в том, чтобы выделить несколько предложений, которые хорошо резюмируют данный документ или коллекцию документов. Контролируемые подходы стремятся узнать, какие предложения извлекать на основе большого количества примеров; их может быть сложно применить и развернуть на практике, так как они требуют больших и высококачественных обучающих наборов. Неконтролируемые методы не..