Вопросы по теме 'aho-corasick'

Как сгенерировать хэш Aho-Corasick
Недавно я начал разрабатывать антивирусное программное обеспечение с открытым исходным кодом, хотя хэши генерируются с помощью алгоритма Aho-Corasick. Я хотел бы знать, как генерировать хэши Aho-Corasick из исполняемых файлов, так как я почти не...
491 просмотров
schedule 25.06.2022

Как использовать Aho-Corasick для поиска фрагмента текста в заданном наборе строк?
У меня есть код алгоритма Ахо-Корасика. Но я все еще не понимаю, как использовать информацию о состоянии во время процедуры поиска при поиске текста в заданном списке строк. Например, у меня есть список строк [MOSCOW][COLA] , и теперь мне нужно...
1017 просмотров
schedule 02.02.2023

В чем разница между суффиксными ссылками и неудачными ссылками?
В этом семестре я изучаю алгоритмы и прочитал об алгоритме сопоставления строк Ахо-Корасика и алгоритм Укконена для построения суффиксных деревьев. Я прочитал их оба, но не могу понять основных основных различий между ними, за исключением того,...
1223 просмотров

Являются ли суффиксные ссылки в суффиксном дереве такими же, как ребра отказа в автомате ахо-корасика?
Если да, может ли кто-нибудь объяснить назначение суффиксных ссылок в суффиксном дереве для точного сопоставления строк?
218 просмотров
schedule 10.07.2023

Как я могу эффективно найти всех людей, упомянутых в каком-либо тексте, допуская при этом орфографические ошибки?
У меня есть список имен миллионов известных людей (из Викиданных), и мне нужно создать систему, которая эффективно находит всех людей, упомянутых в довольно коротком тексте: это может быть всего одно слово (например, «Эйнштейн») до несколько страниц...
193 просмотров
schedule 09.04.2024

Выходная функция для алгоритма Ахо-Корасика
У меня проблема с реализацией функции вывода для алгоритма Ахо-Корасик. В общем, я не совсем понимаю, как работает функция вывода. Согласно этой статье , в функции goto я вывожу соответствующий шаблонный индекс, например output[currentState] =...
229 просмотров

количество вхождений списка слов в строку с O (n)
Я уже видел этот ответ на аналогичный вопрос: https://stackoverflow.com/a/44311921/5881884 Где алгоритм ahocorasick используется, чтобы показать, существует ли каждое слово в списке в строке или нет с O (n). Но я хочу получить частоту каждого...
393 просмотров