Есть ли пакет, который содержит функцию подсчета расстояний Левенштейна, которая реализована в виде кода C или Fortran? У меня есть много строк для сравнения, и stringMatch
из MiscPsycho
слишком медленный для этого.
Быстрое расстояние Левенштейна в R?
Ответы (4)
levenshteinDist (из пакета RecordLinkage
) вызывает скомпилированные C код. Попробуйте.
person
George Dontas
schedule
05.07.2010
Просто отметим, что пакет RecordLinkage, по-видимому, больше не поддерживается и был удален из CRAN. Пакет
stringdist
теперь является решением.
- person Brian Stamper; 27.02.2020
И stringdist
в пакете stringdist
делает то же самое, даже быстрее, чем levenshteinDist
при определенных условиях (1 а>)
person
Ben
schedule
28.03.2014
stringdist значительно ускорился по сравнению с тем блогом, на который вы ссылаетесь: теперь он использует несколько ядер.
- person ; 26.02.2016
Вы также можете попробовать stringDist
из Biostrings
person
Aaron Statham
schedule
06.07.2010
Вы также можете использовать levenshtein_distance()
из пакета textTinyR
. Я получил ошибки памяти 'calloc' со всеми другими пакетами, когда дело дошло до больших векторов символов около 30 тыс. символов. У меня работало только textTinyR
!
person
interrobang
schedule
08.03.2020