Я прочитал кучу таких сообщений, как:
Я прошел через это и нашел двойной код метафона .
Но алгоритм двойного метафона возвращает кортеж для данной строки, предполагая, что строка является одним словом. Кто-нибудь знает фонетический алгоритм, который работал бы с несколькими словами с одним именем? Если нет, лучше всего просто написать сценарий для подсчета количества слов для каждого слова в этом столбце, а затем запустить двойной метафон для слова в ячейке, которое наиболее часто встречается в моем наборе данных?