Уже существуют модели проверки орфографии, которые помогают нам находить предлагаемые правильные варианты написания на основе корпуса обученных правильных написаний. Можно ли увеличить степень детализации до «слова» из алфавита, чтобы мы могли иметь даже предложения фраз, например, если введена неправильная фраза, то она должна предлагать ближайшую правильную фразу из корпуса правильных фраз, конечно, она обучается из список допустимых фраз.
Существуют ли какие-либо библиотеки Python, которые уже достигают этой функциональности, или как поступить с этим для существующего большого корпуса фраз золотого стандарта, чтобы получить статистически релевантные предложения?
Примечание: это отличается от проверки орфографии, поскольку алфавиты в программе проверки орфографии конечны, тогда как в корректоре фраз алфавит сам является словом, следовательно, теоретически бесконечен, но мы можем ограничить количество слов из банка фраз.