Кто-нибудь знает о библиотеке или программном обеспечении, которое обнаружит неточности в тексте? Например, допустим, у меня есть ...
1. Name 1, Comment 2. Name 2, Comment 3. Name 3 , Comment 5. Name 10, Comment
Это программное обеспечение или библиотека сначала нарезали части текста, которые были бы похожи (очень похоже, что часть программного обеспечения для сжатия кодировала бы повторяющиеся одинаковые части текста, чтобы сжать их), но, используя переменную для устойчивости к ошибкам, она могла бы найти похожие части текста , теперь во многом подобно приложению для сравнения текстов или инструменту сравнения / слияния, он может фактически выделять то, что он считает отличным. Я думаю о создании этого инструмента, но не хочу изобретать велосипед. Если где-то есть что-то, способное на это удаленно, я бы действительно хотел знать, чтобы, возможно, помочь в этом проекте или, по крайней мере, не делать этого. Не говоря уже о том, что этот ответ, возможно, может помочь другим людям, ищущим то же самое, я думаю, что спрос будет достаточно высоким для предложения, поэтому у меня непонятно, что я вообще ничего не могу найти.