Мне нужна помощь в написании программы на основе кода из этих ссылок ссылка1 и ссылка2, который автоматически рассчитает семантическое сходство между a. Последовательные предложения и б. Предложения разделяются 1 промежуточной фразой в целом документе (1000 предложений).
Предоставленный код уже токенизирует и может найти семантическое сходство, но я понятия не имею, как написать новый код, который будет вычислять (и отображать) семантическое сходство между последовательными и «промежуточными» предложениями по всему тексту (а, б). не хочется делать одно и то же снова и снова.