Современные системы преобразования текста в речь (TTS) достигают все более впечатляющих характеристик генерации голоса, близких к человеческим, с точки зрения разборчивости и естественности. Однако отсутствие разнообразных речевых данных затрудняет точное определение множества различных личностей говорящих, просодий и стилей, которые могут…
NaturalSpeech 2 от Microsoft превосходит предыдущие системы TTS в речи и пении Zero Shot…
schedule
05.02.2024