Я пытаюсь преобразовать аудиофайл со следующими атрибутами, используя Google Speech to Text API.
1) Необработанный файл 2) Частота дискретизации: 16000 3) Битрейт: 16 4) Тип аудио: моно
Я использую следующий код Python для получения текстового файла
service_request = service.speech().asyncrecognize(
body={
'config': {
'encoding': 'LINEAR16', # raw 16-bit signed LE samples
'sampleRate': 16000, # 16 khz
'languageCode': 'en-US', # a BCP-47 language tag
},
'audio': {
'uri':'gs://xxxxxxxxx/english.raw'
}
})
response = service_request.execute()
print(json.dumps(response))
Эта логика работает хорошо, но по какой-то причине транскрипция возвращает только одну минуту записи и игнорирует остальные.
Почему это происходит, может ли кто-нибудь помочь мне?