У нас есть аудиозаписи с 2 людьми, говорящими по разным каналам. Я пробую официальную документацию для node.js здесь. Прежде всего, я получил ошибку, что размер полезной нагрузки превышает максимальный предел.
ubuntu@ip-xxxx:~/nodejs-docs-samples/speech$ node recognize.js async /home/ubuntu/output.wav
(node:18306) UnhandledPromiseRejectionWarning: Unhandled promise rejection (rejection id: 1): Error: Request payload size exceeds the limit: 10485760 bytes.
Однако в документации только что упоминались ограничения по длине записи, а не по размеру файла. Вот ссылка.
Есть ли обходной путь для этого?
Кроме того, я попытался с меньшим размером файла и получил ошибку конфигурации:
ubuntu@ip-xxx:~/nodejs-docs-samples/speech$ node recognize.js async /home/ubuntu/output2.wav
(node:18291) UnhandledPromiseRejectionWarning: Unhandled promise rejection (rejection id: 1): Error: Invalid Configuration, Does not match Wav File Header.
Wav Header Contents:
Encoding: LINEAR16
Channels: 2
Sample Rate: 16000.
Request Contents:
Encoding: linear16
Channels: 1
Sample Rate: 16000.
Я не уверен, позволяет ли API использовать 2-канальный аудиовход, поскольку я не смог найти такую конфигурацию в документации. Однако я нашел эту ссылку, где предлагается разделить звук на отдельные каналов и использовать их отдельно. Каков рекомендуемый способ сделать это программно?