Всем привет ,
Я расскажу вам, как преобразовать Audio / Speech / .mp3 и другие аудиофайлы в текстовый формат.
Я буду использовать Nodejs, Bluemix (IBM Cloud Plateform). Итак, приступим.
Вы должны выполнить следующие шаги к тому же:
Шаг 1. Зарегистрируйтесь в Bluemix (IBM Cloud Plateform).
Шаг 2. Войдите в Bluemix.
Шаг 3. Создайте сервис преобразования речи в текст. И получите имя пользователя и пароль для преобразования речи в текст. Ссылка: создание сервиса преобразования речи в текст.
Шаг 4: Начните кодирование.
Шаг 5. Создайте файл .js и потребуйте преобразование речи в текст и fs, как показано ниже.
var SpeechToTextV1 = require(‘watson-developer-cloud/speech-to-text/v1’); var fs = require(‘fs’);
Шаг 6. Создайте объект SpeechToText, как показано ниже.
var speech_to_text = new SpeechToTextV1({ username: ‘1234567–8765–4267–9e76-fgff34f’, password: ‘ABCdefghiJK’ });
Шаг 7: Создайте массив и вставьте путь к аудио. В этом массиве может быть много аудиофайлов.
var files = [‘./music/hello.flac’,’./music/somebody2010.flac’];
Шаг 8. Создайте параметры для каждого аудио. Мы сделаем это в цикле for и вызовем Speech_to_text.recognize () для преобразования. Получите ответ и консоль.
for (var file in files) { var params = { audio: fs.createReadStream(files[file]), content_type: ‘audio/flac’, timestamps: true, word_alternatives_threshold: 0.9, keywords: [‘colorado’, ‘tornado’, ‘tornadoes’], keywords_threshold: 0.5 }; speech_to_text.recognize(params, function (error, transcript) { if (error) console.log(‘Error:’, error); else{ console.log(JSON.stringify(transcript, null, 2)); console.log(transcript.results[0].alternatives[0].transcript); } }); }
Поздравляем! Вы сделали это.
Полный код находится здесь:
var SpeechToTextV1 = require(‘watson-developer-cloud/speech-to-text/v1’); var fs = require(‘fs’); var speech_to_text = new SpeechToTextV1({ username: ‘1234567–8765–4267–9e76-fgff34f’, password: ‘ABCdefghiJK’ }); var files = [‘./music/hello.flac’,’./music/somebody2010.flac’]; for (var file in files) { var params = { audio: fs.createReadStream(files[file]), content_type: ‘audio/flac’, timestamps: true, word_alternatives_threshold: 0.9, keywords: [‘colorado’, ‘tornado’, ‘tornadoes’], keywords_threshold: 0.5 }; speech_to_text.recognize(params, function (error, transcript) { if (error) console.log(‘Error:’, error); else console.log(transcript.results[0].alternatives[0].transcript); }); }
КАК ЗАПУСТИТЬ ПРОГРАММУ ВЫШЕ:
/ *********************************************** ************
ИНСТРУКЦИИ:
Шаг 0: проверьте настройки среды. (Если установлен nodejs, удалите все ошибки, если таковые имеются).
Шаг 1. Перейдите в этот каталог через терминал / командную строку.
Шаг 2: Запустите command: node FILE_NAME.js;
Шаг 3: См. сообщение в журнале консоли;
Шаг 4: если шаг 3 выполнен успешно, то у вас есть текстовое сообщение согласно аудио. В противном случае перейдите к Шагу 0.
*************************************************************/