Всем привет ,

Я расскажу вам, как преобразовать Audio / Speech / .mp3 и другие аудиофайлы в текстовый формат.

Я буду использовать Nodejs, Bluemix (IBM Cloud Plateform). Итак, приступим.

Вы должны выполнить следующие шаги к тому же:

Шаг 1. Зарегистрируйтесь в Bluemix (IBM Cloud Plateform).

Шаг 2. Войдите в Bluemix.

Шаг 3. Создайте сервис преобразования речи в текст. И получите имя пользователя и пароль для преобразования речи в текст. Ссылка: создание сервиса преобразования речи в текст.

Шаг 4: Начните кодирование.

Шаг 5. Создайте файл .js и потребуйте преобразование речи в текст и fs, как показано ниже.

var SpeechToTextV1 = require(‘watson-developer-cloud/speech-to-text/v1’); 
var fs = require(‘fs’);

Шаг 6. Создайте объект SpeechToText, как показано ниже.

var speech_to_text = new SpeechToTextV1({
 username: ‘1234567–8765–4267–9e76-fgff34f’,
 password: ‘ABCdefghiJK’
 });

Шаг 7: Создайте массив и вставьте путь к аудио. В этом массиве может быть много аудиофайлов.

var files = [‘./music/hello.flac’,’./music/somebody2010.flac’];

Шаг 8. Создайте параметры для каждого аудио. Мы сделаем это в цикле for и вызовем Speech_to_text.recognize () для преобразования. Получите ответ и консоль.

for (var file in files) {
 var params = {
    audio: fs.createReadStream(files[file]),
    content_type: ‘audio/flac’,
    timestamps: true,
    word_alternatives_threshold: 0.9,
    keywords: [‘colorado’, ‘tornado’, ‘tornadoes’],
    keywords_threshold: 0.5
 };
speech_to_text.recognize(params, function (error, transcript) {
 if (error)
      console.log(‘Error:’, error);
 else{
    console.log(JSON.stringify(transcript, null, 2));
    console.log(transcript.results[0].alternatives[0].transcript);
   } 
  });
 }

Поздравляем! Вы сделали это.

Полный код находится здесь:

var SpeechToTextV1 = require(‘watson-developer-cloud/speech-to-text/v1’);
var fs = require(‘fs’);
var speech_to_text = new SpeechToTextV1({
   username: ‘1234567–8765–4267–9e76-fgff34f’,
   password: ‘ABCdefghiJK’
  });
var files = [‘./music/hello.flac’,’./music/somebody2010.flac’];
for (var file in files) {
 var params = {
     audio: fs.createReadStream(files[file]),
     content_type: ‘audio/flac’,
     timestamps: true,
     word_alternatives_threshold: 0.9,
     keywords: [‘colorado’, ‘tornado’, ‘tornadoes’],
     keywords_threshold: 0.5
  };
speech_to_text.recognize(params, function (error, transcript) {
 if (error)
      console.log(‘Error:’, error);
 else
    console.log(transcript.results[0].alternatives[0].transcript);
  });
 }

КАК ЗАПУСТИТЬ ПРОГРАММУ ВЫШЕ:

/ *********************************************** ************
ИНСТРУКЦИИ:

Шаг 0: проверьте настройки среды. (Если установлен nodejs, удалите все ошибки, если таковые имеются).
Шаг 1. Перейдите в этот каталог через терминал / командную строку.
Шаг 2: Запустите command: node FILE_NAME.js;
Шаг 3: См. сообщение в журнале консоли;
Шаг 4: если шаг 3 выполнен успешно, то у вас есть текстовое сообщение согласно аудио. В противном случае перейдите к Шагу 0.

*************************************************************/