Публикации по теме 'audio-processing'


Соперник WaveNet? Stanford U Study моделирует необработанные аудиосигналы в контексте 500 000 сэмплов
Эффективное моделирование долгосрочных зависимостей позволяет формировать выходные данные новой модели на основе предыдущих входных данных и имеет решающее значение при работе с более длинными текстовыми, аудио- или видеоконтекстами. Однако при моделировании долгосрочных зависимостей аудиосигналов даже меньшие временные масштабы могут давать сотни тысяч выборок. Пока трансформатор…

Нейронные сети против пылесосов, или как мы обезвредили звонки ВКонтакте
В наши дни, какой другой способ реализовать подавление шума, кроме нейронных сетей? Но мы здесь не для того, чтобы просто указать на очевидное и раствориться в воздухе. Меня зовут Виталий Шутов, я инженер по машинному обучению на VK.com и в этой статье мы поговорим о развитии технологий шумоподавления и улучшения речи. Мы рассмотрим варианты реализации того и другого, а также какие настройки для видеозвонков у нас в VK.com закончились. Мы собираемся рассмотреть здесь довольно..

Кто это сказал?
Целью моего проекта было создание модели, которая могла бы определять пол говорящего по аудиозаписи его разговора. Начиная этот проект, у меня не было опыта манипулирования аудиоданными или рабочим процессом предварительной обработки аудио. Пока я смотрел на другие проекты в этой области, я не смог найти примеров конвейеров предварительной обработки звука, работающих с человеческой речью. Существует множество доступных библиотек, предназначенных для извлечения признаков из музыкальных..

Обработка звука в TensorFlow
Реализация кратковременного преобразования Фурье Я обнаружил, что обработка звука в TensorFlow затруднена, вот мое решение Есть бесчисленное множество способов выполнить обработку звука. Обычный процесс проведения экспериментов с искусственными нейронными сетями в TensorFlow с аудиовходами - это сначала предварительно обработать звук, а затем передать его в нейронную сеть. Но что происходит, когда кто-то хочет выполнить обработку звука где-то в середине графа вычислений?..

Вопросы по теме 'audio-processing'

Синхронизация в C # для анализа звука в реальном времени
Я пытаюсь определить количество ударов в минуту по звуку в реальном времени на C #. Но я улавливаю не музыку, а постоянный звук постукивания. Моя проблема заключается в определении времени между этими нажатиями, чтобы я мог определить «число нажатий...
3700 просмотров
schedule 20.05.2024

пример кода iphone для задержки и эха
Кто-нибудь знает, где я могу найти пример кода для обработки звука, чтобы имитировать эффект эха или задержки? В настоящее время я использую AVAudioPlayer для воспроизведения сэмплов и хотел бы наложить эффекты сверху. Все ссылки, которые я видел до...
445 просмотров
schedule 24.07.2022

Распознавание музыки и обработка сигналов
Я хочу построить что-то похожее на Tunatic или Midomi (попробуйте их, если не знаете, что они делают), и мне интересно, какие алгоритмы мне придется использовать; Я имею представление о работе таких приложений примерно так: иметь большую...
9253 просмотров

iPhone AudioQueue - чтение входящих аудиоданных для определения BPM
Я пытаюсь определить количество ударов в минуту (BPM) с микрофона, используя звуковую энергию, я думаю, что понял часть, определяющую BPM, но у меня возникли небольшие проблемы с получением данных RAW. Пример основан на приложении Apples SpeakHere...
2053 просмотров

Есть ли в Android библиотека для обработки звука, например OpenCV при обработке изображений?
Насколько я понимаю, OpenCV - это де-факто библиотека для программирования обработки изображений. Интересно, есть ли такая библиотека C или C ++ для обработки звука. Я в основном хочу отфильтровать эти необработанные волны с микрофона и...
2236 просмотров
schedule 21.05.2022

java изменить темп миди-файла без секвенсора?
Мне нужно получить информацию о миди-файле до его воспроизведения, что я могу сделать, но мне нужно сделать это с альтернативными битами в минуту для файлов в минуту. Итак, есть ли способ установить bpm миди-файла и, следовательно, повлиять на...
1712 просмотров
schedule 22.10.2023

Разбивка видео на кадры с помощью python
Я пытаюсь написать программу, которая удаляет кадры видео, в которых нет определенного символа. Мой общий план: Разделить звук с видео Разбить видео на кадры Пропустите кадры через подпрограмму, которая ищет символ, проверяя пиксели, где они...
2151 просмотров

Извлечение характеристик звука с использованием БПФ, PSD и STFT и поиск наиболее мощных частот
1) Предположим, у меня есть коэффициенты FFT и STFT, полученные с использованием F = fft(x) и S = spectrogram(x) . Как эти коэффициенты можно использовать в качестве звуковых характеристик? (Здесь функция звука используется как в смысле...
4851 просмотров

Как проверить алгоритм среднеквадратичного значения уровня звука
Мое приложение. вычисляет уровень шума и пиковую частоту входного звука. Я использовал БПФ, чтобы получить массив буферов shorts[], и это код: bufferSize = 1024, sampleRate = 44100 int bufferSize = AudioRecord.getMinBufferSize(sapleRate,...
4255 просмотров

Преобразователь голоса для аудиофайлов
У меня есть несколько аудиофайлов на разные голоса (только произнесенные слова, без музыки и шума). Я стремлюсь изменить все эти аудиозаписи, например, на один стандартный голос "мужской" голос. Например: Ввод: аудиофайл говорит «Hello World»...
5229 просмотров

необходимо понять, как AudioRecord и AudioTrack работают для захвата и воспроизведения необработанного PCM
Я использую следующий код в потоке для захвата необработанных звуковых образцов с микрофона и воспроизведения их через динамик. public void run(){ short[] lin = new short[SIZE_OF_RECORD_ARRAY]; int num = 0; //...
1446 просмотров

Как отключить обработку вывода звука на телефоне htc с Android
Я пытаюсь измерить звуковой путь от динамика к микрофону на двух разных телефонах: htc Wildfire S под управлением Android 2.3.5 и htc One X под управлением Android 4.0.3. Используя Eclipse, я написал приложение, в котором звуковые файлы...
1605 просмотров

Изменение высоты звука и частоты записываемого звука
Я пытался отрегулировать высоту звука записи звука с помощью кода из: http://developer.android.com/guide/topics/media/audio-capture.html Я предполагаю, что эту настройку следует производить с помощью MediaRecorder ....
5343 просмотров
schedule 03.06.2022

Отсечение файла Wav при воспроизведении аудиофайла в MATLAB
Вот моя проблема. Я реализую фильтры высоких и низких частот в непрерывной и дискретной временной области, без использования встроенных функций MATLAB или панели инструментов обработки сигналов. Мне нужно отфильтровать загруженный файл WAV. У меня...
3134 просмотров

Визуализатор звука Java
Я пытаюсь создать звуковой визуализатор Java, но я совершенно не знаю, как получить байты из извлеченного аудио сразу после их обработки в режиме реального времени. Я мог бы синхронизировать программу с wav-файлом, но это не то, что я хочу делать, я...
11208 просмотров

Методы кастомной реализации TargetDataLine не вызываются
Я попытался работать с пакетом javax.sound.sampled. Я попытался реализовать свою собственную версию TargetDataLine (на данный момент для целей тестирования). Однако, к моему большому разочарованию, когда я закончил и попытался «воспроизвести» его,...
144 просмотров

Как читать 24-битные данные IMediaSample PCM
У меня есть следующий метод, который собирает данные PCM из IMediaSample в поплавки для БПФ: public int PCMDataCB(IntPtr Buffer, int Length, ref TDSStream Stream, out float[] singleChannel) { int numSamples = Length / (Stream.Bits...
729 просмотров
schedule 27.12.2023

Временная задержка звуковых файлов с использованием взаимной корреляции
Я пытаюсь ускорить свой алгоритм оценки временной задержки между двумя звуковыми файлами в Java. Моя идея состояла в том, чтобы использовать взаимную корреляцию и искать наибольшее значение, которое дает мне количество задержанных выборок. Я...
2364 просмотров

Предложение по методу классификации и модели машинного обучения для классификации звуков окружающей среды
В настоящее время у меня есть проблема с Классификацией звуков окружающей среды. Я хочу использовать звуковую классификацию для обнаружения определенного типа коллированного звука (который действительно отличается от других и очень легко распознается...
145 просмотров

БПФ в файле .WAV
Я пытаюсь получить быстрое преобразование Фурье определенной части сигнала, поступающего из файла .wav. Файл .wav представляет собой повторение сигнала каждые 0,6 секунды. Я пытаюсь понять, как получить повторение 10 раз и сравнить, чтобы...
676 просмотров
schedule 22.11.2023