Публикации по теме 'audio-processing'
Соперник WaveNet? Stanford U Study моделирует необработанные аудиосигналы в контексте 500 000 сэмплов
Эффективное моделирование долгосрочных зависимостей позволяет формировать выходные данные новой модели на основе предыдущих входных данных и имеет решающее значение при работе с более длинными текстовыми, аудио- или видеоконтекстами. Однако при моделировании долгосрочных зависимостей аудиосигналов даже меньшие временные масштабы могут давать сотни тысяч выборок. Пока трансформатор…
Нейронные сети против пылесосов, или как мы обезвредили звонки ВКонтакте
В наши дни, какой другой способ реализовать подавление шума, кроме нейронных сетей? Но мы здесь не для того, чтобы просто указать на очевидное и раствориться в воздухе.
Меня зовут Виталий Шутов, я инженер по машинному обучению на VK.com и в этой статье мы поговорим о развитии технологий шумоподавления и улучшения речи. Мы рассмотрим варианты реализации того и другого, а также какие настройки для видеозвонков у нас в VK.com закончились.
Мы собираемся рассмотреть здесь довольно..
Кто это сказал?
Целью моего проекта было создание модели, которая могла бы определять пол говорящего по аудиозаписи его разговора. Начиная этот проект, у меня не было опыта манипулирования аудиоданными или рабочим процессом предварительной обработки аудио. Пока я смотрел на другие проекты в этой области, я не смог найти примеров конвейеров предварительной обработки звука, работающих с человеческой речью. Существует множество доступных библиотек, предназначенных для извлечения признаков из музыкальных..
Обработка звука в TensorFlow
Реализация кратковременного преобразования Фурье
Я обнаружил, что обработка звука в TensorFlow затруднена, вот мое решение
Есть бесчисленное множество способов выполнить обработку звука. Обычный процесс проведения экспериментов с искусственными нейронными сетями в TensorFlow с аудиовходами - это сначала предварительно обработать звук, а затем передать его в нейронную сеть.
Но что происходит, когда кто-то хочет выполнить обработку звука где-то в середине графа вычислений?..
Вопросы по теме 'audio-processing'
Синхронизация в C # для анализа звука в реальном времени
Я пытаюсь определить количество ударов в минуту по звуку в реальном времени на C #. Но я улавливаю не музыку, а постоянный звук постукивания. Моя проблема заключается в определении времени между этими нажатиями, чтобы я мог определить «число нажатий...
3700 просмотров
schedule
20.05.2024
пример кода iphone для задержки и эха
Кто-нибудь знает, где я могу найти пример кода для обработки звука, чтобы имитировать эффект эха или задержки? В настоящее время я использую AVAudioPlayer для воспроизведения сэмплов и хотел бы наложить эффекты сверху. Все ссылки, которые я видел до...
445 просмотров
schedule
24.07.2022
Распознавание музыки и обработка сигналов
Я хочу построить что-то похожее на Tunatic или Midomi (попробуйте их, если не знаете, что они делают), и мне интересно, какие алгоритмы мне придется использовать; Я имею представление о работе таких приложений примерно так:
иметь большую...
9253 просмотров
schedule
27.12.2022
iPhone AudioQueue - чтение входящих аудиоданных для определения BPM
Я пытаюсь определить количество ударов в минуту (BPM) с микрофона, используя звуковую энергию, я думаю, что понял часть, определяющую BPM, но у меня возникли небольшие проблемы с получением данных RAW.
Пример основан на приложении Apples SpeakHere...
2053 просмотров
schedule
15.07.2023
Есть ли в Android библиотека для обработки звука, например OpenCV при обработке изображений?
Насколько я понимаю, OpenCV - это де-факто библиотека для программирования обработки изображений. Интересно, есть ли такая библиотека C или C ++ для обработки звука. Я в основном хочу отфильтровать эти необработанные волны с микрофона и...
2236 просмотров
schedule
21.05.2022
java изменить темп миди-файла без секвенсора?
Мне нужно получить информацию о миди-файле до его воспроизведения, что я могу сделать, но мне нужно сделать это с альтернативными битами в минуту для файлов в минуту.
Итак, есть ли способ установить bpm миди-файла и, следовательно, повлиять на...
1712 просмотров
schedule
22.10.2023
Разбивка видео на кадры с помощью python
Я пытаюсь написать программу, которая удаляет кадры видео, в которых нет определенного символа. Мой общий план:
Разделить звук с видео
Разбить видео на кадры
Пропустите кадры через подпрограмму, которая ищет символ, проверяя пиксели, где они...
2151 просмотров
schedule
13.11.2022
Извлечение характеристик звука с использованием БПФ, PSD и STFT и поиск наиболее мощных частот
1) Предположим, у меня есть коэффициенты FFT и STFT, полученные с использованием F = fft(x) и S = spectrogram(x) . Как эти коэффициенты можно использовать в качестве звуковых характеристик? (Здесь функция звука используется как в смысле...
4851 просмотров
schedule
12.05.2022
Как проверить алгоритм среднеквадратичного значения уровня звука
Мое приложение. вычисляет уровень шума и пиковую частоту входного звука. Я использовал БПФ, чтобы получить массив буферов shorts[], и это код: bufferSize = 1024, sampleRate = 44100
int bufferSize = AudioRecord.getMinBufferSize(sapleRate,...
4255 просмотров
schedule
08.06.2022
Преобразователь голоса для аудиофайлов
У меня есть несколько аудиофайлов на разные голоса (только произнесенные слова, без музыки и шума). Я стремлюсь изменить все эти аудиозаписи, например, на один стандартный голос "мужской" голос.
Например:
Ввод: аудиофайл говорит «Hello World»...
5229 просмотров
schedule
07.05.2023
необходимо понять, как AudioRecord и AudioTrack работают для захвата и воспроизведения необработанного PCM
Я использую следующий код в потоке для захвата необработанных звуковых образцов с микрофона и воспроизведения их через динамик.
public void run(){
short[] lin = new short[SIZE_OF_RECORD_ARRAY];
int num = 0;
//...
1446 просмотров
schedule
02.12.2023
Как отключить обработку вывода звука на телефоне htc с Android
Я пытаюсь измерить звуковой путь от динамика к микрофону на двух разных телефонах: htc Wildfire S под управлением Android 2.3.5 и htc One X под управлением Android 4.0.3. Используя Eclipse, я написал приложение, в котором звуковые файлы...
1605 просмотров
schedule
12.08.2023
Изменение высоты звука и частоты записываемого звука
Я пытался отрегулировать высоту звука записи звука с помощью кода из:
http://developer.android.com/guide/topics/media/audio-capture.html
Я предполагаю, что эту настройку следует производить с помощью MediaRecorder ....
5343 просмотров
schedule
03.06.2022
Отсечение файла Wav при воспроизведении аудиофайла в MATLAB
Вот моя проблема. Я реализую фильтры высоких и низких частот в непрерывной и дискретной временной области, без использования встроенных функций MATLAB или панели инструментов обработки сигналов. Мне нужно отфильтровать загруженный файл WAV. У меня...
3134 просмотров
schedule
10.06.2022
Визуализатор звука Java
Я пытаюсь создать звуковой визуализатор Java, но я совершенно не знаю, как получить байты из извлеченного аудио сразу после их обработки в режиме реального времени. Я мог бы синхронизировать программу с wav-файлом, но это не то, что я хочу делать, я...
11208 просмотров
schedule
29.11.2022
Методы кастомной реализации TargetDataLine не вызываются
Я попытался работать с пакетом javax.sound.sampled.
Я попытался реализовать свою собственную версию TargetDataLine (на данный момент для целей тестирования). Однако, к моему большому разочарованию, когда я закончил и попытался «воспроизвести» его,...
144 просмотров
schedule
05.12.2023
Как читать 24-битные данные IMediaSample PCM
У меня есть следующий метод, который собирает данные PCM из IMediaSample в поплавки для БПФ:
public int PCMDataCB(IntPtr Buffer, int Length, ref TDSStream Stream, out float[] singleChannel)
{
int numSamples = Length / (Stream.Bits...
729 просмотров
schedule
27.12.2023
Временная задержка звуковых файлов с использованием взаимной корреляции
Я пытаюсь ускорить свой алгоритм оценки временной задержки между двумя звуковыми файлами в Java. Моя идея состояла в том, чтобы использовать взаимную корреляцию и искать наибольшее значение, которое дает мне количество задержанных выборок.
Я...
2364 просмотров
schedule
11.10.2022
Предложение по методу классификации и модели машинного обучения для классификации звуков окружающей среды
В настоящее время у меня есть проблема с Классификацией звуков окружающей среды. Я хочу использовать звуковую классификацию для обнаружения определенного типа коллированного звука (который действительно отличается от других и очень легко распознается...
145 просмотров
schedule
03.12.2023
БПФ в файле .WAV
Я пытаюсь получить быстрое преобразование Фурье определенной части сигнала, поступающего из файла .wav.
Файл .wav представляет собой повторение сигнала каждые 0,6 секунды.
Я пытаюсь понять, как получить повторение 10 раз и сравнить, чтобы...
676 просмотров
schedule
22.11.2023