Публикации по тегам audio-processing

Публикации по теме 'audio-processing'

Соперник WaveNet? Stanford U Study моделирует необработанные аудиосигналы в контексте 500 000 сэмплов

Эффективное моделирование долгосрочных зависимостей позволяет формировать выходные данные новой модели на основе предыдущих входных данных и имеет решающее значение при работе с более длинными текстовыми, аудио- или видеоконтекстами. Однако при моделировании долгосрочных зависимостей аудиосигналов даже меньшие временные масштабы могут давать сотни тысяч выборок. Пока трансформатор…

Нейронные сети против пылесосов, или как мы обезвредили звонки ВКонтакте

В наши дни, какой другой способ реализовать подавление шума, кроме нейронных сетей? Но мы здесь не для того, чтобы просто указать на очевидное и раствориться в воздухе. Меня зовут Виталий Шутов, я инженер по машинному обучению на VK.com и в этой статье мы поговорим о развитии технологий шумоподавления и улучшения речи. Мы рассмотрим варианты реализации того и другого, а также какие настройки для видеозвонков у нас в VK.com закончились. Мы собираемся рассмотреть здесь довольно..

Кто это сказал?

Целью моего проекта было создание модели, которая могла бы определять пол говорящего по аудиозаписи его разговора. Начиная этот проект, у меня не было опыта манипулирования аудиоданными или рабочим процессом предварительной обработки аудио. Пока я смотрел на другие проекты в этой области, я не смог найти примеров конвейеров предварительной обработки звука, работающих с человеческой речью. Существует множество доступных библиотек, предназначенных для извлечения признаков из музыкальных..

Обработка звука в TensorFlow

Реализация кратковременного преобразования Фурье Я обнаружил, что обработка звука в TensorFlow затруднена, вот мое решение Есть бесчисленное множество способов выполнить обработку звука. Обычный процесс проведения экспериментов с искусственными нейронными сетями в TensorFlow с аудиовходами - это сначала предварительно обработать звук, а затем передать его в нейронную сеть. Но что происходит, когда кто-то хочет выполнить обработку звука где-то в середине графа вычислений?..

Вопросы по теме 'audio-processing'

Синхронизация в C # для анализа звука в реальном времени

Я пытаюсь определить количество ударов в минуту по звуку в реальном времени на C #. Но я улавливаю не музыку, а постоянный звук постукивания. Моя проблема заключается в определении времени между этими нажатиями, чтобы я мог определить «число нажатий...

3700 просмотров

c# audio-processing sampling

20.05.2024

пример кода iphone для задержки и эха

Кто-нибудь знает, где я могу найти пример кода для обработки звука, чтобы имитировать эффект эха или задержки? В настоящее время я использую AVAudioPlayer для воспроизведения сэмплов и хотел бы наложить эффекты сверху. Все ссылки, которые я видел до...

445 просмотров

iphone delay audio-processing echo

24.07.2022

Распознавание музыки и обработка сигналов

Я хочу построить что-то похожее на Tunatic или Midomi (попробуйте их, если не знаете, что они делают), и мне интересно, какие алгоритмы мне придется использовать; Я имею представление о работе таких приложений примерно так: иметь большую...

9253 просмотров

python php audio audio-processing signal-processing

27.12.2022

iPhone AudioQueue - чтение входящих аудиоданных для определения BPM

Я пытаюсь определить количество ударов в минуту (BPM) с микрофона, используя звуковую энергию, я думаю, что понял часть, определяющую BPM, но у меня возникли небольшие проблемы с получением данных RAW. Пример основан на приложении Apples SpeakHere...

2053 просмотров

iphone audio-processing core-audio audioqueue

15.07.2023

Есть ли в Android библиотека для обработки звука, например OpenCV при обработке изображений?

Насколько я понимаю, OpenCV - это де-факто библиотека для программирования обработки изображений. Интересно, есть ли такая библиотека C или C ++ для обработки звука. Я в основном хочу отфильтровать эти необработанные волны с микрофона и...

2236 просмотров

c++ android audio-processing

21.05.2022

java изменить темп миди-файла без секвенсора?

Мне нужно получить информацию о миди-файле до его воспроизведения, что я могу сделать, но мне нужно сделать это с альтернативными битами в минуту для файлов в минуту. Итак, есть ли способ установить bpm миди-файла и, следовательно, повлиять на...

1712 просмотров

java sequence audio-processing midi

22.10.2023

Разбивка видео на кадры с помощью python

Я пытаюсь написать программу, которая удаляет кадры видео, в которых нет определенного символа. Мой общий план: Разделить звук с видео Разбить видео на кадры Пропустите кадры через подпрограмму, которая ищет символ, проверяя пиксели, где они...

2151 просмотров

python ffmpeg video-processing audio-processing wxpython

13.11.2022

Извлечение характеристик звука с использованием БПФ, PSD и STFT и поиск наиболее мощных частот

1) Предположим, у меня есть коэффициенты FFT и STFT, полученные с использованием F = fft(x) и S = spectrogram(x) . Как эти коэффициенты можно использовать в качестве звуковых характеристик? (Здесь функция звука используется как в смысле...

4851 просмотров

matlab feature-extraction audio-processing fft

12.05.2022

Как проверить алгоритм среднеквадратичного значения уровня звука

Мое приложение. вычисляет уровень шума и пиковую частоту входного звука. Я использовал БПФ, чтобы получить массив буферов shorts[], и это код: bufferSize = 1024, sampleRate = 44100 int bufferSize = AudioRecord.getMinBufferSize(sapleRate,...

4255 просмотров

android frequency audio-processing signal-processing

08.06.2022

Преобразователь голоса для аудиофайлов

У меня есть несколько аудиофайлов на разные голоса (только произнесенные слова, без музыки и шума). Я стремлюсь изменить все эти аудиозаписи, например, на один стандартный голос "мужской" голос. Например: Ввод: аудиофайл говорит «Hello World»...

5229 просмотров

java voice-recognition audio-processing audio-recording javasound

07.05.2023

необходимо понять, как AudioRecord и AudioTrack работают для захвата и воспроизведения необработанного PCM

Я использую следующий код в потоке для захвата необработанных звуковых образцов с микрофона и воспроизведения их через динамик. public void run(){ short[] lin = new short[SIZE_OF_RECORD_ARRAY]; int num = 0; //...

1446 просмотров

android audio audio-processing audiotrack audiorecord

02.12.2023

Как отключить обработку вывода звука на телефоне htc с Android

Я пытаюсь измерить звуковой путь от динамика к микрофону на двух разных телефонах: htc Wildfire S под управлением Android 2.3.5 и htc One X под управлением Android 4.0.3. Используя Eclipse, я написал приложение, в котором звуковые файлы...

1605 просмотров

android eclipse audio-processing adt htc-android

12.08.2023

Изменение высоты звука и частоты записываемого звука

Я пытался отрегулировать высоту звука записи звука с помощью кода из: http://developer.android.com/guide/topics/media/audio-capture.html Я предполагаю, что эту настройку следует производить с помощью MediaRecorder ....

5343 просмотров

android java audio audio-processing

03.06.2022

Отсечение файла Wav при воспроизведении аудиофайла в MATLAB

Вот моя проблема. Я реализую фильтры высоких и низких частот в непрерывной и дискретной временной области, без использования встроенных функций MATLAB или панели инструментов обработки сигналов. Мне нужно отфильтровать загруженный файл WAV. У меня...

3134 просмотров

matlab audio-processing signal-processing lowpass-filter

10.06.2022

Визуализатор звука Java

Я пытаюсь создать звуковой визуализатор Java, но я совершенно не знаю, как получить байты из извлеченного аудио сразу после их обработки в режиме реального времени. Я мог бы синхронизировать программу с wav-файлом, но это не то, что я хочу делать, я...

11208 просмотров

java audio audio-processing real-time-java

29.11.2022

Методы кастомной реализации TargetDataLine не вызываются

Я попытался работать с пакетом javax.sound.sampled. Я попытался реализовать свою собственную версию TargetDataLine (на данный момент для целей тестирования). Однако, к моему большому разочарованию, когда я закончил и попытался «воспроизвести» его,...

144 просмотров

java audio audio-processing javax.sound.sampled

05.12.2023

Как читать 24-битные данные IMediaSample PCM

У меня есть следующий метод, который собирает данные PCM из IMediaSample в поплавки для БПФ: public int PCMDataCB(IntPtr Buffer, int Length, ref TDSStream Stream, out float[] singleChannel) { int numSamples = Length / (Stream.Bits...

729 просмотров

audio c# audio-processing pcm directshow

27.12.2023

Временная задержка звуковых файлов с использованием взаимной корреляции

Я пытаюсь ускорить свой алгоритм оценки временной задержки между двумя звуковыми файлами в Java. Моя идея состояла в том, чтобы использовать взаимную корреляцию и искать наибольшее значение, которое дает мне количество задержанных выборок. Я...

2364 просмотров

java audio-processing signal-processing cross-correlation

11.10.2022

Предложение по методу классификации и модели машинного обучения для классификации звуков окружающей среды

В настоящее время у меня есть проблема с Классификацией звуков окружающей среды. Я хочу использовать звуковую классификацию для обнаружения определенного типа коллированного звука (который действительно отличается от других и очень легко распознается...

145 просмотров

machine-learning audio classification audio-processing

03.12.2023

БПФ в файле .WAV

Я пытаюсь получить быстрое преобразование Фурье определенной части сигнала, поступающего из файла .wav. Файл .wav представляет собой повторение сигнала каждые 0,6 секунды. Я пытаюсь понять, как получить повторение 10 раз и сравнить, чтобы...

676 просмотров

matlab audio-processing fft

22.11.2023