Рисование формы волны с помощью AVAssetReader

Я читаю песню из библиотеки iPod с помощью assetUrl (в коде она называется audioUrl). Я могу воспроизвести ее разными способами, я могу ее вырезать, я могу сделать некоторую обработку, но ... я действительно не понимаю, что я буду с этим делать. CMSampleBufferRef, чтобы получить данные для рисования формы волны! Мне нужна информация о пиковых значениях, как я могу получить это (может быть, другим) способом?

    AVAssetTrack * songTrack = [audioUrl.tracks objectAtIndex:0];
    AVAssetReaderTrackOutput * output = [[AVAssetReaderTrackOutput alloc] initWithTrack:songTrack outputSettings:nil];
    [reader addOutput:output];
    [output release];

    NSMutableData * fullSongData = [[NSMutableData alloc] init];
    [reader startReading];

    while (reader.status == AVAssetReaderStatusReading){

        AVAssetReaderTrackOutput * trackOutput = 
        (AVAssetReaderTrackOutput *)[reader.outputs objectAtIndex:0];

        CMSampleBufferRef sampleBufferRef = [trackOutput copyNextSampleBuffer];

        if (sampleBufferRef){/* what I gonna do with this? */}

Пожалуйста помогите!

iFreeman 17.02.2011 источник

Ответы (4)

arrow_upward
263
arrow_downward

Искал похожую вещь и решил "накатить свой". Я понимаю, что это старый пост, но на случай, если кто-то еще его ищет, вот мое решение. это относительно быстро и грязно и нормализует изображение до «полного масштаба». изображения, которые он создает, являются «широкими», т.е. вам нужно поместить их в UIScrollView или иным образом управлять отображением.

это основано на некоторых ответах на этот вопрос

Образец выходных данных

образец сигнала

РЕДАКТИРОВАТЬ: Я добавил логарифмическую версию методов усреднения и рендеринга, альтернативную версию и результаты сравнения см. в конце этого сообщения. Я лично предпочитаю исходную линейную версию, но решил опубликовать ее, на случай, если кто-то сможет улучшить используемый алгоритм.

Вам понадобятся следующие импортированные данные:

#import <MediaPlayer/MediaPlayer.h>
#import <AVFoundation/AVFoundation.h>

Во-первых, общий метод рендеринга, который принимает указатель на усредненные образцы данных
и возвращает UIImage. Обратите внимание, что эти образцы не являются воспроизводимыми аудиосэмплами.

-(UIImage *) audioImageGraph:(SInt16 *) samples
                normalizeMax:(SInt16) normalizeMax
                 sampleCount:(NSInteger) sampleCount 
                channelCount:(NSInteger) channelCount
                 imageHeight:(float) imageHeight {

    CGSize imageSize = CGSizeMake(sampleCount, imageHeight);
    UIGraphicsBeginImageContext(imageSize);
    CGContextRef context = UIGraphicsGetCurrentContext();

    CGContextSetFillColorWithColor(context, [UIColor blackColor].CGColor);
    CGContextSetAlpha(context,1.0);
    CGRect rect;
    rect.size = imageSize;
    rect.origin.x = 0;
    rect.origin.y = 0;

    CGColorRef leftcolor = [[UIColor whiteColor] CGColor];
    CGColorRef rightcolor = [[UIColor redColor] CGColor];

    CGContextFillRect(context, rect);

    CGContextSetLineWidth(context, 1.0);

    float halfGraphHeight = (imageHeight / 2) / (float) channelCount ;
    float centerLeft = halfGraphHeight;
    float centerRight = (halfGraphHeight*3) ; 
    float sampleAdjustmentFactor = (imageHeight/ (float) channelCount) / (float) normalizeMax;

    for (NSInteger intSample = 0 ; intSample < sampleCount ; intSample ++ ) {
        SInt16 left = *samples++;
        float pixels = (float) left;
        pixels *= sampleAdjustmentFactor;
        CGContextMoveToPoint(context, intSample, centerLeft-pixels);
        CGContextAddLineToPoint(context, intSample, centerLeft+pixels);
        CGContextSetStrokeColorWithColor(context, leftcolor);
        CGContextStrokePath(context);

        if (channelCount==2) {
            SInt16 right = *samples++;
            float pixels = (float) right;
            pixels *= sampleAdjustmentFactor;
            CGContextMoveToPoint(context, intSample, centerRight - pixels);
            CGContextAddLineToPoint(context, intSample, centerRight + pixels);
            CGContextSetStrokeColorWithColor(context, rightcolor);
            CGContextStrokePath(context); 
        }
    }

    // Create new image
    UIImage *newImage = UIGraphicsGetImageFromCurrentImageContext();

    // Tidy up
    UIGraphicsEndImageContext();   

    return newImage;
}

Затем метод, который принимает AVURLAsset и возвращает данные изображения PNG

- (NSData *) renderPNGAudioPictogramForAsset:(AVURLAsset *)songAsset {

    NSError * error = nil;
    AVAssetReader * reader = [[AVAssetReader alloc] initWithAsset:songAsset error:&error];
    AVAssetTrack * songTrack = [songAsset.tracks objectAtIndex:0];

    NSDictionary* outputSettingsDict = [[NSDictionary alloc] initWithObjectsAndKeys:
                                        [NSNumber numberWithInt:kAudioFormatLinearPCM],AVFormatIDKey,
                                        //     [NSNumber numberWithInt:44100.0],AVSampleRateKey, /*Not Supported*/
                                        //     [NSNumber numberWithInt: 2],AVNumberOfChannelsKey,    /*Not Supported*/
                                        [NSNumber numberWithInt:16],AVLinearPCMBitDepthKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsBigEndianKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsFloatKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsNonInterleaved,
                                        nil];

    AVAssetReaderTrackOutput* output = [[AVAssetReaderTrackOutput alloc] initWithTrack:songTrack outputSettings:outputSettingsDict];

    [reader addOutput:output];
    [output release];

    UInt32 sampleRate,channelCount;

    NSArray* formatDesc = songTrack.formatDescriptions;
    for(unsigned int i = 0; i < [formatDesc count]; ++i) {
        CMAudioFormatDescriptionRef item = (CMAudioFormatDescriptionRef)[formatDesc objectAtIndex:i];
        const AudioStreamBasicDescription* fmtDesc = CMAudioFormatDescriptionGetStreamBasicDescription (item);
        if(fmtDesc ) {

            sampleRate = fmtDesc->mSampleRate;
            channelCount = fmtDesc->mChannelsPerFrame;

            //    NSLog(@"channels:%u, bytes/packet: %u, sampleRate %f",fmtDesc->mChannelsPerFrame, fmtDesc->mBytesPerPacket,fmtDesc->mSampleRate);
        }
    }

    UInt32 bytesPerSample = 2 * channelCount;
    SInt16 normalizeMax = 0;

    NSMutableData * fullSongData = [[NSMutableData alloc] init];
    [reader startReading];

    UInt64 totalBytes = 0;         
    SInt64 totalLeft = 0;
    SInt64 totalRight = 0;
    NSInteger sampleTally = 0;

    NSInteger samplesPerPixel = sampleRate / 50;

    while (reader.status == AVAssetReaderStatusReading){

        AVAssetReaderTrackOutput * trackOutput = (AVAssetReaderTrackOutput *)[reader.outputs objectAtIndex:0];
        CMSampleBufferRef sampleBufferRef = [trackOutput copyNextSampleBuffer];

        if (sampleBufferRef){
            CMBlockBufferRef blockBufferRef = CMSampleBufferGetDataBuffer(sampleBufferRef);

            size_t length = CMBlockBufferGetDataLength(blockBufferRef);
            totalBytes += length;

            NSAutoreleasePool *wader = [[NSAutoreleasePool alloc] init];

            NSMutableData * data = [NSMutableData dataWithLength:length];
            CMBlockBufferCopyDataBytes(blockBufferRef, 0, length, data.mutableBytes);

            SInt16 * samples = (SInt16 *) data.mutableBytes;
            int sampleCount = length / bytesPerSample;
            for (int i = 0; i < sampleCount ; i ++) {

                SInt16 left = *samples++;
                totalLeft  += left;

                SInt16 right;
                if (channelCount==2) {
                    right = *samples++;
                    totalRight += right;
                }

                sampleTally++;

                if (sampleTally > samplesPerPixel) {

                    left  = totalLeft / sampleTally; 

                    SInt16 fix = abs(left);
                    if (fix > normalizeMax) {
                        normalizeMax = fix;
                    }

                    [fullSongData appendBytes:&left length:sizeof(left)];

                    if (channelCount==2) {
                        right = totalRight / sampleTally; 

                        SInt16 fix = abs(right);
                        if (fix > normalizeMax) {
                            normalizeMax = fix;
                        }

                        [fullSongData appendBytes:&right length:sizeof(right)];
                    }

                    totalLeft   = 0;
                    totalRight  = 0;
                    sampleTally = 0;
                }
            }

           [wader drain];

            CMSampleBufferInvalidate(sampleBufferRef);
            CFRelease(sampleBufferRef);
        }
    }

    NSData * finalData = nil;

    if (reader.status == AVAssetReaderStatusFailed || reader.status == AVAssetReaderStatusUnknown){
        // Something went wrong. return nil

        return nil;
    }

    if (reader.status == AVAssetReaderStatusCompleted){

        NSLog(@"rendering output graphics using normalizeMax %d",normalizeMax);

        UIImage *test = [self audioImageGraph:(SInt16 *) 
                         fullSongData.bytes 
                                 normalizeMax:normalizeMax 
                                  sampleCount:fullSongData.length / 4 
                                 channelCount:2
                                  imageHeight:100];

        finalData = imageToData(test);
    }        

    [fullSongData release];
    [reader release];

    return finalData;
}

Расширенный вариант:, наконец, если вы хотите иметь возможность воспроизводить звук с помощью AVAudioPlayer, вам необходимо кэшировать его в папку кэша пакета ваших приложений. Поскольку я делал это, я решил также кэшировать данные изображения и обернул все это в категорию UIImage. вам необходимо включить это предложение с открытым исходным кодом для извлечения аудио и некоторый код из здесь для обработки фоновой потоковой передачи Особенности.

сначала несколько определений и несколько общих методов класса для обработки имен путей и т. д.

//#define imgExt @"jpg"
//#define imageToData(x) UIImageJPEGRepresentation(x,4)

#define imgExt @"png"
#define imageToData(x) UIImagePNGRepresentation(x)

+ (NSString *) assetCacheFolder  {
    NSArray  *assetFolderRoot = NSSearchPathForDirectoriesInDomains(NSCachesDirectory, NSUserDomainMask, YES);
    return [NSString stringWithFormat:@"%@/audio", [assetFolderRoot objectAtIndex:0]];
 }

+ (NSString *) cachedAudioPictogramPathForMPMediaItem:(MPMediaItem*) item {
    NSString *assetFolder = [[self class] assetCacheFolder];
    NSNumber * libraryId = [item valueForProperty:MPMediaItemPropertyPersistentID];
    NSString *assetPictogramFilename = [NSString stringWithFormat:@"asset_%@.%@",libraryId,imgExt];
    return [NSString stringWithFormat:@"%@/%@", assetFolder, assetPictogramFilename];
}

+ (NSString *) cachedAudioFilepathForMPMediaItem:(MPMediaItem*) item {
    NSString *assetFolder = [[self class] assetCacheFolder];

    NSURL    * assetURL = [item valueForProperty:MPMediaItemPropertyAssetURL];
    NSNumber * libraryId = [item valueForProperty:MPMediaItemPropertyPersistentID];

    NSString *assetFileExt = [[[assetURL path] lastPathComponent] pathExtension];
    NSString *assetFilename = [NSString stringWithFormat:@"asset_%@.%@",libraryId,assetFileExt];
    return [NSString stringWithFormat:@"%@/%@", assetFolder, assetFilename];
}

+ (NSURL *) cachedAudioURLForMPMediaItem:(MPMediaItem*) item {
    NSString *assetFilepath = [[self class] cachedAudioFilepathForMPMediaItem:item];
    return [NSURL fileURLWithPath:assetFilepath];
}

Теперь о методе инициализации, который делает "свое дело"

- (id) initWithMPMediaItem:(MPMediaItem*) item 
           completionBlock:(void (^)(UIImage* delayedImagePreparation))completionBlock  {

    NSFileManager *fman = [NSFileManager defaultManager];
    NSString *assetPictogramFilepath = [[self class] cachedAudioPictogramPathForMPMediaItem:item];

    if ([fman fileExistsAtPath:assetPictogramFilepath]) {

        NSLog(@"Returning cached waveform pictogram: %@",[assetPictogramFilepath lastPathComponent]);

        self = [self initWithContentsOfFile:assetPictogramFilepath];
        return self;
    }

    NSString *assetFilepath = [[self class] cachedAudioFilepathForMPMediaItem:item];

    NSURL *assetFileURL = [NSURL fileURLWithPath:assetFilepath];

    if ([fman fileExistsAtPath:assetFilepath]) {

        NSLog(@"scanning cached audio data to create UIImage file: %@",[assetFilepath lastPathComponent]);

        [assetFileURL retain];
        [assetPictogramFilepath retain];

        [NSThread MCSM_performBlockInBackground: ^{

            AVURLAsset *asset = [[AVURLAsset alloc] initWithURL:assetFileURL options:nil];
            NSData *waveFormData = [self renderPNGAudioPictogramForAsset:asset]; 

            [waveFormData writeToFile:assetPictogramFilepath atomically:YES];

            [assetFileURL release];
            [assetPictogramFilepath release];

            if (completionBlock) {

                [waveFormData retain];
                [NSThread MCSM_performBlockOnMainThread:^{

                    UIImage *result = [UIImage imageWithData:waveFormData];

                    NSLog(@"returning rendered pictogram on main thread (%d bytes %@ data in UIImage %0.0f x %0.0f pixels)",waveFormData.length,[imgExt uppercaseString],result.size.width,result.size.height);

                    completionBlock(result);

                    [waveFormData release];
                }];
            }
        }];

        return nil;

    } else {

        NSString *assetFolder = [[self class] assetCacheFolder];

        [fman createDirectoryAtPath:assetFolder withIntermediateDirectories:YES attributes:nil error:nil];

        NSLog(@"Preparing to import audio asset data %@",[assetFilepath lastPathComponent]);

        [assetPictogramFilepath retain];
        [assetFileURL retain];

        TSLibraryImport* import = [[TSLibraryImport alloc] init];
        NSURL    * assetURL = [item valueForProperty:MPMediaItemPropertyAssetURL];

         [import importAsset:assetURL toURL:assetFileURL completionBlock:^(TSLibraryImport* import) {
            //check the status and error properties of
            //TSLibraryImport

            if (import.error) {

                NSLog (@"audio data import failed:%@",import.error);

            } else{
                NSLog (@"Creating waveform pictogram file: %@", [assetPictogramFilepath lastPathComponent]);
                AVURLAsset *asset = [[AVURLAsset alloc] initWithURL:assetFileURL options:nil];
                NSData *waveFormData = [self renderPNGAudioPictogramForAsset:asset]; 

                [waveFormData writeToFile:assetPictogramFilepath atomically:YES];

                if (completionBlock) {
                     [waveFormData retain];
                    [NSThread MCSM_performBlockOnMainThread:^{

                        UIImage *result = [UIImage imageWithData:waveFormData];
                        NSLog(@"returning rendered pictogram on main thread (%d bytes %@ data in UIImage %0.0f x %0.0f pixels)",waveFormData.length,[imgExt uppercaseString],result.size.width,result.size.height);

                        completionBlock(result);

                        [waveFormData release];
                    }];
                }
            }

            [assetPictogramFilepath release];
            [assetFileURL release];

        }  ];

        return nil;
    }
}

Пример вызова этого:

-(void) importMediaItem {

    MPMediaItem* item = [self mediaItem];

    // since we will be needing this for playback, save the url to the cached audio.
    [url release];
    url = [[UIImage cachedAudioURLForMPMediaItem:item] retain];

    [waveFormImage release];

    waveFormImage = [[UIImage alloc ] initWithMPMediaItem:item completionBlock:^(UIImage* delayedImagePreparation){

        waveFormImage = [delayedImagePreparation retain];
        [self displayWaveFormImage];
    }];

    if (waveFormImage) {
        [waveFormImage retain];
        [self displayWaveFormImage];
    }
}

Логарифмическая версия методов усреднения и рендеринга

#define absX(x) (x<0?0-x:x)
#define minMaxX(x,mn,mx) (x<=mn?mn:(x>=mx?mx:x))
#define noiseFloor (-90.0)
#define decibel(amplitude) (20.0 * log10(absX(amplitude)/32767.0))

-(UIImage *) audioImageLogGraph:(Float32 *) samples
                normalizeMax:(Float32) normalizeMax
                 sampleCount:(NSInteger) sampleCount 
                channelCount:(NSInteger) channelCount
                 imageHeight:(float) imageHeight {

    CGSize imageSize = CGSizeMake(sampleCount, imageHeight);
    UIGraphicsBeginImageContext(imageSize);
    CGContextRef context = UIGraphicsGetCurrentContext();

    CGContextSetFillColorWithColor(context, [UIColor blackColor].CGColor);
    CGContextSetAlpha(context,1.0);
    CGRect rect;
    rect.size = imageSize;
    rect.origin.x = 0;
    rect.origin.y = 0;

    CGColorRef leftcolor = [[UIColor whiteColor] CGColor];
    CGColorRef rightcolor = [[UIColor redColor] CGColor];

    CGContextFillRect(context, rect);

    CGContextSetLineWidth(context, 1.0);

    float halfGraphHeight = (imageHeight / 2) / (float) channelCount ;
    float centerLeft = halfGraphHeight;
    float centerRight = (halfGraphHeight*3) ; 
    float sampleAdjustmentFactor = (imageHeight/ (float) channelCount) / (normalizeMax - noiseFloor) / 2;

    for (NSInteger intSample = 0 ; intSample < sampleCount ; intSample ++ ) {
        Float32 left = *samples++;
        float pixels = (left - noiseFloor) * sampleAdjustmentFactor;
        CGContextMoveToPoint(context, intSample, centerLeft-pixels);
        CGContextAddLineToPoint(context, intSample, centerLeft+pixels);
        CGContextSetStrokeColorWithColor(context, leftcolor);
        CGContextStrokePath(context);

        if (channelCount==2) {
            Float32 right = *samples++;
            float pixels = (right - noiseFloor) * sampleAdjustmentFactor;
            CGContextMoveToPoint(context, intSample, centerRight - pixels);
            CGContextAddLineToPoint(context, intSample, centerRight + pixels);
            CGContextSetStrokeColorWithColor(context, rightcolor);
            CGContextStrokePath(context); 
        }
    }

    // Create new image
    UIImage *newImage = UIGraphicsGetImageFromCurrentImageContext();

    // Tidy up
    UIGraphicsEndImageContext();   

    return newImage;
}

- (NSData *) renderPNGAudioPictogramLogForAsset:(AVURLAsset *)songAsset {

    NSError * error = nil;
    AVAssetReader * reader = [[AVAssetReader alloc] initWithAsset:songAsset error:&error];
    AVAssetTrack * songTrack = [songAsset.tracks objectAtIndex:0];

    NSDictionary* outputSettingsDict = [[NSDictionary alloc] initWithObjectsAndKeys:
                                        [NSNumber numberWithInt:kAudioFormatLinearPCM],AVFormatIDKey,
                                        //     [NSNumber numberWithInt:44100.0],AVSampleRateKey, /*Not Supported*/
                                        //     [NSNumber numberWithInt: 2],AVNumberOfChannelsKey,    /*Not Supported*/

                                        [NSNumber numberWithInt:16],AVLinearPCMBitDepthKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsBigEndianKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsFloatKey,
                                        [NSNumber numberWithBool:NO],AVLinearPCMIsNonInterleaved,
                                        nil];

    AVAssetReaderTrackOutput* output = [[AVAssetReaderTrackOutput alloc] initWithTrack:songTrack outputSettings:outputSettingsDict];

    [reader addOutput:output];
    [output release];

    UInt32 sampleRate,channelCount;

    NSArray* formatDesc = songTrack.formatDescriptions;
    for(unsigned int i = 0; i < [formatDesc count]; ++i) {
        CMAudioFormatDescriptionRef item = (CMAudioFormatDescriptionRef)[formatDesc objectAtIndex:i];
        const AudioStreamBasicDescription* fmtDesc = CMAudioFormatDescriptionGetStreamBasicDescription (item);
        if(fmtDesc ) {

            sampleRate = fmtDesc->mSampleRate;
            channelCount = fmtDesc->mChannelsPerFrame;

            //    NSLog(@"channels:%u, bytes/packet: %u, sampleRate %f",fmtDesc->mChannelsPerFrame, fmtDesc->mBytesPerPacket,fmtDesc->mSampleRate);
        }
    }

    UInt32 bytesPerSample = 2 * channelCount;
    Float32 normalizeMax = noiseFloor;
    NSLog(@"normalizeMax = %f",normalizeMax);
    NSMutableData * fullSongData = [[NSMutableData alloc] init];
    [reader startReading];

    UInt64 totalBytes = 0; 
    Float64 totalLeft = 0;
    Float64 totalRight = 0;
    Float32 sampleTally = 0;

    NSInteger samplesPerPixel = sampleRate / 50;

    while (reader.status == AVAssetReaderStatusReading){

        AVAssetReaderTrackOutput * trackOutput = (AVAssetReaderTrackOutput *)[reader.outputs objectAtIndex:0];
        CMSampleBufferRef sampleBufferRef = [trackOutput copyNextSampleBuffer];

        if (sampleBufferRef){
            CMBlockBufferRef blockBufferRef = CMSampleBufferGetDataBuffer(sampleBufferRef);

            size_t length = CMBlockBufferGetDataLength(blockBufferRef);
            totalBytes += length;

            NSAutoreleasePool *wader = [[NSAutoreleasePool alloc] init];

            NSMutableData * data = [NSMutableData dataWithLength:length];
            CMBlockBufferCopyDataBytes(blockBufferRef, 0, length, data.mutableBytes);

            SInt16 * samples = (SInt16 *) data.mutableBytes;
            int sampleCount = length / bytesPerSample;
            for (int i = 0; i < sampleCount ; i ++) {

                Float32 left = (Float32) *samples++;
                left = decibel(left);
                left = minMaxX(left,noiseFloor,0);
                totalLeft  += left;

                Float32 right;
                if (channelCount==2) {
                    right = (Float32) *samples++;
                    right = decibel(right);
                    right = minMaxX(right,noiseFloor,0);
                    totalRight += right;
                }

                sampleTally++;

                if (sampleTally > samplesPerPixel) {

                    left  = totalLeft / sampleTally; 
                    if (left > normalizeMax) {
                        normalizeMax = left;
                    }

                   // NSLog(@"left average = %f, normalizeMax = %f",left,normalizeMax);

                    [fullSongData appendBytes:&left length:sizeof(left)];

                    if (channelCount==2) {
                        right = totalRight / sampleTally; 

                        if (right > normalizeMax) {
                            normalizeMax = right;
                        }

                        [fullSongData appendBytes:&right length:sizeof(right)];
                    }

                    totalLeft   = 0;
                    totalRight  = 0;
                    sampleTally = 0;
                }
            }

           [wader drain];

            CMSampleBufferInvalidate(sampleBufferRef);
            CFRelease(sampleBufferRef);
        }
    }

    NSData * finalData = nil;

    if (reader.status == AVAssetReaderStatusFailed || reader.status == AVAssetReaderStatusUnknown){
        // Something went wrong. Handle it.
    }

    if (reader.status == AVAssetReaderStatusCompleted){
        // You're done. It worked.

        NSLog(@"rendering output graphics using normalizeMax %f",normalizeMax);

        UIImage *test = [self audioImageLogGraph:(Float32 *) fullSongData.bytes 
                                 normalizeMax:normalizeMax 
                                  sampleCount:fullSongData.length / (sizeof(Float32) * 2) 
                                 channelCount:2
                                  imageHeight:100];

        finalData = imageToData(test);
    }

    [fullSongData release];
    [reader release];

    return finalData;
}

результаты сравнения

Linear
Линейный график для начала "Warm It Up" от Acme Swing Company

Логарифмический график для начала "Warm It Up" от Acme Swing Company

unsynchronized 12.09.2011

comment

Это очень полный и полезный ответ. На самом деле это пограничный учебник, который вы могли бы подумать о том, чтобы разместить в блоге или что-то в этом роде. Я бы проголосовал за вас на 10, если бы мог. - Daniel G. Wilson; 26.10.2011

comment

Да, вам действительно стоит написать учебник или запись в блоге ... с примером проекта;) - Daniel; 21.12.2011

comment

Не знаю, насколько это быстро, но работает! Мне пришлось добавить / изменить несколько вещей, поскольку вы жестко запрограммировали несколько предположений, например, двухканальный звук. Я также нашел следующее удобное средство для расчета samplesPerPixel (способ, которым вы назначили, что казалось произвольным? / 50 ??) NSTimeInterval duration = (float) songAsset.duration.value / (float) songAsset.duration.timescale; NSLog (@ Длительность записи:% f сек., Длительность); - horseshoe7; 20.03.2012

comment

Я также хочу обновить его для графики сетчатки и, возможно, превратить метод UIImage * в метод drawRect: и иметь возможность добавить выделенную область. СПАСИБО за отличную отправную точку. AVFoundation и библиотеки нижнего уровня все еще немного пугают относительно неопытных. - horseshoe7; 20.03.2012

comment

Хотел бы я снова проголосовать за вас! Вопрос: можно ли динамически устанавливать примитивные типы? потому что существует много кода, который можно использовать повторно, если бы вы могли указать только во время выполнения, что хотите использовать SInt16 или Float32. Могу ли я не просто делать линейные и логарифмические данные с помощью Float32? - horseshoe7; 23.03.2012

comment

Этот ответ действительно заслуживает поддержки. - Tirth; 13.08.2012

comment

Этот ответ выглядит великолепно. Кто-нибудь может посоветовать, как превратить это в плагин для телефонного разговора? Что либо сохраняет форму волны как png, либо выводит строку данных для построения в html / canvas. Спасибо - Mulhoon; 01.03.2013

comment

Откуда взялся этот imageToData() метод? Мой код не компилируется из-за этого метода. Также мне нужно было добавить гораздо больше фреймворков, чтобы избавиться от ошибок компоновщика. - Peterdk; 28.04.2013

comment

@peterdk есть #define для imageToData (x) в начале - я сделал это таким образом, чтобы вы могли легко определить представление jpg или png без необходимости пробираться через код. они просто оболочки вокруг UIImagePNGRepresentation () и UIImageJPEGRepresentation (), которые определены в UIGraphics.h (см. developer.apple.com/library/ios/documentation/UIKit/Reference/) - unsynchronized; 28.04.2013

comment

Как мне правильно показать только один канал? Изменить channelCount = 1 неверно - Tien Nguyen; 12.10.2013

comment

Спасибо за это. Я использовал это в качестве отправной точки для элемента управления какао, который добавляет некоторые другие функции, такие как отображение прогресса игры - указана в источнике github.com/fulldecent/FDWaveformView - William Entriken; 19.10.2013

comment

Спасибо за такой отличный ответ. Мне было интересно, есть ли способ ускорить процесс, на моем iPhone 5 требуется около 3 секунд, чтобы нарисовать форму волны 3-минутного музыкального файла. - laltin; 14.07.2016

comment

Всякий раз, когда я пробовал этот ответ, используя типы данных, при условии, что я получаю ошибку времени выполнения арифметического переполнения, казалось многообещающим, но не работает при переводе на быстрый. - James Wolfe; 02.11.2020

arrow_upward
5
arrow_downward

Вы должны иметь возможность получить буфер звука из своего sampleBuffRef, а затем перебирать эти значения для построения формы волны:

CMBlockBufferRef buffer = CMSampleBufferGetDataBuffer( sampleBufferRef ); CMItemCount numSamplesInBuffer = CMSampleBufferGetNumSamples(sampleBufferRef); AudioBufferList audioBufferList; CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer( sampleBufferRef, NULL, &audioBufferList, sizeof(audioBufferList), NULL, NULL, kCMSampleBufferFlag_AudioBufferList_Assure16ByteAlignment, &buffer ); // this copies your audio out to a temp buffer but you should be able to iterate through this buffer instead SInt32* readBuffer = (SInt32 *)malloc(numSamplesInBuffer * sizeof(SInt32)); memcpy( readBuffer, audioBufferList.mBuffers[0].mData, numSamplesInBuffer*sizeof(SInt32));

Joel    22.05.2011

arrow_upward
3
arrow_downward

Другой подход с использованием Swift 5 и использованием AVAudioFile:

///Gets the audio file from an URL, downsaples and draws into the sound layer. func drawSoundWave(fromURL url:URL, fromPosition:Int64, totalSeconds:UInt32, samplesSecond:CGFloat) throws{ print("\(logClassName) Drawing sound from \(url)") do{ waveViewInfo.samplesSeconds = samplesSecond //Get audio file and format from URL let audioFile = try AVAudioFile(forReading: url) waveViewInfo.format = audioFile.processingFormat audioFile.framePosition = fromPosition * Int64(waveViewInfo.format.sampleRate) //Getting the buffer let frameCapacity:UInt32 = totalSeconds * UInt32(waveViewInfo.format.sampleRate) guard let audioPCMBuffer = AVAudioPCMBuffer(pcmFormat: waveViewInfo.format, frameCapacity: frameCapacity) else{ throw AppError("Unable to get the AVAudioPCMBuffer") } try audioFile.read(into: audioPCMBuffer, frameCount: frameCapacity) let audioPCMBufferFloatValues:[Float] = Array(UnsafeBufferPointer(start: audioPCMBuffer.floatChannelData?.pointee, count: Int(audioPCMBuffer.frameLength))) waveViewInfo.points = [] waveViewInfo.maxValue = 0 for index in stride(from: 0, to: audioPCMBufferFloatValues.count, by: Int(audioFile.fileFormat.sampleRate) / Int(waveViewInfo.samplesSeconds)){ let aSample = CGFloat(audioPCMBufferFloatValues[index]) waveViewInfo.points.append(aSample) let fix = abs(aSample) if fix > waveViewInfo.maxValue{ waveViewInfo.maxValue = fix } } print("\(logClassName) Finished the points - Count = \(waveViewInfo.points.count) / Max = \(waveViewInfo.maxValue)") populateSoundImageView(with: waveViewInfo) } catch{ throw error } } ///Converts the sound wave in to a UIImage func populateSoundImageView(with waveViewInfo:WaveViewInfo){ let imageSize:CGSize = CGSize(width: CGFloat(waveViewInfo.points.count),//CGFloat(waveViewInfo.points.count) * waveViewInfo.sampleSpace, height: frame.height) let drawingRect = CGRect(origin: .zero, size: imageSize) UIGraphicsBeginImageContextWithOptions(imageSize, false, 0) defer { UIGraphicsEndImageContext() } print("\(logClassName) Converting sound view in rect \(drawingRect)") guard let context:CGContext = UIGraphicsGetCurrentContext() else{ return } context.setFillColor(waveViewInfo.backgroundColor.cgColor) context.setAlpha(1.0) context.fill(drawingRect) context.setLineWidth(1.0) // context.setLineWidth(waveViewInfo.lineWidth) let sampleAdjustFactor = imageSize.height / waveViewInfo.maxValue for pointIndex in waveViewInfo.points.indices{ let pixel = waveViewInfo.points[pointIndex] * sampleAdjustFactor context.move(to: CGPoint(x: CGFloat(pointIndex), y: middleY - pixel)) context.addLine(to: CGPoint(x: CGFloat(pointIndex), y: middleY + pixel)) context.setStrokeColor(waveViewInfo.strokeColor.cgColor) context.strokePath() } // for pointIndex in waveViewInfo.points.indices{ // // let pixel = waveViewInfo.points[pointIndex] * sampleAdjustFactor // // context.move(to: CGPoint(x: CGFloat(pointIndex) * waveViewInfo.sampleSpace, y: middleY - pixel)) // context.addLine(to: CGPoint(x: CGFloat(pointIndex) * waveViewInfo.sampleSpace, y: middleY + pixel)) // // context.setStrokeColor(waveViewInfo.strokeColor.cgColor) // context.strokePath() // // } // var xIncrement:CGFloat = 0 // for point in waveViewInfo.points{ // // let normalizedPoint = point * sampleAdjustFactor // // context.move(to: CGPoint(x: xIncrement, y: middleY - normalizedPoint)) // context.addLine(to: CGPoint(x: xIncrement, y: middleX + normalizedPoint)) // context.setStrokeColor(waveViewInfo.strokeColor.cgColor) // context.strokePath() // // xIncrement += waveViewInfo.sampleSpace // // } guard let soundWaveImage = UIGraphicsGetImageFromCurrentImageContext() else{ return } soundWaveImageView.image = soundWaveImage // //In case of handling sample space in for // updateWidthConstraintValue(soundWaveImage.size.width) updateWidthConstraintValue(soundWaveImage.size.width * waveViewInfo.sampleSpace) }

ГДЕ

class WaveViewInfo { var format:AVAudioFormat! var samplesSeconds:CGFloat = 50 var lineWidth:CGFloat = 0.20 var sampleSpace:CGFloat = 0.20 var strokeColor:UIColor = .red var backgroundColor:UIColor = .clear var maxValue:CGFloat = 0 var points:[CGFloat] = [CGFloat]() }

На данный момент печатает только одну звуковую волну, но ее можно расширить. Хорошо то, что вы можете распечатать звуковую дорожку по частям.

Reimond Hill    27.03.2019

comment

как насчет потокового аудио в реальном времени? - mojtaba al moussawi; 23.06.2019

comment

подход, но быть другим. Лучше всего заполнить буфер данными и нарисовать его, но это мой гость. - Reimond Hill; 26.06.2019

arrow_upward
0
arrow_downward

Небольшой рефакторинг из приведенных выше ответов (с использованием AVAudioFile)

import AVFoundation import CoreGraphics import Foundation import UIKit class WaveGenerator { private func readBuffer(_ audioUrl: URL) -> UnsafeBufferPointer<Float> { let file = try! AVAudioFile(forReading: audioUrl) let audioFormat = file.processingFormat let audioFrameCount = UInt32(file.length) guard let buffer = AVAudioPCMBuffer(pcmFormat: audioFormat, frameCapacity: audioFrameCount) else { return UnsafeBufferPointer<Float>(_empty: ()) } do { try file.read(into: buffer) } catch { print(error) } // let floatArray = Array(UnsafeBufferPointer(start: buffer.floatChannelData![0], count: Int(buffer.frameLength))) let floatArray = UnsafeBufferPointer(start: buffer.floatChannelData![0], count: Int(buffer.frameLength)) return floatArray } private func generateWaveImage( _ samples: UnsafeBufferPointer<Float>, _ imageSize: CGSize, _ strokeColor: UIColor, _ backgroundColor: UIColor ) -> UIImage? { let drawingRect = CGRect(origin: .zero, size: imageSize) UIGraphicsBeginImageContextWithOptions(imageSize, false, 0) let middleY = imageSize.height / 2 guard let context: CGContext = UIGraphicsGetCurrentContext() else { return nil } context.setFillColor(backgroundColor.cgColor) context.setAlpha(1.0) context.fill(drawingRect) context.setLineWidth(0.25) let max: CGFloat = CGFloat(samples.max() ?? 0) let heightNormalizationFactor = imageSize.height / max / 2 let widthNormalizationFactor = imageSize.width / CGFloat(samples.count) for index in 0 ..< samples.count { let pixel = CGFloat(samples[index]) * heightNormalizationFactor let x = CGFloat(index) * widthNormalizationFactor context.move(to: CGPoint(x: x, y: middleY - pixel)) context.addLine(to: CGPoint(x: x, y: middleY + pixel)) context.setStrokeColor(strokeColor.cgColor) context.strokePath() } guard let soundWaveImage = UIGraphicsGetImageFromCurrentImageContext() else { return nil } UIGraphicsEndImageContext() return soundWaveImage } func generateWaveImage(from audioUrl: URL, in imageSize: CGSize) -> UIImage? { let samples = readBuffer(audioUrl) let img = generateWaveImage(samples, imageSize, UIColor.blue, UIColor.white) return img } }

Использование

let url = Bundle.main.url(forResource: "TEST1.mp3", withExtension: "")! let img = waveGenerator.generateWaveImage(from: url, in: CGSize(width: 600, height: 200))

Learner    01.07.2021

Рисование формы волны с помощью AVAssetReader

Ответы (4)

Вопросы по теме