Набор Манделя Брота Использование openCL

Попытка использовать тот же код (вроде того), что я использовал при работе с использованием TBB (потоковые строительные блоки).

У меня нет большого опыта работы с OpenCL, но я думаю, что большая часть основного кода верна. Я считаю, что ошибки находятся в файле .cl, где он выполняет математику.

Вот мой код Мандельброта в TBB:

TBB по Мандельброту

Вот мой код в OpenCL

Mandelbrot OpenCL

Любая помощь будет принята с благодарностью.


person Mike Tarrant    schedule 14.04.2013    source источник
comment
Опубликую мой ответ на это, теперь он работает, в ближайшее время   -  person Mike Tarrant    schedule 19.04.2013


Ответы (2)


Я изменил код в ядре, и все заработало нормально. Мой новый код ядра выглядит следующим образом:

// voronoi kernels

//
// local memory version
//
kernel void voronoiL(write_only image2d_t outputImage)
{
    // get id of element in array
    int x = get_global_id(0);
    int y = get_global_id(1);
    int w = get_global_size(0);
    int h = get_global_size(1);

    float4 result = (float4)(0.0f,0.0f,0.0f,1.0f);
    float MinRe = -2.0f;
    float MaxRe = 1.0f;
    float MinIm = -1.5f;
    float MaxIm = MinIm+(MaxRe-MinRe)*h/w;
    float Re_factor = (MaxRe-MinRe)/(w-1);
    float Im_factor = (MaxIm-MinIm)/(h-1);
    float MaxIterations = 50;


    //C imaginary
    float c_im = MaxIm - y*Im_factor;

    //C real
    float c_re = MinRe + x*Re_factor;

    //Z real
    float Z_re = c_re, Z_im = c_im;

    bool isInside = true;
    bool col2 = false;
    bool col3 = false;
    int iteration =0;

    for(int n=0; n<MaxIterations; n++)
    {
        // Z - real and imaginary
        float Z_re2 = Z_re*Z_re, Z_im2 = Z_im*Z_im;

        //if Z real squared plus Z imaginary squared is greater than c squared
        if(Z_re2 + Z_im2 > 4)
        {
            if(n >= 0 && n <= (MaxIterations/2-1))
            {
                col2 = true;
                isInside = false;
                break;
            }
            else if(n >= MaxIterations/2 && n <= MaxIterations-1)
            {
                col3 = true;
                isInside = false;
                break;
            }
        }
        Z_im = 2*Z_re*Z_im + c_im;
        Z_re = Z_re2 - Z_im2 + c_re;
        iteration++;
    }
    if(col2) 
    { 
        result = (float4)(iteration*0.05f,0.0f, 0.0f, 1.0f);
    }
    else if(col3)
    {
        result = (float4)(255, iteration*0.05f, iteration*0.05f, 1.0f);
    }
    else if(isInside)
    {
        result = (float4)(0.0f, 0.0f, 0.0f, 1.0f);
    }


    write_imagef(outputImage, (int2)(x, y), result);
}

Вы также можете найти его здесь:

https://docs.google.com/file/d/0B6DBARvnB__iUjNSTWJubFhUSDA/edit

person Mike Tarrant    schedule 20.04.2013

См. эту ссылку. Он разработан @eric-bainville. Код процессора, как родной, так и с OpenCL, не оптимален (он не использует SSE/AVX), но я думаю, что код GPU может быть хорошим. Для процессора вы можете немного ускорить код, используя AVX и работая с восемью пикселями одновременно.

http://www.bealto.com/mp-mandelbrot.html

person Community    schedule 15.04.2013
comment
Отлично посмотрю. Спасибо! - person Mike Tarrant; 17.04.2013