Вопросы по теме 'parallelism-amdahl'

Примеры закона Амдала
Закон Амдала гласит, что максимальное ускорение вычислений, при которых доля S вычислений должна быть выполняется последовательно, переход от 1-процессорной системы к N-процессорной системе составляет не более 1 / (S + [(1 - S)...
3365 просмотров

Закон Амдала: умножение матриц
Я пытаюсь вычислить долю P моего кода, которая может быть распараллелена, чтобы применить закон Амдала и соблюсти теоретическое максимальное ускорение. Мой код большую часть времени тратит на умножение матриц (с использованием библиотеки Eigen)....
431 просмотров

Почему операция «Сравнить и поменять местами» ограничена законом Амдала?
Мартин Томпсон утверждает, , что STM, который опирается на рефери, который опирается на CAS, в конечном итоге будет ограничен законом Амдала . закон Амдала состоит в том, что максимальная производительность параллельной программы ограничена...
139 просмотров

Компьютерная архитектура: ускорение
Это домашнее задание. Проблема: программа имеет 20% доступа к памяти, 50% умножения, а остальное для других функций, не связанных ни с тем, ни с другим. Если требуется общее ускорение в 1,2 раза, то какое ускорение потребуется как для доступа к...
1747 просмотров

Как распараллелить матричную сортировку для цикла?
Я пытаюсь распараллелить цикл for(){...} , используя OpenMP, который занимает несколько "строк" N " таблицы " N*M и сортирует каждую строку в порядке возрастания. Я добавил директивы #pragma omp parallel , #pragma omp for schedule...
281 просмотров

Накладные расходы потокового графа Intel TBB
Вот моя попытка оценить производительность потокового графа Intel TBB. Вот установка: Один широковещательный узел отправляет continue_msg узлам-преемникам N (a broadcast_node<continue_msg> ) Каждый последующий узел выполняет...
727 просмотров

Как использовать закон Амдала (общее ускорение против ускорения)
Вспомните закон Амдала об оценке максимально возможного ускорения. Ответьте на следующие вопросы. У вас есть программа, в которой 40% кода распараллелено на трех процессорах, и только для этой части кода достигается ускорение в 2.3 раза. Какое...
242 просмотров

CyclicDist работает медленнее на нескольких локалях
Я попытался реализовать умножение матриц с помощью модуля CyclicDist . Когда я тестирую одну локаль против двух локалей, одна локаль работает намного быстрее. Это потому, что время для связи между двумя наноплатами Jetson действительно велико,...
82 просмотров

Почему выполнение задачи в потоках OpenMP на самом деле занимает больше времени, чем в последовательном?
Я написал этот код для оценки значения интеграла. Прямой и простой параллельный цикл for() с использованием openmp . Что бы я ни делал, я не могу сократить время работы в параллельном режиме до меньшего, чем в последовательном. В чем...
149 просмотров