Вопросы по теме 'parallelism-amdahl'
Примеры закона Амдала
Закон Амдала гласит, что максимальное ускорение вычислений, при которых доля S вычислений должна быть выполняется последовательно, переход от 1-процессорной системы к N-процессорной системе составляет не более
1 / (S + [(1 - S)...
3365 просмотров
schedule
24.06.2023
Закон Амдала: умножение матриц
Я пытаюсь вычислить долю P моего кода, которая может быть распараллелена, чтобы применить закон Амдала и соблюсти теоретическое максимальное ускорение.
Мой код большую часть времени тратит на умножение матриц (с использованием библиотеки Eigen)....
431 просмотров
schedule
19.12.2023
Почему операция «Сравнить и поменять местами» ограничена законом Амдала?
Мартин Томпсон утверждает, , что STM, который опирается на рефери, который опирается на CAS, в конечном итоге будет ограничен законом Амдала . закон Амдала состоит в том, что максимальная производительность параллельной программы ограничена...
139 просмотров
schedule
07.12.2022
Компьютерная архитектура: ускорение
Это домашнее задание.
Проблема: программа имеет 20% доступа к памяти, 50% умножения, а остальное для других функций, не связанных ни с тем, ни с другим. Если требуется общее ускорение в 1,2 раза, то какое ускорение потребуется как для доступа к...
1747 просмотров
schedule
07.05.2023
Как распараллелить матричную сортировку для цикла?
Я пытаюсь распараллелить цикл for(){...} , используя OpenMP, который занимает несколько "строк" N " таблицы " N*M и сортирует каждую строку в порядке возрастания.
Я добавил директивы #pragma omp parallel , #pragma omp for schedule...
281 просмотров
schedule
23.02.2023
Накладные расходы потокового графа Intel TBB
Вот моя попытка оценить производительность потокового графа Intel TBB. Вот установка:
Один широковещательный узел отправляет continue_msg узлам-преемникам N (a broadcast_node<continue_msg> )
Каждый последующий узел выполняет...
727 просмотров
schedule
26.07.2022
Как использовать закон Амдала (общее ускорение против ускорения)
Вспомните закон Амдала об оценке максимально возможного ускорения. Ответьте на следующие вопросы.
У вас есть программа, в которой 40% кода распараллелено на трех процессорах, и только для этой части кода достигается ускорение в 2.3 раза. Какое...
242 просмотров
schedule
22.08.2022
CyclicDist работает медленнее на нескольких локалях
Я попытался реализовать умножение матриц с помощью модуля CyclicDist .
Когда я тестирую одну локаль против двух локалей, одна локаль работает намного быстрее. Это потому, что время для связи между двумя наноплатами Jetson действительно велико,...
82 просмотров
schedule
28.07.2022
Почему выполнение задачи в потоках OpenMP на самом деле занимает больше времени, чем в последовательном?
Я написал этот код для оценки значения интеграла.
Прямой и простой параллельный цикл for() с использованием openmp .
Что бы я ни делал, я не могу сократить время работы в параллельном режиме до меньшего, чем в последовательном.
В чем...
149 просмотров
schedule
17.03.2023