Насколько быстрее tensorflow-gpu
с AVX и AVX2 по сравнению с ним без AVX и AVX2?
Я пытался найти ответ с помощью Google, но безуспешно. Трудно перекомпилировать tensorflow-gpu
для Windows. Вот и хочу узнать, стоит ли.
Насколько быстрее tensorflow-gpu
с AVX и AVX2 по сравнению с ним без AVX и AVX2?
Я пытался найти ответ с помощью Google, но безуспешно. Трудно перекомпилировать tensorflow-gpu
для Windows. Вот и хочу узнать, стоит ли.
Если ваши вычисления представляют собой один гигантский матмул на ЦП, вы получите 3-кратное ускорение на Xeon V3 (см. тест здесь). Но также возможно и отсутствие ускорения, по-видимому, потому, что недостаточно времени затрачивается на операции с высокой арифметической интенсивностью, выполняемые на ЦП.
Вот таблица из руководства «Модели высокой производительности» для обучения resnet50 на ЦП с различными оптимизациями. Похоже, вы можете получить ускорение в 2,5 раза с лучшими настройками.
| Optimization | Data Format | Images/Sec | Intra threads | Inter Threads |
: : : (step time) : : :
| ------------ | ----------- | ------------ | ------------- | ------------- |
| AVX2 | NHWC | 6.8 (147ms) | 4 | 0 |
| MKL | NCHW | 6.6 (151ms) | 4 | 1 |
| MKL | NHWC | 5.95 (168ms) | 4 | 1 |
| AVX | NHWC | 4.7 (211ms) | 4 | 0 |
| SSE3 | NHWC | 2.7 (370ms) | 4 | 0 |
Если вы можете скомпилировать оптимизированную версию для Windows, было бы полезно упомянуть об этом в этом выпуске -- https://github.com/yaroslavvb/tensorflow-community-wheels/issues/13, кажется, есть некоторый спрос на такую сборку
C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V140\Microsoft.CppCommon.targets(171,5): error MSB6006: "cmd.exe" e xited with code 1. [C:\tensorflow-cmake\tensorflow\contrib\cmake\build\gemmlowp.vcxproj]
- person Dmitry; 12.09.2017