Вопросы по теме 'sungridengine'

Condor, Sun Grid Engine или что-то еще?
Я пытаюсь решить, следует ли нам попробовать Condor или Sun Grid Engine на работе (или, возможно, что-то еще). У нас часто есть много неиспользуемых рабочих станций WinXp. Есть надежда, что мы сможем использовать wake-on-LAN, запускать все наши...
3844 просмотров
schedule 21.09.2023

Получение кода выхода из процесса, отправленного с помощью qsub на Sun Grid Engine
Я хотел бы отправлять задания через qsub на Sun Grid Engine (сейчас: Oracle Grid Engine?). Я не хочу использовать опцию -sync yes или qrsh, потому что я хочу, чтобы моя управляющая программа была однопоточной и могла запускать множество заданий...
4967 просмотров

Планирование ресурсов GPU с помощью Sun Grid Engine (SGE)
У нас есть кластер машин, каждая из которых имеет 4 графических процессора. Каждое задание должно иметь возможность запрашивать от 1 до 4 графических процессоров. Вот в чем загвоздка: я бы хотел, чтобы SGE сообщал каждому заданию, какой GPU он...
6384 просмотров
schedule 28.06.2023

Запрос узлов по номерам и их именам в SGE
Как запросить количество узлов (не процессов) при отправке задания в SGE? например В TORQUE мы можем указать qsub -l nodes=3 Как запросить узлы по их именам в SGE? например В TORQUE мы можем сделать это с помощью qsub -l...
19232 просмотров
schedule 30.07.2022

Как установить политику планирования двигателя солнечной сетки, чтобы удовлетворить это?
Мы используем движок солнечной сетки (фактически открытую сетку планировщика) в качестве drms. Предположим, у нас есть 3 пользователя: uA, uB, uC. ua отправляет 100000 заданий, затем uB отправляет 10 заданий, затем uC отправляет 1 задание. С...
585 просмотров
schedule 16.02.2024

Пустой файл дампа ядра после ошибки сегментации
Я запускаю программу, и она прервана из-за ошибки сегментации. Проблема в том, что файл дампа ядра создается, но имеет нулевой размер. Вы слышали о таком случае и как его разрешить? У меня на диске достаточно места. Я уже выполнил ulimit -c...
11439 просмотров

как получить job_id в системе солнечной сетки с помощью qsub
Рассмотрим сценарий «run.sh», который будет отправлен в очередь заданий кластера через qsub. qsub ./run.sh Мой вопрос заключается в том, как мне получить номер процесса - тот, который отображается как ${PID} в файлах *.o${PID} и *.e${PID} - в...
835 просмотров
schedule 26.11.2022

Отправка заданий Open MPI в SGE
Я установил openmpi не в /usr/... , а в /commun/data/packages/openmpi/ , он был скомпилирован с --with-sge . Я добавил новый PE в SGE, как описано в http://docs.oracle.com/cd/E19080-01/n1.grid.eng6/817-5677/6ml49n2c0/index.html #...
3073 просмотров
schedule 01.10.2023

SGE hold_jid и отлов неудачных заданий
У меня есть сценарий, который отправляет ряд заданий для параллельного выполнения в очереди SGE, и еще один сценарий сбора, который выполняется, когда этот список заданий завершен. Я использую -hold_jid wc_job_list для удержания выполнения скрипта...
681 просмотров
schedule 17.11.2022

SGE: просмотр неотложенных заданий с помощью qstat
Я выполняю некоторые задания в кластере SGE. Есть ли способ заставить qstat показывать мне только те задания, которые не приостановлены? qstat -s p показывает ожидающие задания, то есть все со статусом "qw" и "hqw". qstat -s h показывает...
1246 просмотров
schedule 24.09.2022

дублирование заданий в движке солнечной сетки
Когда я запускаю qacct с идентификатором задания, после его завершения я получаю два результата: тот, который я запускаю, и более старое задание с тем же идентификатором задания. как я могу удалить историю qacct? Кто-нибудь знает, как это...
150 просмотров
schedule 10.01.2023

Команда не найдена при использовании python для сценариев оболочки
У меня есть этот скрипт Python: #!/usr/bin/python print 'hi' Я пытаюсь отправить этот скрипт как задание для выполнения на вычислительном кластере. Я отправляю его с qsub вот так: qsub myscript.py Перед запуском я выполнил следующее:...
1132 просмотров
schedule 22.12.2022

Мониторинг производительности кластера StarCluster / Sun Grid Engine
Я немного новичок в использовании StarCluster и SGE. Мне было интересно, что лучше всего использовать для мониторинга «Производительности кластера», то есть для определения того, сколько определенных заданий кластер может выполнять в некоторую...
175 просмотров

Grid-движок и общие библиотеки
Мой вопрос: если у меня есть исполняемый файл, для которого требуются некоторые библиотеки, то нужно ли мне устанавливать эти библиотеки на все узлы сетки, или есть способ установить библиотеки на одном узле, а затем поделиться со всеми остальными?...
47 просмотров
schedule 06.01.2023

Sun Grid Engine: имя выходного файла с использованием значения, хранящегося в переменной
Заранее спасибо за помощь. Я пытаюсь пройти задание, используя qsub -q myQ myJob.sh в myJob.sh у меня есть # Name of the output log file: temp=$( date +"%s") out="myPath" out=$out$temp #$ -v out #$ -o $out unset temp unset out Я...
100 просмотров
schedule 03.10.2022

Пакетное задание на люстре не работает: awk: cmd. строка: 1 неожиданный перевод строки или конец строки
Недавно я начал запускать пакетные задания Python в системе Lustre. Недавно я внес изменения в сценарий оболочки, что привело к ошибке: awk: cmd. line:1: NR== awk: cmd. line:1: ^ unexpected newline or end of string Сценарий выглядит...
476 просмотров
schedule 26.05.2023

Аналог SGE .bashrc?
Когда я отправляю задание с qsub в SGE, оболочка задания не будет читать .bashrc . Есть ли файл, аналогичный .bashrc , который будет считываться оболочкой всех заданий, запущенных с qsub ? Я знаю, что есть файл .sge_request , но он содержит...
387 просмотров
schedule 19.02.2023

Очистка мертвых узлов от SGE
Мой qstat -g c указывает, что у меня есть несколько мертвых узлов (формально ' cdsuE '): CLUSTER QUEUE CQLOAD USED RES AVAIL TOTAL aoACDS cdsuE...
1202 просмотров
schedule 29.07.2023

Как запустить задание массива в конвейере из нескольких задержанных заданий, когда количество подзаданий в массиве зависит от результата предыдущего задания
Я пытаюсь написать сценарий bash, который отправляет несколько заданий в кластер (планировщик SGE) и что каждое из них ожидает завершения предыдущего, например: HOLD_ID=$(qsub JOB1.sh | cut -c 10-16) HOLD_ID=$(qsub -hold_jid $HOLD_ID JOB2.sh | cut...
173 просмотров
schedule 23.06.2022

Sun Grid Engine, форсируйте одно задание на узел
Я запускаю много повторов одного и того же задания, используя numpy в кластере, который использует механизм солнечной сетки для распределения заданий (звездный кластер). Каждый из моих узлов имеет 2 ядра (c3.large на AWS). Итак, у меня есть 5 узлов,...
793 просмотров