Вопросы по теме 'sungridengine'
Condor, Sun Grid Engine или что-то еще?
Я пытаюсь решить, следует ли нам попробовать Condor или Sun Grid Engine на работе (или, возможно, что-то еще).
У нас часто есть много неиспользуемых рабочих станций WinXp. Есть надежда, что мы сможем использовать wake-on-LAN, запускать все наши...
3844 просмотров
schedule
21.09.2023
Получение кода выхода из процесса, отправленного с помощью qsub на Sun Grid Engine
Я хотел бы отправлять задания через qsub на Sun Grid Engine (сейчас: Oracle Grid Engine?). Я не хочу использовать опцию -sync yes или qrsh, потому что я хочу, чтобы моя управляющая программа была однопоточной и могла запускать множество заданий...
4967 просмотров
schedule
16.06.2023
Планирование ресурсов GPU с помощью Sun Grid Engine (SGE)
У нас есть кластер машин, каждая из которых имеет 4 графических процессора. Каждое задание должно иметь возможность запрашивать от 1 до 4 графических процессоров. Вот в чем загвоздка: я бы хотел, чтобы SGE сообщал каждому заданию, какой GPU он...
6384 просмотров
schedule
28.06.2023
Запрос узлов по номерам и их именам в SGE
Как запросить количество узлов (не процессов) при отправке задания в SGE?
например В TORQUE мы можем указать qsub -l nodes=3
Как запросить узлы по их именам в SGE?
например В TORQUE мы можем сделать это с помощью qsub -l...
19232 просмотров
schedule
30.07.2022
Как установить политику планирования двигателя солнечной сетки, чтобы удовлетворить это?
Мы используем движок солнечной сетки (фактически открытую сетку планировщика) в качестве drms. Предположим, у нас есть 3 пользователя: uA, uB, uC. ua отправляет 100000 заданий, затем uB отправляет 10 заданий, затем uC отправляет 1 задание. С...
585 просмотров
schedule
16.02.2024
Пустой файл дампа ядра после ошибки сегментации
Я запускаю программу, и она прервана из-за ошибки сегментации. Проблема в том, что файл дампа ядра создается, но имеет нулевой размер.
Вы слышали о таком случае и как его разрешить?
У меня на диске достаточно места. Я уже выполнил ulimit -c...
11439 просмотров
schedule
28.05.2022
как получить job_id в системе солнечной сетки с помощью qsub
Рассмотрим сценарий «run.sh», который будет отправлен в очередь заданий кластера через qsub.
qsub ./run.sh
Мой вопрос заключается в том, как мне получить номер процесса - тот, который отображается как ${PID} в файлах *.o${PID} и *.e${PID} - в...
835 просмотров
schedule
26.11.2022
Отправка заданий Open MPI в SGE
Я установил openmpi не в /usr/... , а в /commun/data/packages/openmpi/ , он был скомпилирован с --with-sge .
Я добавил новый PE в SGE, как описано в http://docs.oracle.com/cd/E19080-01/n1.grid.eng6/817-5677/6ml49n2c0/index.html
#...
3073 просмотров
schedule
01.10.2023
SGE hold_jid и отлов неудачных заданий
У меня есть сценарий, который отправляет ряд заданий для параллельного выполнения в очереди SGE, и еще один сценарий сбора, который выполняется, когда этот список заданий завершен. Я использую -hold_jid wc_job_list для удержания выполнения скрипта...
681 просмотров
schedule
17.11.2022
SGE: просмотр неотложенных заданий с помощью qstat
Я выполняю некоторые задания в кластере SGE. Есть ли способ заставить qstat показывать мне только те задания, которые не приостановлены?
qstat -s p показывает ожидающие задания, то есть все со статусом "qw" и "hqw".
qstat -s h показывает...
1246 просмотров
schedule
24.09.2022
дублирование заданий в движке солнечной сетки
Когда я запускаю qacct с идентификатором задания, после его завершения я получаю два результата: тот, который я запускаю, и более старое задание с тем же идентификатором задания.
как я могу удалить историю qacct?
Кто-нибудь знает, как это...
150 просмотров
schedule
10.01.2023
Команда не найдена при использовании python для сценариев оболочки
У меня есть этот скрипт Python:
#!/usr/bin/python
print 'hi'
Я пытаюсь отправить этот скрипт как задание для выполнения на вычислительном кластере. Я отправляю его с qsub вот так: qsub myscript.py
Перед запуском я выполнил следующее:...
1132 просмотров
schedule
22.12.2022
Мониторинг производительности кластера StarCluster / Sun Grid Engine
Я немного новичок в использовании StarCluster и SGE. Мне было интересно, что лучше всего использовать для мониторинга «Производительности кластера», то есть для определения того, сколько определенных заданий кластер может выполнять в некоторую...
175 просмотров
schedule
10.01.2023
Grid-движок и общие библиотеки
Мой вопрос: если у меня есть исполняемый файл, для которого требуются некоторые библиотеки, то нужно ли мне устанавливать эти библиотеки на все узлы сетки, или есть способ установить библиотеки на одном узле, а затем поделиться со всеми остальными?...
47 просмотров
schedule
06.01.2023
Sun Grid Engine: имя выходного файла с использованием значения, хранящегося в переменной
Заранее спасибо за помощь.
Я пытаюсь пройти задание, используя
qsub -q myQ myJob.sh
в myJob.sh у меня есть
# Name of the output log file:
temp=$( date +"%s")
out="myPath"
out=$out$temp
#$ -v out
#$ -o $out
unset temp
unset out
Я...
100 просмотров
schedule
03.10.2022
Пакетное задание на люстре не работает: awk: cmd. строка: 1 неожиданный перевод строки или конец строки
Недавно я начал запускать пакетные задания Python в системе Lustre.
Недавно я внес изменения в сценарий оболочки, что привело к ошибке:
awk: cmd. line:1: NR==
awk: cmd. line:1: ^ unexpected newline or end of string
Сценарий выглядит...
476 просмотров
schedule
26.05.2023
Аналог SGE .bashrc?
Когда я отправляю задание с qsub в SGE, оболочка задания не будет читать .bashrc . Есть ли файл, аналогичный .bashrc , который будет считываться оболочкой всех заданий, запущенных с qsub ?
Я знаю, что есть файл .sge_request , но он содержит...
387 просмотров
schedule
19.02.2023
Очистка мертвых узлов от SGE
Мой qstat -g c указывает, что у меня есть несколько мертвых узлов (формально ' cdsuE '):
CLUSTER QUEUE CQLOAD USED RES AVAIL TOTAL aoACDS cdsuE...
1202 просмотров
schedule
29.07.2023
Как запустить задание массива в конвейере из нескольких задержанных заданий, когда количество подзаданий в массиве зависит от результата предыдущего задания
Я пытаюсь написать сценарий bash, который отправляет несколько заданий в кластер (планировщик SGE) и что каждое из них ожидает завершения предыдущего, например:
HOLD_ID=$(qsub JOB1.sh | cut -c 10-16)
HOLD_ID=$(qsub -hold_jid $HOLD_ID JOB2.sh | cut...
173 просмотров
schedule
23.06.2022
Sun Grid Engine, форсируйте одно задание на узел
Я запускаю много повторов одного и того же задания, используя numpy в кластере, который использует механизм солнечной сетки для распределения заданий (звездный кластер). Каждый из моих узлов имеет 2 ядра (c3.large на AWS). Итак, у меня есть 5 узлов,...
793 просмотров
schedule
04.03.2023