Фиксированный:
Ну, это выглядит немного глупо. Выяснилось, что top отображался неправильно, и программы продолжали работать. Возможно, процессорное время стало слишком большим для отображения? В любом случае, программа, кажется, работает нормально, и весь этот вопрос был спорным.
Спасибо (и извините за глупый вопрос).
Оригинальный вопрос:
Я запускаю симуляцию на компьютере с сервером Ubuntu 10.04.3. Короткие пробеги (‹24 часа) работают нормально, но длинные пробеги со временем останавливаются. Под остановкой я подразумеваю, что программа больше не получает процессорного времени, но по-прежнему хранит всю информацию в памяти. Чтобы запустить эти симуляции, я использую SSH и nohup для программы и передаю любой вывод в файл.
Разнообразная информация:
Системе определенно не хватает оперативной памяти. Программе не нужно читать или записывать на жесткий диск до завершения; вычисление выполняется полностью в памяти. Программа не убита, так как у нее все еще есть PID после того, как она остановилась. Я использую openmp, но увеличил максимальное количество процессов, а максимальное время не ограничено. Я нахожу самые большие собственные значения матрицы, используя библиотеку ARPACK fortran.
Любые мысли о том, что вызывает такое поведение или как возобновить мою текущую остановленную программу?
Спасибо
file
, чтобы узнать, собран ли ваш двоичный файл как 32-битная или 64-битная сборка:file your_executable_name
. - person wkl   schedule 16.10.2011