ошибка spark-submit: неверный максимальный размер кучи: -Xmx4g --jars, но достаточно памяти в системе

Я запускаю искровую работу:

spark-submit --master spark://ai-grisnodedev1:7077 --verbose --conf spark.driver.port=40065 --driver-memory 4g
--jars /opt/seqr/.conda/envs/py37/lib/python3.7/site-packages/hail/hail-all-spark.jar 
--conf spark.driver.extraClassPath=/opt/seqr/.conda/envs/py37/lib/python3.7/site-packages/hail/hail-all-spark.jar 
--conf spark.executor.extraClassPath=./hail-all-spark.jar ./hail_scripts/v02/convert_vcf_to_hail.py ./hgmd_pro_2019.4_hg38.vcf -ht 
--genome-version 38 --output ./hgmd_pro_2019.4_hg38.ht

И команда выдает ошибку:

Неверный максимальный размер кучи: -Xmx4g --jars Ошибка: не удалось создать виртуальную машину Java. Ошибка: Произошло фатальное исключение. Программа будет закрыта.

Я проверил память:

введите здесь описание изображения

Итак, кажется, все в порядке. Я проверил java:

(py37) -bash-4.2$ java -version
openjdk version "1.8.0_232"
OpenJDK Runtime Environment (build 1.8.0_232-b09)
OpenJDK 64-Bit Server VM (build 25.232-b09, mixed mode)

Затем я проверил в Chrome работает ли spark на ai-grisnodedev1:7077 и работает ли он с одним воркером. Если я использую ipython, я могу запустить простой пример install по адресу https://hail.is/docs/0.2/getting_started.html:

import hail as hl
mt = hl.balding_nichols_model(n_populations=3, n_samples=50, n_variants=100)
mt.count()

Итак, Hail, зависящий от Spark, тоже работает. Может быть, моя команда неправильно сформирована или некоторые файлы повреждены? Но тогда ошибка очень вводит в заблуждение. Что я могу сделать, чтобы попытаться отладить эту проблему?


person Nikita Vlasenko    schedule 11.02.2020    source источник


Ответы (1)


Просто разместил вопрос и сразу исправил его, хотя был в отчаянии. Проблема заключалась в том, что я копировал команду в нескольких редакторах и обратно, и, вероятно, после --driver-memory 4g присутствовали некоторые неправильные символы. Я просто удалил пробелы (которые, возможно, не были пробелами) и снова вставил их, и это заработало. Трудно сказать, почему, может быть, tab или newline как-то все испортили. Я использовал Microsoft One Note - возможно, он выполняет некоторые модификации пробелов...

person Nikita Vlasenko    schedule 11.02.2020