у меня есть 500 каталогов и 1000 файлов (каждый около 3-4 тыс. строк) для каждого каталога. я хочу запустить одну и ту же программу clojure (уже написанную) для каждого из этих файлов. у меня 4 восьмиядерных сервера. как лучше распределить процессы по этим ядрам? Каскалог (hadoop + clojure)?
в основном, программа читает файл a, использует сторонний Java jar для выполнения вычислений и вставляет результаты в БД
обратите внимание, что: 1. возможность использования сторонних библиотек/jar является обязательной 2. нет никаких запросов