Я пытаюсь запустить задание, в котором каждый тип картографа получает другой входной файл. Я знаю, что есть способ сделать это с помощью Java, используя класс MultipleInputs, например:
MultipleInputs.addInputPath(job,new Path(args[0]),TextInputFormat.class,CounterMapper.class);
MultipleInputs.addInputPath(job,new Path(args[1]),TextInputFormat.class,CountertwoMapper.class);
Где CounterMapper.class и CountertwoMapper.class являются соответствующими «типами» картографа.
Я пытаюсь добиться аналогичной функциональности с помощью MrJob для Python или любого другого языка, отличного от Java (пожалуйста, не спросите почему!).
Это изображение похоже на то, что Я хочу добиться.
Любая помощь приветствуется.