У меня есть около 1500 PDF-файлов, состоящих всего из 1 страницы каждый и имеющих одинаковую структуру (см. http://files.newsnetz.ch/extern/interactive/downloads/BAG_15m_kzh_2012_de.pdf в качестве примера).
То, что я ищу, - это способ перебрать все эти файлы (локально, если возможно) и извлечь фактическое содержимое таблицы (в виде CSV, сохраненного в базе данных SQLite, что угодно).
Я хотел бы сделать это в Node.js, но не смог найти подходящих библиотек для разбора таких вещей. Вы знаете какой-нибудь?
Если это невозможно в Node.js, я мог бы также закодировать его на Python, если есть лучшие доступные методы.