Я пытаюсь преобразовать некоторые документы в блоки ответов с помощью службы преобразования документов Watson, используя библиотеку Javascript watson-developer-cloud в Node.js. Некоторые из них (пример находится по внутренней ссылке IBM и представляет собой файл .DOCX) возвращают эту ошибку:
Ошибка: код: ошибка 400: предоставленные данные находятся в формате Office 2007+ XML. Вы звоните в ту часть POI, которая занимается документами OLE2 Office. Вам нужно вызвать другую часть POI для обработки этих данных (например, XSSF вместо HSSF).
Если я попытаюсь преобразовать его через демонстрационный сайт преобразования документов, он, похоже, преобразуется без ошибок. Моя программа загружает файл из источника, записывает его на диск, а затем загружает в сервис преобразования документов через упомянутую выше библиотеку.
Есть ли способ обойти эту ошибку? Учтите, что это преобразование является частью масштабного автоматического преобразования тысяч документов, поэтому ручная обработка таких выбросов невозможна.