В нашем приложении мы обрабатываем файлы с помощью Apache Tika. Но есть некоторые файлы (например, *.mov, *.mp4), которые Tika не может обработать и оставляет соответствующий файл *.tmp в папке Temp пользователя. После некоторых исследований я обнаружил, что это известная ошибка: https://issues.apache.org/jira/browse/TIKA-1040?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel
В последнем комментарии пользователь говорит об обходном пути, но он не работает для меня:
final Tika tika = new Tika();
final TikaInputStream fileStream = TikaInputStream.get(/*some InputStream*/);
try {
final String extractedString = tika.parseToString(fileStream);
//do something with the string
} finally {
CloseUtils.close(fileStream);
}
Использование приведенного выше кода по-прежнему оставляет временные файлы в папке Temp. Что может быть решением этого?