Я пытаюсь извлечь текст из файла .doc
с помощью python. Я видел похожий пост здесь, но это не дает ожидаемого результата.
Я использую утилиту командной строки под названием antiword
с python. когда я использую его с cmd, он отлично сохраняет текст в файле назначения, как и ожидалось, но не работает с python.
def get_doc_text(self, filepath, file):
if file.endswith('.docx'):
text = docx2txt.process(file)
return text
elif file.endswith('.doc'):
doc_file = path.join(filepath, file)
os.system('antiword ' + doc_file + ' > ' + "C:\\res.txt") # it should write into res.txt but it's empty.
subprocess
, а неos.system
, хотя он более подробный, он намного понятнее и надежнее и позволяет с высокой точностью указывать, что вы хотите захватить и как. - person Masklinn   schedule 09.11.2020