запись в текстовый файл - кодек ascii не может кодировать символ

У меня возникли проблемы с выводом слов из текстового изображения в файл .txt.

import pytesseract
from PIL import Image, ImageEnhance, ImageFilter

text = pytesseract.image_to_string(Image.open("book_image.jpg"))

file = open("text_file","w")
file.write(text)
print(text)

Код, который читает файл изображения и распечатывает слова на изображении, работает нормально. Проблема в том, что когда я пытаюсь взять текст и записать его в файл, я получаю следующую ошибку;

UnicodeEncodeError: кодек 'ascii' не может кодировать символ u'’' в позиции 366: порядковый номер не в диапазоне (128)

Может ли кто-нибудь объяснить, как я могу преобразовать переменную text в строку?


person The Techno Mage    schedule 26.07.2017    source источник


Ответы (2)


Попробуй это:

file = open("text_file", "w", encoding='utf8', errors="ignore")
person Hiadore    schedule 06.03.2019

Также попробуйте:

file.write(text).encode('utf-8').strip()
person Ari    schedule 06.03.2019