В этой статье вы узнаете, как использовать 3modules для автоматизации скучных вещей.
Прежде чем вставлять код в файл Python, убедитесь, что у вас установлен pdfkit (pip install pdfkit) и install wkhtmltopdf.
Представьте, что вы только что скачали множество статей из своего любимого блога по науке о данных в файле *.html и хотите объединить их в файл PDF.
Возможно, вы попытаетесь скопировать все тексты, вставить их в Microsoft Word 2016 и сохранить в формате .PDF.
Это не плохая идея, верно?
Отнюдь не.
Если у вас есть 100+ статей? Я думаю, вы, ребята, не хотите тратить столько времени на вклейку текстов, это скучно.
Так я могу сократить время?
Да, ты можешь.
Мы используем glob, os и pdfkit эти три модуля, чтобы выполнять скучную работу.
Логика программы:
Шаг 1. Импортируйте пакеты
Шаг 2. Установка пути к wkhtmltopdf.exe, чтобы Python мог его использовать
Шаг 3. создать новый список
Шаг 4. Использование цикла for для поиска всех файлов *.html в текущем каталоге с помощью glob и osmodule
Шаг 5. добавить имена файлов *.html в список
Шаг 6. Выведите pdf-файл со списком.
Шаг 7. Начните читать статьи вашего любимого блога
import glob,os import pdfkit #pip install pdfkit path_wkhtmltopdf = r"C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe" config = pdfkit.configuration(wkhtmltopdf=path_wkhtmltopdf) newList=[] for filename in glob.iglob(os.path.join('*.html')): newList.append(filename) pdfkit.from_file(newList, 'out.pdf', configuration=config)