В этой статье вы узнаете, как использовать 3modules для автоматизации скучных вещей.

Прежде чем вставлять код в файл Python, убедитесь, что у вас установлен pdfkit (pip install pdfkit) и install wkhtmltopdf.

Представьте, что вы только что скачали множество статей из своего любимого блога по науке о данных в файле *.html и хотите объединить их в файл PDF.

Возможно, вы попытаетесь скопировать все тексты, вставить их в Microsoft Word 2016 и сохранить в формате .PDF.

Это не плохая идея, верно?

Отнюдь не.

Если у вас есть 100+ статей? Я думаю, вы, ребята, не хотите тратить столько времени на вклейку текстов, это скучно.

Так я могу сократить время?

Да, ты можешь.

Мы используем glob, os и pdfkit эти три модуля, чтобы выполнять скучную работу.

Логика программы:

Шаг 1. Импортируйте пакеты
Шаг 2. Установка пути к wkhtmltopdf.exe, чтобы Python мог его использовать
Шаг 3. создать новый список
Шаг 4. Использование цикла for для поиска всех файлов *.html в текущем каталоге с помощью glob и osmodule
Шаг 5. добавить имена файлов *.html в список
Шаг 6. Выведите pdf-файл со списком.
Шаг 7. Начните читать статьи вашего любимого блога

import glob,os
import pdfkit        #pip install pdfkit
path_wkhtmltopdf = r"C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe"
config = pdfkit.configuration(wkhtmltopdf=path_wkhtmltopdf)
newList=[]
for filename in glob.iglob(os.path.join('*.html')):
    newList.append(filename)
    pdfkit.from_file(newList, 'out.pdf', configuration=config)