Я пытаюсь загрузить файлы с веб-сайта, используя urllib, как описано в этой теме: текст ссылки
import urllib
urllib.urlretrieve ("http://www.example.com/songs/mp3.mp3", "mp3.mp3")
Я могу скачать файлы (в основном в формате pdf), но все, что я получаю, это поврежденные файлы, которые невозможно открыть. Я подозреваю, что это потому, что сайт требует авторизации.
Как можно изменить вышеуказанную функцию для обработки файлов cookie? Я уже знаю имена полей формы, которые содержат информацию об имени пользователя и пароле. Когда я печатаю возвращаемые значения urlretrieve, я получаю такие сообщения, как:
a, b = urllib.urlretrieve ("http://www.example.com/songs/mp3.mp3", "mp3.mp3")
print a, b
>> **cache-control:** no-cache, no-store, must-revalidate, s-maxage=300, proxy-revalida
te
>> **connection:** close
Я могу вручную загрузить файлы, если введу их URL-адреса в браузере. Спасибо
mp3.mp3
во что-то вродеmp3.html
и попробуйте открыть его в веб-браузере. - Это нужно для того, чтобы убедиться, что он запрашивает логин - person ccheneson   schedule 22.01.2011