Я пытаюсь загрузить большой архив (~ 1 ТБ) из Glacier, используя пакет Python Boto. Текущий метод, который я использую, выглядит следующим образом:
import os
import boto.glacier
import boto
import time
ACCESS_KEY_ID = 'XXXXX'
SECRET_ACCESS_KEY = 'XXXXX'
VAULT_NAME = 'XXXXX'
ARCHIVE_ID = 'XXXXX'
OUTPUT = 'XXXXX'
layer2 = boto.connect_glacier(aws_access_key_id = ACCESS_KEY_ID,
aws_secret_access_key = SECRET_ACCESS_KEY)
gv = layer2.get_vault(VAULT_NAME)
job = gv.retrieve_archive(ARCHIVE_ID)
job_id = job.id
while not job.completed:
time.sleep(10)
job = gv.get_job(job_id)
if job.completed:
print "Downloading archive"
job.download_to_file(OUTPUT)
Проблема в том, что срок действия идентификатора задания истекает через 24 часа, что недостаточно для получения всего архива. Мне нужно будет разбить загрузку как минимум на 4 части. Как я могу это сделать и записать вывод в один файл?