Загрузка информации о запуске эксперимента Azure ML из хранилища данных

У меня есть много файлов запуска, созданных путем запуска экспериментов PyTorch Estimator / ScriptRunStep, которые сохраняются в контейнере хранилища BLOB-объектов azureml. Раньше я просматривал эти прогоны на вкладке «Эксперименты» портала ml.azure.com и связывал с этими прогонами теги, чтобы классифицировать и загружать нужные модели.

Однако коллега недавно удалил мое рабочее место. Я создал новый, который подключен к ранее существовавшему контейнеру больших двоичных объектов, поэтому файлы запуска все еще существуют и могут быть доступны в этом новом рабочем пространстве, но они больше не отображаются в средстве просмотра экспериментов на ml.azure.com. Я также не вижу тегов, которые я связал с пробегами.

Есть ли способ загрузить эти старые файлы запусков в средство просмотра экспериментов или можно просматривать только запуски, созданные в текущей рабочей области?

Пример кода scriptrunconfig:

data_ref = DataReference(datastore=ds,
                         data_reference_name="<name>",        
                         path_on_datastore = "<path>")
args = ['--data_dir',   str(data_ref),     
        '--num_epochs', 30,     
        '--lr',         0.01,          
        '--classifier', 'int_ext' ]  

src = ScriptRunConfig(source_directory='.',                       
                      arguments=args,                      
                      compute_target = compute_target,                       
                      environment = env,                       
                      script='train.py') 
src.run_config.data_references = {data_ref.data_reference_name: 
                                  data_ref.to_config()} 

person walexand3r    schedule 25.03.2021    source источник
comment
ай! это отстой! вы правы, что данные по-прежнему хранятся в blob. Можете ли вы рассказать об интересующих вас файлах? Как вы раньше получали к ним доступ из представления экспериментов на вкладке «Выходы + журналы» на странице «Выполнение»?   -  person Anders Swanson    schedule 26.03.2021
comment
Спасибо, что ответили так быстро! Да, я использовал «Выходы» + «Журналы», а также вкладки «Метрики» и «Детали». В идеале я хотел бы иметь возможность видеть показатели выполнения, а также его теги, поскольку они описывают аргументы, которые я дал скрипту. Но глядя сейчас на папку ExperimentRun.dcid ‹experimentUID›, я не вижу, где на самом деле хранятся метрики и теги. У меня есть только журналы azureml и мой выходной каталог, в котором есть model.pth. Так что, может быть, я не могу загрузить эту информацию из файла?   -  person walexand3r    schedule 26.03.2021
comment
Думаю, сейчас мой приоритет - просто найти и зарегистрировать нужные мне model.pths на основе тегов, которые я установил ранее, и оставить запуски позади.   -  person walexand3r    schedule 26.03.2021
comment
Можете ли вы представить имитацию ScriptRunConfig, которые вы обычно предоставляете? Меня интересуют DataReference или Dataset объекты, которые вы поставляете   -  person Anders Swanson    schedule 26.03.2021
comment
возможно, вы захотите отредактировать этот код в своем ответе, поскольку комментарии иногда могут удаляться и их трудно форматировать.   -  person Anders Swanson    schedule 30.03.2021
comment
Вы обязательно должны сначала попробовать скопировать содержимое старого контейнера в новый. и доложи мне   -  person Anders Swanson    schedule 30.03.2021
comment
Добавили код к моему вопросу. Я создал новую рабочую область и скопировал ее для всего большого двоичного объекта azureml, но, к сожалению, в новой рабочей области не отображаются запуски, записанные на вкладке экспериментов. Я открыл заявку в службу поддержки, поэтому я дам вам знать, что они говорят.   -  person walexand3r    schedule 31.03.2021


Ответы (1)


Сожалею о твоей утрате! Во-первых, я бы абсолютно уверен, что вы не сможете восстановить удаленную рабочую область. Определенно стоит открыть заявку на приоритетную поддержку с помощью Azure.

Еще вы можете попробовать:

  1. создать новую рабочую область (которая создаст для вас новую учетную запись хранения для журналов новой рабочей области)
  2. скопируйте данные своей старой рабочей области в учетную запись хранения новой рабочей области.
person Anders Swanson    schedule 27.03.2021
comment
Служба поддержки Azure посоветовала мне сделать то же самое, что и вы, но это не сработало. Они вернулись и сказали, что мне нужно просто воссоздать эксперименты вручную :( Тем не менее, спасибо за вашу помощь, очень признательны! - person walexand3r; 12.04.2021
comment
@ walexand3r ой! жаль это слышать. Вы научили меня быть более осторожным в отношении того, у кого есть разрешение на участие в наших группах! - person Anders Swanson; 13.04.2021