0
Я использую BERT Word Embeddings для задачи классификации предложений с 3 метками. Я использую Google Colab для кодирования. Моя проблема в том, что, поскольку мне придется выполнять часть внедрения каждый раз, когда я перезапускаю ядро, есть ли способ сохранить эти вложения слов после их создания? Потому что создание этих вложений занимает много времени.
Код, который я использую для создания вложений слов BERT, -
[get_features(text_list[i]) for text_list[i] in text_list]
Здесь gen_features - это функция, которая возвращает встраивание слов для каждого i в моем списке text_list.
Я читал, что преобразование вложений в неровные тензоры, а затем использование np.save может сделать это. Но на самом деле я не знаю, как это кодировать.
Пожалуйста помоги.