Настройка суммирования текста Tensorflow: что такое файл рабочей области?

Чтение настройки документации по суммированию текста Tensorflow: https://github.com/tensorflow/models/tree/master/textsum указано clone the code to your workspace and create empty WORKSPACE file.

Я создал новую папку и клонировал https://github.com/tensorflow/tensorflow.git в эту папку, это то, что подразумевается под «клонированием кода в вашу рабочую область»? Что такое пустой файл рабочей области? Это пустой файл с именем «WORKSPACE»?


person blue-sky    schedule 27.08.2016    source источник


Ответы (1)


WORKSPACE — это файл, который bazel (система сборки tensorflow) выполняет поиск в иерархии каталогов, чтобы определить корень проекта.

Вы можете создать простой пустой файл WORKSPACE.

$touch WORKSPACE

в моей настройке я только что создал еще один каталог

cd models
mkdir traintextsum
cd traintextsum
ln -sf ../textsum/ .
mkdir data 
touch WORKSPACE
bazel build -c opt --config=cuda textsum/...

имейте в виду, что модель не обучена. Таким образом, чтобы получить какой-либо значимый результат, вам потребуется набор данных с форматом набора данных Gigaword для обучения.

Набор данных имеет лицензию и, следовательно, не находится в свободном доступе в Интернете (стоит около 6 тысяч долларов или 27 тысяч долларов за годовую подписку).

Я не знаю ни одного другого значимого набора данных, имеющего такой формат, кроме самого Gigaword.

person fabrizioM    schedule 27.08.2016
comment
Я могу использовать модель без Gigaword, потому что ? : github.com/tensorflow/models/blob/master/textsum/README В .md указано, что «в приведенном ниже разделе «Как запустить» пользователи могут использовать игрушечные данные и словарный запас, предоставленные в каталоге data/, для запуска обучения, заменив флаг каталога данных». поэтому замена флага каталога данных дает: bazel-bin/textsum/seq2seq_attention \ --mode=train \ --article_key=article \ --abstract_key=abstract \ --data_path=data/data \ --vocab_path=data/vocab \ --log_root=textsum/log_root \ --train_dir=textsum/log_root/train - person blue-sky; 30.08.2016
comment
@ blue-sky, так что кажется, что нет никакого способа заставить его работать, поскольку он не обучен заранее, а training set, который использовал Google, по-видимому, не бесплатен. - person loretoparisi; 28.10.2016
comment
Я получаю это предупреждение: ПРЕДУПРЕЖДЕНИЕ: значения конфигурации не определены ни в одном файле .rc: cuda после запуска сборки bazel. Мысли? - person vgoklani; 20.12.2016
comment
Пользователи @blue-sky могут использовать игрушечные данные и словарный запас как вам удалось создать модель и запустить, была ли она хорошей моделью? - person Jas; 06.07.2018