У меня есть объект tm Corpus, подобный этому:
> summary(corp.eng)
A corpus with 154 text documents
The metadata consists of 2 tag-value pairs and a data frame
Available tags are:
create_date creator
Available variables in the data frame are:
MetaID
Метаданные для каждого документа в корпусе выглядят следующим образом:
> meta(corp.eng[[1]])
Available meta data pairs are:
Author :
DateTimeStamp: 2013-04-18 14:37:24
Description :
Heading :
ID : Smith-John_e.txt
Language : en_CA
Origin :
Я знаю, что могу установить автора одного документа за раз с помощью этого:
meta(corp.eng[[1]],tag="Author") <-
paste(
rev(
unlist(
strsplit(meta(corp.eng[[1]],tag="ID"), c("[-_]"))
)[1:2]
), collapse=' ')
что дает мне такой результат:
> meta(corp.eng[[1]],tag="Author")
[1] "John Smith"
Как мне пакетировать работу?