Я создал функцию, которая в результате создает матрицу, но я не могу понять, как сделать вывод этой функции пригодным для использования вне среды функции, чтобы я мог, например, сохранить его в файле csv.
Мой код для функции следующий:
создал функцию, которая берет URL-адрес с определенного сайта и возвращает заголовок страницы:
getTitle <- function(url) {
webpage <- readLines(url)
first.row <- webpage[1]
start <- regexpr("<title>", first.row)
end <- regexpr("</title>", first.row)
title <- substr(first.row,start+7,end-1)
return(title)
}
создал функцию, которая принимает вектор URL-адресов и возвращает матрицу n * 2 с URL-адресами и заголовками страниц:
getTitles <- function(pages) {
my.matrix <- matrix(NA, ncol=2, nrow=nrow(pages))
for (i in seq_along(1:nrow(pages))) {
my.matrix[i,1] <- as.character(pages[i,])
my.matrix[i,2] <- getTitle(as.character(pages[i,])) }
return(my.matrix)
print(my.matrix)}
После запуска этих функций в образце файла отсюда http://goo.gl/D9lLZ, который я импортирую с функцией read.csv и именем " mypages" я получаю следующий вывод:
getTitles(mypages)
[,1] [,2]
[1,] "http://support.google.com/adwords/answer/1704395" "Create your first ad campaign - AdWords Help"
[2,] "http://support.google.com/adwords/answer/1704424" "How costs are calculated in AdWords - AdWords Help"
[3,] "http://support.google.com/adwords/answer/2375470" "Organizing your account for success - AdWords Help"
Это именно то, что мне нужно, но я хотел бы иметь возможность экспортировать этот вывод в файл csv или повторно использовать для дальнейших манипуляций. Однако, когда я пытаюсь распечатать (my.matrix), я получаю сообщение об ошибке «Ошибка: объект« my.matrix »не найден»
Я чувствую, что это довольно простой пробел в моих знаниях, но я некоторое время не работал с R и не мог решить эту проблему.
Спасибо! Сергей
x <- getTitles(mypages)
. - person Arun   schedule 14.04.2013