Вопросы по теме 'ff'

удалить строки из пакета
С некоторых пор я использую пакет ff для работы с большими данными. Объект R, с которым я работал, имеет около 130 000 000 строк и 14 столбцов. В двух из этих столбцов, «Температура» и «Осадки», отсутствуют значения «NA», поэтому мне нужно удалить...
1217 просмотров
schedule 01.04.2023

Пакет ff в R: как переместить данные с одного диска на другой и изменить имена файлов
Я интенсивно работаю с удивительным пакетом ff и ffbase. Из-за некоторых технических деталей мне приходится работать на моем диске C: с моей сессией R. После этого я перемещаю сгенерированные файлы на свой диск P: (используя вырезание/вставку в...
2045 просмотров
r ff
schedule 23.08.2022

Как связать два столбца ffdf
Предположим, два файла ffdf : library(ff) ff1 <- as.ffdf(data.frame(matrix(rnorm(10*10),ncol=10))) ff2 <- ff1 colnames(ff2) <- 1:10 Как я могу привязать их к столбцам, не загружая их в память? cbind не работает. Есть тот же...
1635 просмотров
schedule 02.05.2023

Сохраните файл больших данных в R для последующей загрузки в Matlab
Я создал числовую матрицу 300000 x 7 в R и хочу работать с ней как в R, так и в Matlab. Однако я не могу создать файл, хорошо читаемый для Matlab. При использовании команды save() с файлом=xx.csv вместо этого распознаются 5 столбцов; с расширением...
934 просмотров
schedule 12.12.2022

Функции для создания и изменения больших данных в R с помощью пакета FF
Я новичок в R и пакете FF и пытаюсь лучше понять, как FF позволяет пользователям работать с большими наборами данных (> 4 ГБ). Я провел значительное количество времени в Интернете в поисках учебных пособий, но те, которые я мог найти, как правило,...
1115 просмотров
schedule 02.09.2023

Как указать colClasses при чтении очень большого CSV-файла в R с помощью read.table.ffdf?
Я пытаюсь прочитать очень большой файл .csv размером около 20 ГБ, используя функцию read.table.ffdf() в пакете "ff", но не могу указать параметр colClasses в read.csv(). Я должен указать параметр colClasses, потому что некоторые столбцы в файле...
5322 просмотров
schedule 16.11.2022

Проблемы производительности с DocumentTermMatrix
Я пытаюсь создать две матрицы терминов документов следующим образом: title_train <- DocumentTermMatrix(title_corpus_train, control = list(dictionary = title_dict)) title_test <- DocumentTermMatrix(title_corpus_test, control = list(dictionary...
201 просмотров
schedule 17.10.2022

R ffdfappend ошибка SIGBUS
У меня есть сценарий R, который использует пакеты ffbase и ff . В Windows скрипт работает нормально. В Linux (другая коробка, но больше оперативной памяти) он вылетает с ошибкой шины (SIGBUS). Информация о сеансе Windows (версия 6.1.7601):...
712 просмотров
schedule 02.08.2023

Чтение данных из нескольких файлов CSV в один объект ffdf
Можно ли загрузить данные сразу из нескольких файлов в ff фрейм данных (ffdf)? Допустим, у меня есть big_file_part1.csv big_file_part2.csv big_file_part3.csv Я знаю, что могу загрузить каждый файл csv в отдельный объект ffdf, а затем...
568 просмотров
schedule 05.01.2023

Не удалось получить доступ к файлу ffdf из .RData
Я загрузил файлы с большими данными ( https://www.kaggle.com/c/avazu-ctr-prediction ) с помощью команды read.csv.ff из пакета ff с помощью следующей команды: train = read.csv.ffdf(file="path to my big data files/train.csv",VERBOSE=TRUE)...
355 просмотров
r ff
schedule 29.08.2022

Функциональность Data.table setDT в пакетах ff/ffbase R
Рассчитать столбец условных средних, в ff/ffbase пакетах. Я ищу функциональность в пакетах ff/ffbase , которые позволяют мне манипулировать данными, как показано ниже с пакетом data.table : library(data.table) irisdf <-...
1212 просмотров
schedule 26.02.2023

Удалить пробел из ff_object в R
У меня есть объект ff. В одном из столбцов, который является строковой переменной, есть пробелы, и я хочу их удалить. Я пробовал следующее: 1). newcol <- gsub("[[:space:]]", "", mydata$mystr) 2). newcol<-...
97 просмотров
schedule 06.06.2023

Постепенно увеличивайте фрейм данных ffdf на диске
Из документации save.ffdf: Использование «save.ffdf» автоматически устанавливает «финализатор» векторов «ff» на «закрыть». Это означает, что данные будут сохранены на диске при удалении объекта или закрытии сеансов R. Данные можно удалить...
385 просмотров
schedule 22.06.2022

Лучший способ обработки больших наборов данных в R
Мне нужно запустить некоторые регрессионные модели и описания для большого набора данных. У меня есть папка с примерно 500 файлами (обновление: файлы txt), которые я хотел бы объединить, и их общий размер составляет 250 ГБ. Я знаю, как объединить...
363 просмотров
schedule 30.06.2022

Объект ffdf потребляет дополнительную оперативную память (в ГБ)
Решил проверить ключевое преимущество пакета ff - минимальное выделение оперативной памяти (характеристики ПК: i5, RAM 8Gb, Win7 64 бит, Rstudio). Согласно описанию пакета, мы можем манипулировать физическими объектами (файлами) так же, как и...
164 просмотров
schedule 02.09.2022

как сделать арифметические операции в объекте ffdf пакета ff
У меня есть скрипт, создающий объект ffdf: library(ff) library(ffbase) setwd("D:/My_package/Personal/R/reading") x<-cbind(rnorm(1:100000000),rnorm(1:100000000),1:100000000) system.time(write.csv2(x,"test.csv",row.names=FALSE)) system.time(x...
231 просмотров
schedule 19.04.2023

Ошибка при чтении большого файла с использованием пакета ff
Я пытаюсь прочитать большой файл (1,51 ГБ) с помощью пакета «ff». Была использована следующая команда: atmins = read.csv.ffdf(file="atmins.csv", header=TRUE, VERBOSE=TRUE, first.rows=10000, next.rows=50000, colClasses=NA)...
328 просмотров
r csv ff
schedule 18.11.2023

Проблема с использованием ff с функцией SVM в библиотеке (e1071)
Я пытаюсь использовать объект ff для запуска исследования классификации svm. Я преобразовал свой кадр данных в объект ff, используя ffdf ‹- as.ffdf(signalDF). Набор данных имеет 1024 столбца и ~ 600 тыс. строк. Когда я запускаю функцию...
56 просмотров
r svm ff
schedule 26.05.2023