Вопросы по теме 'sparkr'

потоковая передача в sparkR?
Я использую Spark в Scala некоторое время. Сейчас я изучаю pySpark и SparkR. Я не вижу упоминаний о потоковой передаче для PySpark и SparkR. Кто-нибудь знает, можете ли вы выполнять потоковую передачу Spark при использовании Python и R?
1912 просмотров
schedule 03.09.2023

Не удалось вызвать функцию sparkRSQL.init
Я новичок в Spark и пытался запустить пример, упомянутый на странице SparkR. Приложив некоторые усилия, я смог установить sparkR на свою машину и запустить базовый пример подсчета слов. Однако, когда я пытаюсь запустить: library(SparkR) #работает...
1367 просмотров
schedule 05.02.2023

Как связать два фрейма данных в SparkR
В R мы используем rbind() для привязки двух фреймов данных, например.) rbind(X, Y) Как мы можем сделать то же самое в SparkR в spark 1.4 ТИА, Арун
816 просмотров
schedule 26.11.2022

Не удалось запустить SparkR в RStudio
После долгого и сложного процесса установки SparkR я столкнулся с новыми проблемами запуска SparkR. Мои настройки R 3.2.0 RStudio 0.98.1103 Rtools 3.3 Spark 1.4.0 Java Version 8 SparkR 1.4.0 Windows 7 SP 1 64 Bit Теперь я...
6273 просмотров
schedule 15.09.2023

sparkr на ec2: убедитесь, что рабочие зарегистрированы и имеют достаточно памяти
Я настроил кластер spark (spark-1.4.0) на ec2, используя скрипт spark-ec2, поставляемый с релизом. Он отлично запускается с ведущим и одним подчиненным, и я могу проверить статус на http://:8080. Теперь я хотел бы запустить sparkR в своем...
106 просмотров
schedule 22.10.2022

Как связать два столбца данных в sparkR?
Как связать два столбца фрейма данных в SparkR spark 1.4 ТИА, Арун
1541 просмотров
schedule 04.10.2023

Получить определенную строку с помощью SparkR
У меня есть набор данных "данные" в SparkR типа DataFrame. Например, я хочу получить номер записи 50. В R я просто набираю data[50,] , но когда я делаю это в sparkR, я получаю это сообщение "Ошибка: объект типа "S4" не является...
3315 просмотров
schedule 07.10.2022

Сохраните кадр данных sparkR с помощью HiveContext с помощью команды saveAsTable
Как сохранить фрейм данных sparkR при работе с HiveContext с помощью команды saveAsTable df_5 <- loadDF(sqlContext, "Report02_cashier_Hourly_total_Trans_july30.parquet", "parquet") /*I loaded the parquet file as dataframe*/ sqlContext <-...
711 просмотров

Удаление даты записи в sparkR
У меня есть DataFrame x. Он содержит идентификатор и дату. Так head(x) дает ID = 1 2... и Date = "2012-05-05" "2015-01-01"... Я хочу создать новый набор данных, в котором будут удалены все идентификаторы с датой выше «2013-01-01» + P. P...
105 просмотров
schedule 19.05.2023

Время работы функции подсчета в sparkR
У меня есть DataFrame X в sparkR. X содержит столбец с идентификатором = 1 2 3 1 2 3 9 ... и счет для каждой записи: счет = 1241 233 20100 .... Таким образом, найти все баллы для ID s=filter(X, X$ID==1) и тогда мы получаем все оценки для...
235 просмотров
schedule 05.07.2023

Преобразование строки в дату в sparkR
У меня есть этот data.frame в sparkR df <- data.frame(user_id=c(1,1,2,2), time=c("2015-7-10","2015-8-04","2015-8-8","2015-7-10")) Я делаю это в DataFrame dft <- createDataFrame(sqlContext, df) Я хочу преобразовать...
1570 просмотров
schedule 13.01.2023

Использование функции суммы для получения значения в sparkR
У меня есть "данные" DataFrame в sparkR, которые содержат ID = 1,2,.. и количество = 232, 303, 444, 10,... Я хочу проверить, превышает ли сумма суммы 5000. sum(data$amount ) > 5000 Теперь sparkR должен возвращать TRUE, если это TRUE и...
598 просмотров
schedule 07.01.2023

собрать искру в фреймворк данных
Я загружаю некоторые данные в sparkR (версия Spark 1.4.0, работающая на Fedora21), над которыми я запускаю некоторый алгоритм, который выдает три разных числа. Мой алгоритм принимает кучу параметров, и я хочу использовать разные настройки параметров...
1929 просмотров
schedule 07.04.2023

ПРЕДУПРЕЖДЕНИЕ о формате AVRO для NULL в SparkR
Я использую SparkR в RStudio. Я пытаюсь использовать hiveContext для извлечения данных из Hive/HDFS . Данные имеют формат AVRO , и возникает конфликт с неправильным объявлением NULL в базе данных. Я получаю такое предупреждение при попытке...
255 просмотров

Чтобы отсортировать определенный столбец в DataFrame в SparkR
В SparkR у меня есть DataFrame data . Он содержит time , game и id . head(data) затем дает ID = 1 4 1 1 215 985 ..., game = 1 5 1 10 и время 2012-2-1, 2013-9-9, ... Теперь game содержит тип игры, который представляет собой числа от...
1145 просмотров
schedule 05.11.2022

Доставка пакетов R на узлы в SparkR
Привет, мне интересно, есть ли решение для отправки пакетов R с spark-submit и использования их на вычислительных узлах в SparkR?
419 просмотров
schedule 10.05.2023

Отбросьте столбец DataFrame в SparkR
Мне интересно, есть ли краткий метод для удаления столбца DataFrame в SparkR , например df.drop("column_name") в pyspark . Это самое близкое, что я могу получить: df <- new("DataFrame", sdf=SparkR:::callJMethod(df@sdf, "drop",...
2631 просмотров
schedule 29.04.2023

SparkR, рабочий процесс не может загрузить библиотеку
Недавно я начал использовать SparkR. У меня работает 1 мастер и 3 рабочих и AWS. Я использую RSudio Server. Мои коды включают пакет stringr, и эти пакеты были установлены /usr/share/R/library на всех узлах. Но когда я запускаю...
1426 просмотров
schedule 28.05.2023

Узкое место SparkR в createDataFrame?
Я новичок в Spark, SparkR и вообще во всех технологиях, связанных с HDFS. Недавно я установил Spark 1.5.0 и запустил простой код с помощью SparkR: Sys.setenv(SPARK_HOME="/private/tmp/spark-1.5.0-bin-hadoop2.6")...
1571 просмотров
schedule 15.05.2022

Попытка найти эквивалент R для SetConf из Java
В Java вы можете сделать что-то вроде: sc.setConf('spark.sql.parquet.binaryAsString','true') Какой будет эквивалент в R? Я просмотрел методы, доступные для объекта sc , и не могу найти очевидного способа сделать это. Спасибо
206 просмотров
schedule 26.10.2022