У меня есть кадр данных с 75 столбцами, из которых 12 столбцов имеют все NA, а некоторые - 70% NA. Я хочу удалить столбцы, имеющие> = 70% NA.
Может ли кто-нибудь помочь мне в этом? Я попытался
df[,! apply( df , 2 , function(x) all(is.na(x)) )
но я получаю исключение как:
Ошибка: невозможно получить spark_connection из объекта класса NULL.
Я также пробовал:
df[colSums(!is.na(df)) != nrow(df)]
и
df[, colSums(is.na(df)) < nrow(df)]
Но я получаю исключение, поскольку
Ошибка в colSums(!is.na(df)) : 'x' должен быть массивом не менее двух измерений