Я импортировал CSV-файл в r. Некоторые из моих столбцов содержат данные о валюте (например, начинаются с символа «$»). Чтобы удалить символ «$» и преобразовать его в числовой тип, я использовал функцию gsub (), и она отлично работает. Пример кода:
strip_dollars = function(x) { as.numeric(gsub("[\\$, ]", "", x)) }
lapply(data[ , c("x4", "x5", "x7", "x8")] , strip_dollars)
Но в одном конкретном столбце валюты у меня есть несколько записей в скобках, таких как (2345 долларов США), 3500 долларов США, 5600 долларов США, (3 234 доллара США), ..... Следовательно, для этого столбец приведенный выше код не работает. Пожалуйста, помогите мне удалить скобки и знак доллара из этих записей.
Кроме того, для определения столбцов, содержащих данные о валюте, я много пробовал, включая решения, приведенные в R - определить, какие столбцы содержат данные о валюте $, но это не работает. Пожалуйста, предложите оптимальный способ сделать это.