Этот вопрос может выглядеть как дубликат, но я столкнулся с некоторой проблемой при извлечении названий стран из строки. Я прошел по этой ссылке [ссылка] Извлечение названия страны из сведений об авторах, но Я не смог решить свою проблему. Я пробовал grepl и цикл for для сопоставления и замены текста, мой столбец данных состоит из более чем 300 тыс. строк, поэтому использование цикла grepl и for для сопоставления с образцом происходит очень-очень медленно.
У меня есть такая колонка.
org_loc
Zug
Zug Canton of Zug
Zimbabwe
Zigong
Zhuhai
Zaragoza
York United Kingdom
Delhi
Yalleroi Queensland
Waterloo Ontario
Waterloo ON
Washington D.C.
Washington D.C. Metro
New York
df$org_loc <- c("zug", "zug canton of zug", "zimbabwe",
"zigong", "zhuhai", "zaragoza","York United Kingdom", "Delhi","Yalleroi Queensland","Waterloo Ontario","Waterloo ON","Washington D.C.","Washington D.C. Metro","New York")
строка может содержать название штата, города или страны. Я просто хочу Country в качестве вывода. Нравится
org_loc
Switzerland
Switzerland
Zimbabwe
China
China
Spain
United Kingdom
India
Australia
Canada
Canada
United State
United state
United state
Я пытаюсь преобразовать состояние (если совпадение найдено) в его страну, используя библиотеку кодов стран, но не могу этого сделать. Любая помощь будет ценной.